Módulo Estadistica Descriptiva
Módulo Estadistica Descriptiva
Módulo Estadistica Descriptiva
“UNIANDES”
MÓDULO DE:
ESTADISTICA DESCRIPTIVA
a) DATOS GENERALES
El presente módulo tiene la tarea de orientar a los estudiantes hacia un aprendizaje eficaz, a
través de la explicación de los distintos temas, ayudándolos a identificar el material de estudio,
mostrando distintas técnicas y recursos de aprendizaje; y finalmente permitiendo una
autoevaluación del estudiante.
El entorno virtual de aprendizaje EVA, sigue siendo otro medio de interacción docente –
alumnos dentro de la Universidad, así también, la plataforma Office 365 que se ha adaptado
a los requerimientos de la universidad para que se convierta en nuevo instrumento que facilite
el proceso de enseñanza-aprendizaje gracias a sus múltiples opciones de interacción.
La asignatura se vincula con el modelo pedagógico a través de los objetivos que constan en la
programación analítica, los resultados de aprendizaje, la metodología y experiencias de aprendizaje que
le permiten al estudiante determinar que las organizaciones logran sus objetivos mediante la
combinación efectiva y eficiente de sus recursos, para poner en práctica sus estrategias. Uno de estos
recursos y el más meritorio lo constituye el capital humano, ya que posee habilidades y características
que le dan vida, movimiento y acción a toda organización. Además, contribuirá a un mejor manejo de
los procesos organizacionales.
RESULTADO DE
APRENDIZAJE RESULTADO DE APRENDIZAJE DE LA
PERFIL DE ASIGNATURA
EGRESO
Argumentar la aplicación de la estadística en el campo de
los negocios y mercado
ELABORAR,
EVALUAR, Y Describir el comportamiento estadístico de datos
ADMINISTRAR económicos y de mercado
PROYECTOS
EMPRESARIALES Analizar el comportamiento estadístico a partir de una serie
EN DIFERENTES de datos obtenidos de investigaciones en el campo de los
TIPOS DE negocios
ORGANIZACIONES
UNIDAD 1
TEMA: I N T R O D U C C I O N A L A E S T A D I S T I C A D E S C R I P T I V A
Contenido de la Unidad:
Introducción
La estadística es el arte y la ciencia de recabar, analizar, presentar e interpretar los datos. La estadística
es una herramienta fundamental para el análisis de datos en los negocios y la economía. La estadística
permite describir, resumir, interpretar y presentar la información obtenida de una muestra o población
de interés. La estadística también permite realizar inferencias, estimaciones, pruebas de hipótesis y
predicciones sobre los fenómenos que se estudian. La estadística se aplica en diversas áreas de los
negocios y la economía, como la contabilidad, el marketing, la administración, la investigación de
mercados, la planificación estratégica, el control de calidad, la evaluación de proyectos, la toma de
decisiones, el análisis financiero, el análisis de riesgos, entre otras. La estadística ayuda a los
profesionales a tomar decisiones basadas en evidencia, a optimizar recursos, a mejorar procesos, a
identificar oportunidades y amenazas, a medir el desempeño y a evaluar el impacto de las acciones
implementadas.
Los datos son hechos, información y cifras que se recopilan, analizan y resumen para su presentación e
interpretación. Los datos se pueden clasificar en dos tipos: cuantitativos y cualitativos. Los datos
cuantitativos se refieren a los números y se pueden medir, mientras que los datos cualitativos se refieren
a las características y no se pueden medir.
Los elementos son entidades a partir de las cuales se recopilan los datos. El elemento siempre es uno.
A quien se le pide la información.
Las variables son características de los elementos que se estudian. Los valores encontrados para cada
variable en cada uno de los elementos constituyen los datos.
Las observaciones son el conjunto de mediciones obtenidas para un determinado elemento. Existen dos
tipos de datos: cuantitativos y cualitativos.
Ejemplo:
La tabla 1.1 muestra un banco de datos que contiene información de 25 fondos de inversión que forman
parte de Morningstar Funds500 para 2008. Morningstar es una empresa que le sigue la pista a más de 7
000 fondos de inversión y prepara análisis detallados de 2 000 de ellos.
Elemento: cada fondo de inversión es un elemento: sus nombres aparecen en la primera columna. Puesto
que hay 25 fondos de inversión, el banco de datos contiene 25 elementos
Variable: tabla 1.1 incluye las cinco variables siguientes.
• Fund Type (Tipo de fondo). Tipo de fondo de inversión, etiquetado de (capital nacional), IE
(capital internacional) y FI (renta fija)
• Net Asset Value (Valor de los activos netos en $). Precio de cierre por acción al 31 de diciembre
de 2007
• 5-Year Average Return (Rendimiento promedio de 5 años en %). El rendimiento anual
promedio del fondo durante los 5 años anteriores
• Expense Ratio (Razón de gastos). El porcentaje de activos deducidos en cada año fiscal de los
gastos del fondo
• Morningstar Rank (Calificación Morningstar). La calificación general con estrellas ajustada al
riesgo de cada fondo; las calificaciones de Morningstar varían de una baja de 1 estrella (1-Star)
a una alta de 5 estrellas (5-Star)
Observación: Al analizar de nuevo la tabla 1.1 vemos que el conjunto de mediciones para la primera
observación (American Century Intl. Disc) es IE, 14.37, 30.53, 1.41 y 3-Star. El conjunto de mediciones
7
MÓDULO: Estadística Descriptiva
para la segunda observación (American Century Tax-Free Bond) es FI, 10.73, 3.34, 0.49 y 4-Star, etc.
Un banco de datos con 25 elementos contiene 25 observaciones
Fuentes de datos
Una fuente de datos es un lugar donde se recoge la información. Puede ser una base de datos, un
archivo plano, un documento XML o cualquier otro formato que un sistema pueda leer. La entrada
se captura como un conjunto de registros que contienen información utilizada en el flujo de
trabajo. Las fuentes de datos pueden ser internas o externas a una organización. Las fuentes
internas son aquellas que se generan dentro de la organización, como los sistemas de gestión de
recursos humanos, los sistemas de gestión de inventario y los sistemas de gestión de relaciones
con los clientes. Las fuentes externas son aquellas que se generan fuera de la organización, como
los datos de redes sociales, los datos de encuestas y los datos de proveedores externos.
8
MÓDULO: Estadística Descriptiva
Por su naturaleza
variables cuantitativas : se expresa en números puede ser discreta: edad en años cumplidos,
número de hermanos continua :peso, talla, velocidad.
9
MÓDULO: Estadística Descriptiva
Escalas de medición
Las escalas de medición son herramientas utilizadas para cuantificar y clasificar atributos o variables en
una investigación. En estadística, podemos identificar cuatro escalas de medición:
CUALITATIVAS
• Escala nominal: Este tipo no tiene relación alguna con la escala ordinal. Por el contrario, se
enfoca en clasificar los elementos observados. Por ejemplo, si retomamos al ejemplo de escala
de medición anterior, la escala nominal podría definir el género de la mayoría de las personas
que votaron en cuanto a la relevancia y la calidad de una revista científica u otra. A este respecto,
si el sondeo recopila un número de 100 personas, la escala nominal definirá cuántos fueron
mujeres y cuántos hombres. Identifica categoría, por ejemplo sexo, religión, afiliación política,
lugar de nacimiento
• Escala ordinal: Este tipo establece un ordenamiento de los elementos de acuerdo con su
jerarquía y/o calidad. Por ejemplo, si intentamos medir la calidad del contenido de 10 diferentes
revistas científicas que debaten sobre un mismo tema, podríamos ordenarlas del 1 al 10, siendo
el 1 el libro con peor calidad y nula relevancia y el 10 el de excelente calidad y relevancia.
Ejemplo grado de instrucción, nivel de autoestima
CUANTITATIVAS
• Escala de intervalo: Este tipo de escala se utiliza para medir variables continuas. La escala de
intervalo tiene un punto de origen arbitrario y se utiliza para medir la distancia entre dos puntos.
Un ejemplo de una escala de intervalo es la temperatura en grados Celsius.
• Escala de razón: Este tipo de escala es similar a la escala de intervalo, pero tiene un punto de
origen absoluto. Un ejemplo de una escala de razón es la altura de una persona en centímetros.
Ejemplo peso, talla
Los datos de corte transversal son aquellos que se recopilan en un momento específico en el tiempo y
se refieren a diferentes individuos, empresas, países o regiones. Por ejemplo, si se recopilan datos sobre
el ingreso y la educación de los habitantes de un país en un momento específico, estos datos se
consideran datos de corte transversal.
Por otro lado, los datos de series de tiempo se recopilan a lo largo del tiempo y se refieren a un solo
individuo, empresa, país o región. Por ejemplo, si se recopilan datos sobre el ingreso y la educación de
una persona a lo largo de varios años, estos datos se consideran datos de series de tiempo.
La estadística es una rama de las matemáticas que se ocupa de la recopilación, análisis e interpretación
de datos. La estadística se divide en dos ramas principales: la estadística descriptiva y la estadística
inferencial.
La estadística descriptiva se utiliza para resumir y describir los datos. La estadística inferencial se
utiliza para hacer inferencias sobre una población a partir de una muestra de datos. La inferencia
estadística se basa en la probabilidad y se utiliza para tomar decisiones y hacer predicciones.
La estadística descriptiva se enfoca en describir y resumir los datos que ya tenemos. Se utiliza para
resumir y describir los datos de una muestra. Las estadísticas descriptivas son útiles porque le permiten
comprender un grupo de datos de manera mucho más rápida y sencilla en comparación con solo mirar
filas y filas de valores de datos sin procesar. Por ejemplo, suponga que tenemos un conjunto de datos
sin procesar que muestra los puntajes de las pruebas de 1,000 estudiantes en una escuela en particular.
Podríamos estar interesados en la puntuación media de las pruebas junto con la distribución de las
puntuaciones de las pruebas. Usando estadísticas descriptivas, podríamos encontrar la puntuación media
y crear un gráfico que nos ayude a visualizar la distribución de puntuaciones. Esto nos permite
comprender los puntajes de las pruebas de los estudiantes mucho más fácilmente en comparación con
solo mirar los datos sin procesar.
La estadística inferencial se enfoca en hacer inferencias y generalizaciones sobre una población a partir
de una muestra de datos. La inferencia estadística se basa en la probabilidad y se utiliza para tomar
decisiones y hacer predicciones. Por ejemplo, suponga que queremos saber si los estudiantes de una
escuela en particular tienen un rendimiento académico mejor que los estudiantes de otra escuela.
Podríamos tomar una muestra de estudiantes de ambas escuelas y comparar sus puntajes de prueba.
Usando la inferencia estadística, podríamos hacer una inferencia sobre la población completa de
estudiantes en ambas escuelas y determinar si hay una diferencia significativa en el rendimiento
académico entre las dos escuelas.
11
MÓDULO: Estadística Descriptiva
Videos:
Tarea 1
ACTIVIDADES 1:
12
MÓDULO: Estadística Descriptiva
2.
13
MÓDULO: Estadística Descriptiva
3.
4.
5.
14
MÓDULO: Estadística Descriptiva
6.
Tarea 2
Autoevaluación
15
MÓDULO: Estadística Descriptiva
Con el propósito de autoevaluar los conocimientos adquiridos a través del estudio de los
contenidos de esta primera unidad, desarrolle el siguiente ejercicio, complementando con los
temas del texto básico de la misma unidad.
N° Verdadero o Pregunta
Falso
Los datos son hechos, información y cifras que se recopilan, analizan y
1 ( ) resumen para su presentación e interpretación.
Los elementos son entidades a partir de las cuales se recopilan los datos.
2 ( )
Las variables son características de los elementos que se estudian.
3 ( )
Las observaciones son el conjunto de mediciones obtenidas para un
4 ( ) determinado elemento.
Los datos se pueden clasificar en dos tipos: cuantitativos y cualitativos.
5 ( )
La estadística es el arte y la ciencia de reunir datos, analizarlos,
6 ( ) presentarlos e interpretarlos.
Las dos ramas principales de la estadística son la estadística descriptiva
7 ( ) y la estadística inferencial.
La estadística descriptiva se utiliza para hacer inferencias sobre una
8 ( ) población a partir de una muestra de datos.
La estadística inferencial se utiliza para resumir y describir los datos.
9 ( )
Una escala nominal es una escala de medición para una variable en la que
10 ( ) el dato es una etiqueta o un nombre que identifica un atributo de un
elemento.
11 ( ) Una escala ordinal es una escala de medición para una variable en la que
los datos muestran las propiedades de los datos nominales y además
tiene sentido el orden o jerarquía de los datos.
12 ( ) Una escala de intervalo es una escala de medición para una variable en la
que los datos tienen las características de los datos ordinales y el intervalo
entre valores se expresa en términos de una unidad de medición fija.
13 ( ) Una escala de razón es una escala de medición para una variable en la que
los datos tienen un punto de origen absoluto.
14 ( ) Los datos de corte transversal se recopilan a lo largo del tiempo y se
refieren a un solo individuo, empresa, país o región.
15 ( ) Los datos de series de tiempo se recopilan en un momento específico en
el tiempo y se refieren a diferentes individuos, empresas, países o
regiones.
16
MÓDULO: Estadística Descriptiva
17
MÓDULO: Estadística Descriptiva
UNIDAD 2
TEMA: A G R U P A C I O N Y R E P R E S E N T A C I O N D E D A T O S : T A B L A S
Y GRAFICOS
18
MÓDULO: Estadística Descriptiva
INTRODUCCIÓN:
19
MÓDULO: Estadística Descriptiva
• Gráficas de barras y circulares: Son dispositivos gráficos que se usan para representar los
datos cualitativos resumidos en una distribución de frecuencia, de frecuencia relativa o de
frecuencia porcentual. En una gráfica de barras se dibujan barras verticales u horizontales cuya
altura o longitud es proporcional a la frecuencia de cada clase. En una gráfica circular se dibuja
un círculo dividido en sectores cuyo ángulo es proporcional a la frecuencia de cada clase.
20
MÓDULO: Estadística Descriptiva
Por ejemplo, considere los datos cuantitativos de la tabla 2.4. Éstos presentan el tiempo en días necesario
para completar las auditorías de final de año para una muestra de 20 clientes de Sanderson and Clifford,
una pequeña firma de contadores públicos. Los tres pasos necesarios para definir las clases de una
distribución de frecuencia con los datos cuantitativos son los siguientes:
a) Determine el número de clases que no se superponen.
b) Defina el ancho de cada clase.
c) Determine los límites de clase.
21
MÓDULO: Estadística Descriptiva
Número de clases: Las clases se forman mediante la especificación de los rangos que se usarán para
agrupar los datos. Como regla general, se recomienda utilizar entre 5 y 20 clases. En el caso de un
número pequeño de elementos de datos se pueden utilizar cinco o seis clases para resumir los datos. Si
se tienen muchos elementos, se requiere un número grande de clases
Ancho de clase: es recomendable que sea el mismo para todas. Por tanto, el número y el ancho de clase
no son decisiones independientes. Un número grande de clases significa un ancho de clase menor, y
viceversa. Para determinar un ancho de clase aproximado, primero se identifican los valores de datos
mayores y menores
(33-12/5)=4.20
Límites de clase: Deben elegirse de modo que cada elemento de datos pertenezca a una y sólo una de
las clases. El límite de clase inferior identifica el valor de datos menor asignado a la clase. El límite de
clase superior identifica el valor de datos mayor asignado a la clase
Diagrama de puntos: Una presentación gráfica simple de los datos que muestra el número de puntos
sobre cada valor de datos en el eje horizontal. La figura 2.3 es el diagrama de puntos de los datos de
duración de la auditoría de la tabla 2.4. Los tres puntos ubicados por encima de 18 sobre el eje horizontal
indican que una duración de la auditoría de 18 días ocurrió tres veces. Los diagramas de puntos muestran
los detalles de los datos y son útiles para comparar la distribución de los datos de dos o más variables
22
MÓDULO: Estadística Descriptiva
Histograma: Una presentación gráfica de los datos cuantitativos que utiliza rectángulos para representar
la frecuencia, la frecuencia relativa o la frecuencia porcentual de cada clase. Se muestra cómo ajustar el
ancho y los límites de clase para obtener un histograma adecuado.
Distribuciones acumuladas: Resúmenes tabulares de los datos que muestran el número, la proporción
o el porcentaje de elementos de datos que son menores o iguales que el límite de clase superior de cada
clase. Se presentan las distribuciones de frecuencia acumulada, de frecuencia relativa acumulada y de
frecuencia porcentual acumulada.
Ojiva: Una presentación gráfica de una distribución acumulada que utiliza líneas rectas para conectar
los puntos que representan el límite de clase superior y la frecuencia acumulada correspondiente. La
ojiva se trazó marcando el punto correspondiente a la frecuencia acumulada de cada clase. Dado que las
clases para los datos de duración de la auditoría son 10 –14, 15 –19, 20 –24, etc., aparecen vacíos de
23
MÓDULO: Estadística Descriptiva
una unidad entre 14 y 15, 19 y 20, etc. Éstos se eliminan al trazar pun tos a medio camino entre los
límites de clase. Por tanto, 14.5 se usa para la clase 10 –14
Tabulación cruzada: Es un método tabular que muestra la frecuencia de cada combinación de dos
variables cualitativas o categóricas. Se puede usar para explorar si hay una asociación entre las variables
o para comparar grupos. Un ejemplo es la tabla 2.10 que muestra la relación entre la calificación de
calidad y el precio de los alimentos de los restaurantes.
24
MÓDULO: Estadística Descriptiva
Diagrama de dispersión: Es un método gráfico que muestra la relación entre dos variables cuantitativas
o numéricas. Se puede usar para visualizar si hay una tendencia o un patrón en los datos o para identificar
valores atípicos. Un ejemplo es la figura 2.7 que muestra la relación entre el número de comerciales y
las ventas de una tienda de estéreos y equipos de sonido.
Como ejemplo, considere la relación publicidad/ventas para una tienda de estéreos y equipos de sonido
en San Francisco. Durante los tres meses pasados, en 10 ocasiones la tienda usó los comerciales de
televisión de fin de semana para promover las ventas en sus establecimientos. Los gerentes quieren
investigar si existe una relación entre el número de comerciales transmitidos y las ventas en la tienda
durante la semana siguiente. Los datos muestrales de las 10 semanas con las ventas en cientos de dólares
se registran en la tabla 2.12
La figura 2.7 ilustra el diagrama de dispersión y la línea de tendencia1 para los datos de la tabla 2.12. El
número de comerciales (x) se observa en el eje horizontal y las ventas (y) en el eje vertical. Para la
semana 1, x " 2 y y " 50. Un punto con esas coordenadas se traza en el diagrama de dispersión. Puntos
similares se trazan en las otras nueve semanas. Observe que en dos semanas se transmitió un comercial,
durante dos de las semanas se mostraron dos comerciales, etcétera. El diagrama de dispersión completo
25
MÓDULO: Estadística Descriptiva
de la figura 2.7 indica una relación positiva entre el número de comerciales y las ventas. Las ventas más
altas se asocian con un número mayor de anuncios publicitarios. La relación no es perfecta, ya que no
todos los puntos están en una línea recta; sin embargo, el patrón general de los puntos y la línea de
tendencia sugieren que en general la relación es positiva.
Línea de tendencia: Es una línea que se ajusta a los puntos de un diagrama de dispersión para aproximar
la relación entre las variables. Se puede usar para describir la dirección y la fuerza de la relación o para
hacer predicciones basadas en los datos. Un ejemplo es la línea recta que se agrega al diagrama de
dispersión de la figura 2.8.
26
MÓDULO: Estadística Descriptiva
27
MÓDULO: Estadística Descriptiva
Para un mayor conocimiento de los temas tratados en esta primera Unidad, le recomendamos
visitar los siguientes recursos educativos abiertos:
Videos:
Tarea 1
28
MÓDULO: Estadística Descriptiva
ACTIVIDADES 1:
2. Ejercicio
3. Ejercicio
29
MÓDULO: Estadística Descriptiva
4. Ejercicio
5. Ejercicio
30
MÓDULO: Estadística Descriptiva
7.
9.
31
MÓDULO: Estadística Descriptiva
10.
32
MÓDULO: Estadística Descriptiva
Tarea 2
ACTIVIDADES 2:
2.
33
MÓDULO: Estadística Descriptiva
a. Realice una tabla de distribución porcentual con respecto al gran total y realice
las interpretaciones
b. Realice una tabla de distribución porcentual con respecto al total de la columna
y realice las interpretaciones
c. Realice una tabla de distribución porcentual con respecto al total de la fila y
realice la interpretación
d. ¿Qué porcentaje de familias dirigidas por una persona con educación media gana $75 000 o más? ¿Qué
porcentaje de familias encabezadas por una persona con educación superior gana $75 000 o más?
e. Realice un grafico de barras apiladas de la distribución porcentual con respecto
al gran total y con respecto al total de la columna, también realice un grafico de
barras agrupadas con respecto al total de la fila
3.
4.
34
MÓDULO: Estadística Descriptiva
35
MÓDULO: Estadística Descriptiva
36
MÓDULO: Estadística Descriptiva
Tarea 3
Autoevaluación
Con el propósito de autoevaluar los conocimientos adquiridos a través del estudio de los
contenidos de esta primera unidad, desarrolle el siguiente ejercicio, complementando con los
temas del texto básico de la misma unidad.
N° Verdadero o Pregunta
Falso
37
MÓDULO: Estadística Descriptiva
38
MÓDULO: Estadística Descriptiva
2
3
39
MÓDULO: Estadística Descriptiva
UNIDAD 3
TEMA: M E D I D A S D E T E N D E N C I A C E N T R A L Y D E D I S P E R S I O N
INTRODUCCIÓN:
40
MÓDULO: Estadística Descriptiva
Media:
La media es el promedio aritmético de un conjunto de datos y se calcula sumando todos los valores y
dividiéndolos por el número de observaciones. Representa el punto de equilibrio de los datos.
Ejemplo: la estatura media de una muestra de individuos se calcula sumando la estatura de todos los
individuos y dividiéndola por el número de individuos
Ejemplo 2
41
MÓDULO: Estadística Descriptiva
Mediana:
La mediana es el valor medio de un conjunto de datos cuando se organiza en orden ascendente o
descendente. Representa el valor que divide los datos en dos mitades iguales.
Ejemplo: el ingreso medio de una población es el nivel de ingresos en el que la mitad de la población
gana más y la otra mitad gana menos.
42
MÓDULO: Estadística Descriptiva
Moda:
El modo es el valor que aparece con más frecuencia en un conjunto de datos. Representa el valor más
común o típico.
Ejemplo: la moda de un conjunto de datos que representa el número de hermanos que tiene cada
estudiante es el valor que aparece con más frecuencia e indica el número de hermanos más común
Para ilustrar cómo identificar la moda, considere el tamaño de grupo de la muestra de cinco grupos de
estudiantes universitarios. El único valor que ocurre más de una vez es el 46. Debido a que se presenta
con una frecuencia de 2, que es la frecuencia más grande, se le considera la moda. Como otro ejemplo,
considere la muestra de sueldos iniciales de los licenciados en administración de empresas. El único
sueldo mensual inicial que ocurre más de una vez es $3 480. Dado que este valor tiene la frecuencia
mayor, es la moda. Hay situaciones en que la frecuencia mayor ocurre en dos o más valores diferentes;
cuando esto sucede, existe más de una moda. Si los datos contienen exactamente dos modas, se dice que
son bimodales. Si contienen más de dos, se dice que son multimodales. En estos casos, la moda casi
nunca se presenta debido a que listar tres o más no resulta particularmente útil para describir la posición
de los datos.
Percentiles:
Los percentiles dividen un conjunto de datos en 100 partes iguales, lo que representa la posición relativa
43
MÓDULO: Estadística Descriptiva
Ejemplo: el percentil 75 de un conjunto de datos que representa las puntuaciones de las pruebas indica
el valor por debajo del cual se sitúa el 75% de las puntuaciones.
44
MÓDULO: Estadística Descriptiva
Cuartiles:
Los cuartiles dividen un conjunto de datos en cuatro partes iguales, que representan la posición relativa
de un valor dentro del conjunto de datos.
Ejemplo: el primer cuartil (primer trimestre) de un conjunto de datos que representa las edades de un
grupo de personas indica el valor por debajo del cual se encuentra el 25% de las edades.
45
MÓDULO: Estadística Descriptiva
46
MÓDULO: Estadística Descriptiva
Rango:
El rango es la diferencia entre los valores máximo y mínimo de un conjunto de datos. Representa la
dispersión o variabilidad de los datos.
Ejemplo: el rango de un conjunto de datos que representa las temperaturas registradas en una ciudad
durante un mes es la diferencia entre las temperaturas más altas y más bajas registradas.
Ejemplo
Revise los datos sobre los sueldos iniciales para los licenciados en administración de empresas recién
egresados que hemos venido trabajando de la tabla 3.1. El sueldo inicial mayor es de 3 925 y el menor
es de 3 310. El rango es 3925-3310=615 . Aun el rango es la medida de variabilidad más fácil de
calcular, pocas veces se usa como la única medida debido a que se basa sólo en dos de las observaciones
y, por tanto, los valores extremos influyen mucho en él. Suponga que uno de los licenciados recién
egresados recibe un sueldo inicial de $10 000 al mes. En este caso, el rango sería 10000-3310= 6 690
en vez de 615. Este valor mayor para el rango no describe con claridad la variabilidad de los datos debido
a que 11 de los 12 sueldos iniciales se agrupan estrechamente entre 3 310 y 3 730.
Rango intercuartílico:
El rango intercuartil es la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) de un conjunto
de datos. Representa la dispersión del 50% intermedio de los datos.
Ejemplo: el rango intercuartil de un conjunto de datos que representa los precios de las casas en un
vecindario indica el rango dentro del cual cae el 50% medio de los precios.
Varianza:
La varianza mide la desviación cuadrática promedio de cada valor con respecto a la media. Representa
la dispersión o dispersión de los datos.
47
MÓDULO: Estadística Descriptiva
Ejemplo: la varianza de un conjunto de datos que representa las ponderaciones de una muestra de
productos mide en qué medida las ponderaciones se desvían del peso promedio.
(Estudiantes^2)
Las unidades cuadradas asociadas con la varianza dificultan obtener una comprensión e interpretación intuitiva del valor
numérico de ésta. Se recomienda considerarla como una medida útil en la comparación de la cantidad de variabilidad
para dos o más variables. En una comparación de las variables, aquella con la varianza más grande muestra la mayor
variabilidad. Una interpretación del valor de la varianza tal vez no sea necesaria.
48
MÓDULO: Estadística Descriptiva
Desviación estándar:
La desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de la desviación
promedio con respecto a la media. Representa la dispersión o dispersión de los datos.
La desviación estándar es mas fácil de interpretar que la varianza debido a que se mide en las mismas
unidades que los datos
Ejemplo: la desviación estándar de un conjunto de datos que representa las edades de un grupo de
personas indica en qué medida las edades se desvían de la edad promedio.
49
MÓDULO: Estadística Descriptiva
Coeficiente de variación:
El coeficiente de variación es la relación entre la desviación estándar y la media, expresada como
porcentaje. Representa la variabilidad relativa de los datos.
50
MÓDULO: Estadística Descriptiva
Ejemplo
51
MÓDULO: Estadística Descriptiva
Ejemplo: la covarianza entre la altura y el peso de los individuos de una muestra mide la forma en que
las dos variables varían entre sí. Una covarianza positiva sugiere que los individuos más altos tienden a
tener pesos más altos, mientras que una covarianza negativa sugiere que los individuos más altos tienden
a tener pesos más bajos.
52
MÓDULO: Estadística Descriptiva
53
MÓDULO: Estadística Descriptiva
54
MÓDULO: Estadística Descriptiva
55
MÓDULO: Estadística Descriptiva
El coeficiente de correlación mide la fuerza y la dirección de la relación lineal entre dos variables. Va
de -1 a 1, donde -1 indica una relación lineal negativa perfecta, 1 indica una relación lineal positiva
perfecta y 0 indica que no hay relación lineal. El coeficiente de correlación no tiene unidades y
proporciona una medida de asociación estandarizada.
Ejemplo: el coeficiente de correlación entre la edad y los ingresos de las personas de un conjunto de
datos mide la fuerza y la dirección de la relación lineal entre las dos variables. Un coeficiente de
correlación de 0,8 sugiere una fuerte relación lineal positiva, lo que indica que, a medida que aumenta
la edad, los ingresos también tienden a aumentar.
A continuación, se calcula el coeficiente de correlación muestral para la tienda de estéreos y equipos de
sonido. se pueden estimar las desviaciones estándar muestrales para las dos variables
56
MÓDULO: Estadística Descriptiva
57
MÓDULO: Estadística Descriptiva
58
MÓDULO: Estadística Descriptiva
Formulas resumen
59
MÓDULO: Estadística Descriptiva
60
MÓDULO: Estadística Descriptiva
61
MÓDULO: Estadística Descriptiva
Videos:
ACTIVIDADES 1:
Asuma una muestra con los datos 10, 20, 21, 17, 16 y 12. Calcule la media y la mediana.
2. Ejercicio
62
MÓDULO: Estadística Descriptiva
Considere una muestra con los datos 27, 25, 20, 15, 30, 34, 28 y 25. Calcule los percentiles 20, 25, 65 y 75.
3. Ejercicio
Considere una muestra con los datos 53, 55, 70, 58, 64, 57, 53, 69, 57, 68 y 53. Calcule la media, la mediana y
la moda
4. Ejercicio
5. Ejercicio
63
MÓDULO: Estadística Descriptiva
6. Ejercicio
64
MÓDULO: Estadística Descriptiva
Asuma una muestra con los datos 10, 20, 12, 17 y 16. Determine la varianza y la desviación
estándar
9. 2.Considere una muestra con los datos 10, 20, 12, 17 y 16. Calcule el rango y el rango
intercuartílico
10. Considere una muestra con los datos 27, 25, 20, 15, 30, 34, 28 y 25. Calcule el rango,
el rango intercuartílico, la varianza y la desviación estándar
11. Las puntuaciones que obtuvo un jugador de boliche en seis partidos fueron 182, 168,
184, 190, 170 y 174. Usando estos datos como una muestra, calcule los estadísticos
descriptivos siguientes: a) Rango b) varianza c) Desviación estándar b) Varianza d)
Coeficiente de variación
12. Las tarifas de renta de automóviles por día para una muestra de siete ciudades del este
de Esta dos Unidos son las siguientes (The Wall Street Journal, 16 de enero de 2004).
13. Ejercicio
65
MÓDULO: Estadística Descriptiva
15. Ejercicio
16. Ejercicio
Tarea 2
Autoevaluación
Con el propósito de autoevaluar los conocimientos adquiridos a través del estudio de los
contenidos de esta primera unidad, desarrolle el siguiente ejercicio, complementando con los
temas del texto básico de la misma unidad.
N° Verdadero o Pregunta
Falso
las medidas de posición proporcionan información sobre la tendencia central de un
1 ( ) conjunto de datos.
la mediana es el valor que aparece con más frecuencia en un conjunto de datos.
2 ( )
el rango es una medida de dispersión que indica la dispersión de los valores en un
3 ( ) conjunto de datos.
los cuartiles dividen un conjunto de datos en cuatro partes iguales, cada una de las
4 ( ) cuales contiene el 25% de los datos.
el modo es el valor que aparece con más frecuencia en un conjunto de datos.
5 ( )
La media es el valor medio de un conjunto de datos.
6 ( )
El rango intercuartílico es la diferencia entre el primer y el tercer cuartiles.
7 ( )
La mediana es la suma de todos los valores de un conjunto de datos.
8 ( )
El modo siempre es único en un conjunto de datos.
9 ( )
El rango es una medida de tendencia central que representa el valor promedio de un
10 ( ) conjunto de datos.
11 ( ) La varianza es una medida de variabilidad que cuantifica la dispersión de los valores
en un conjunto de datos.
12 ( ) El rango es una medida de variabilidad que representa la diferencia entre los valores
máximo y mínimo de un conjunto de datos.
13 ( ) La desviación estándar es una medida de variabilidad que representa la desviación
promedio de los valores con respecto a la media.
14 ( ) El rango intercuartílico es una medida de variabilidad que representa el rango del 50%
medio de los datos.
15 ( ) El coeficiente de variación es una medida de variabilidad que representa la variabilidad
relativa de un conjunto de datos en comparación con su media.
16 ( ) La varianza es una medida de variabilidad que representa la diferencia entre los valores
máximo y mínimo de un conjunto de datos.
17 ( ) El rango es una medida de variabilidad que cuantifica la desviación promedio de los
valores con respecto a la media.
18 ( ) La desviación estándar es una medida de variabilidad que representa el rango del 50%
medio de los datos.
19 ( ) El rango intercuartílico es una medida de variabilidad que calcula la desviación
cuadrática promedio de cada valor con respecto a la media.
20 ( ) El coeficiente de variación es una medida de variabilidad que representa la variabilidad
absoluta de un conjunto de datos.
67
MÓDULO: Estadística Descriptiva
UNIDAD 4
TEMA: I N T R O D U C C I O N A L A T E O R I A D E P R O B A B I L I D A D E S
INTRODUCCIÓN:
La probabilidad es una rama de las matemáticas que se ocupa del estudio de la incertidumbre y la
probabilidad de que ocurran eventos. Proporciona un marco para cuantificar y analizar las
probabilidades de que se produzcan diferentes resultados en diversas situaciones.
Ejemplo
Los valores de probabilidad siempre se asignan en una escala de 0 a 1. Una probabilidad cercana a 0
indica que es poco probable que un evento ocurra, una probabilidad cercana a 1 indica que es casi seguro
que un evento se produzca. Otras probabilidades entre 0 y 1 representan grados de posibilidad de que
un evento ocurra. Por ejemplo, si se considera el evento “lluvia para mañana”, se entiende que cuando
el informe del clima indica “una probabilidad de lluvia casi nula”, significa que la posibilidad de lluvia
es muy baja. Sin embargo, si se informa una probabilidad de 0.90 de que llueva, es probable que llueva.
Una medida de 0.50 indica que la probabilidad de que llueva es igual a la de que no llueva
Experimentos: los experimentos implican la manipulación deliberada de variables para observar sus
efectos. Se llevan a cabo para probar hipótesis y hacer inferencias sobre la población. Los experimentos
pueden tener diferentes diseños, como los experimentos factoriales, los experimentos con un solo factor
o los experimentos binomiales
Reglas de conteo: las reglas de conteo se utilizan para determinar el número de resultados posibles de
un experimento. Las reglas incluyen la regla de multiplicación, la regla de suma y las reglas de
permutación y combinación. Estas reglas ayudan a calcular las probabilidades y a hacer predicciones.
69
MÓDULO: Estadística Descriptiva
70
MÓDULO: Estadística Descriptiva
71
MÓDULO: Estadística Descriptiva
72
MÓDULO: Estadística Descriptiva
Ejemplo: En un experimento binomial en el que se lanza una moneda justa tres veces, hay 2^3 = 8
resultados posibles. La probabilidad de obtener exactamente dos caras se puede calcular usando las
reglas de conteo y asignando probabilidades según el método de igual probabilidad. La probabilidad de
este resultado es de 3/8, ya que hay tres maneras de obtener dos caras (HHH, HHT, HTH) de los ocho
resultados posibles
74
MÓDULO: Estadística Descriptiva
75
MÓDULO: Estadística Descriptiva
76
MÓDULO: Estadística Descriptiva
77
MÓDULO: Estadística Descriptiva
78
MÓDULO: Estadística Descriptiva
79
MÓDULO: Estadística Descriptiva
Videos:
Introducción a la probabilidad https://www.youtube.com/watch?v=EVMFgdYSz-
s&list=PLEwR-RTQiRPXx5VBKVAH2cmbWCaKK88Ey&index=1
ACTIVIDADES 1:
Tarea 2
Autoevaluación
Con el propósito de autoevaluar los conocimientos adquiridos a través del estudio de los
80
MÓDULO: Estadística Descriptiva
contenidos de esta primera unidad, desarrolle el siguiente ejercicio, complementando con los
temas del texto básico de la misma unidad.
N° Verdadero o Pregunta
Falso
La probabilidad es una rama de las matemáticas que se ocupa de la probabilidad de
1 ( ) que ocurran eventos
el espacio muestral es el conjunto de todos los resultados posibles de un experimento
2 ( ) aleatorio
un evento es un subconjunto del espacio muestral que consta de uno o más resultados
3 ( )
la probabilidad de un evento es un número entre 0 y 1, ambos inclusive
4 ( )
el complemento de un evento A es el conjunto de todos los resultados del espacio
5 ( ) muestral que no están en A
La probabilidad es una rama de las matemáticas que se ocupa de la certeza de los
6 ( ) eventos que ocurren
el espacio muestral es el conjunto de todos los resultados imposibles de un experimento
7 ( ) aleatorio
un evento es un subconjunto del espacio muestral que consta de todos los resultados
8 ( ) posibles
la probabilidad de un evento puede ser cualquier número positivo
9 ( )
el complemento de un evento A es el conjunto de todos los resultados del espacio
10 ( ) muestral que están en A
4. BIBLIOGRAFÍA GENERAL
BOUZAS Ortiz, José Alfonso - Reyes Gaytán, Germán. “Gestión del talento humano”. 2019.
Primera Edición. IURE Editores.
81
MÓDULO: Estadística Descriptiva
BOUZAS Ortiz, José Alfonso - Reyes Gaytán, Germán. “Gestión del talento humano”. 2019.
Primera Edición. IURE Editores.
Elaborado por:
82
MÓDULO: Estadística Descriptiva
Fecha:
83