Estadistica 3 Parciales
Estadistica 3 Parciales
Estadistica 3 Parciales
Estadística Descriptiva
ESTADÍSTICA DESCRIPTIVA
Estadística Descriptiva
Tercer Semestre Paralelo “1”
Elaborado por
[email protected]
15 de Febrero de 2024
1
Unidad I, II, III
Estadística Descriptiva
Contenido
Unidad 1: Introducción a la Estadística...................................................................................................7
1.1 Generalidades.............................................................................................................................7
1.1.1 Lluvia de ideas.....................................................................................................................7
1.1.2 Tipos de Interpretación........................................................................................................7
1.1.3 Tipos de Estadística.............................................................................................................9
1.2 Variabilidades............................................................................................................................9
1.2.1 Tipos de Variables...............................................................................................................9
1.2.2 Variables Numéricas..........................................................................................................10
1.2.3 Variables Categóricas........................................................................................................10
1.3 Organización de datos y Distribución de Frecuencia............................................................10
1.3.1 Organización de datos........................................................................................................10
1.3.2 Conjunto de datos..............................................................................................................10
1.3.3 Para qué elaborar tablas de frecuencia...............................................................................10
1.3.4 Distribución de datos.........................................................................................................11
1.4 Construcción de tablas de frecuencia....................................................................................11
1.4.1 Definición de frecuencia....................................................................................................11
1.4.2 Tablas de frecuencia..........................................................................................................11
1.4.3 Tipos de frecuencia............................................................................................................11
1.5 Descripción gráfica de datos......................................................................................................12
1.5.1 Tipos de Gráficos...............................................................................................................12
1.6 Ejercicios de Datos no Agrupados.........................................................................................12
1.6.1 Ejercicio 1..........................................................................................................................12
1.6.2 Ejercicio 2..........................................................................................................................13
1.6.3 Ejercicio 3..........................................................................................................................14
Unidad 2: Estadígrafos............................................................................................................................15
2.1 Medidas de Tendencia Central...............................................................................................15
2.1.1 Tipos de datos para las medidas de tendencia central:.......................................................15
2.2 Media........................................................................................................................................15
2.2.1 Tipos de Media..................................................................................................................15
2.2.2 Media para datos no Agrupados.........................................................................................16
2
Unidad I, II, III
Estadística Descriptiva
2.2.3 Ejercicios de Media en Datos no Agrupados......................................................................16
2.2.4 Media para datos Agrupados..............................................................................................17
2.2.5 Ejercicios de Media en Datos Agrupados..........................................................................17
2.3 Mediana....................................................................................................................................17
2.3.1 Mediana para datos no agrupados......................................................................................18
2.3.2 Ejercicios de Mediana en Datos no Agrupados..................................................................18
2.3.3 Mediana para datos agrupados...........................................................................................19
2.4 Moda.........................................................................................................................................19
2.4.1 Tipos de Moda...................................................................................................................19
2.4.2 Moda para datos no agrupados...........................................................................................20
2.4.3 Ejemplo de Moda...............................................................................................................21
2.4.4 Moda para datos agrupados................................................................................................21
2.5 Ejercicios de Medidas de Tendencia Central datos agrupados............................................22
2.6 Campos de Aplicación de las Medidas de Tendencia Central..............................................22
2.7 Tipos de Gráficos para las Medidas de Tendencia Central..................................................23
2.8 Formulario de Medidas de Tendencia Central......................................................................23
2.9 Medidas de Dispersión.............................................................................................................24
2.9.1 Generalidades....................................................................................................................24
2.10 Tipos de medidas de dispersión..............................................................................................25
2.11 Medidas de Dispersión Absolutas...........................................................................................25
2.11.1 Rango.................................................................................................................................25
2.11.2 Desviación media...............................................................................................................26
2.11.3 Desviación estándar o típica...............................................................................................26
2.11.4 Varianza.............................................................................................................................28
2.12 Medidas de Dispersión Relativas............................................................................................28
2.12.1 Coeficiente de variación.....................................................................................................28
2.12.2 Rango Intercuartil..............................................................................................................29
2.12.3 Rango Percentil..................................................................................................................29
2.13 Ejercicio con datos agrupados................................................................................................30
2.14 Formulario de Medidas de Dispersión...................................................................................30
2.15 Medidas de Posición.................................................................................................................31
2.16 Importancia de medidas de posición......................................................................................31
3
Unidad I, II, III
Estadística Descriptiva
2.17 Campos de Aplicación de las Medidas de Tendencia Central..............................................31
2.18 Tipos de medidas de posición..................................................................................................32
2.18.1 Medidas de posición central...............................................................................................32
2.18.2 Medidas de posición no central..........................................................................................32
2.19 Cuartiles...................................................................................................................................32
2.19.1 Primer cuartil.....................................................................................................................33
2.19.2 Segundo cuartil..................................................................................................................33
2.19.3 Tercer cuartil......................................................................................................................33
2.20 Fórmula para calcular cuartiles.............................................................................................33
2.20.1 Ejercicio 1..........................................................................................................................33
2.21 Quintiles....................................................................................................................................34
2.22 Fórmula para calcular Quintiles.............................................................................................34
2.23 Deciles.......................................................................................................................................34
2.24 Fórmula para calcular Deciles................................................................................................35
2.24.1 Ejercicio 2..........................................................................................................................35
2.25 Percentil....................................................................................................................................35
2.26 Fórmula para calcular Percentiles.........................................................................................36
2.26.1 Ejercicio 3..........................................................................................................................36
2.27 Formulario de Medidas de Posición.......................................................................................36
2.28 Medidas de Forma...................................................................................................................37
2.29 Tipos de medidas de Forma....................................................................................................37
2.30 Asimetría..................................................................................................................................37
2.31 Tipos de asimetría....................................................................................................................38
2.31.1 Asimetría positiva..............................................................................................................38
2.31.2 Simetría..............................................................................................................................38
2.31.3 Asimetría negativa.............................................................................................................38
2.32 Coeficiente De Asimetría.........................................................................................................38
2.32.1 Coeficiente De Asimetría De Fisher..................................................................................38
2.32.2 Ejercicios de Coeficiente de Fisher....................................................................................39
2.32.3 Coeficiente De Asimetría De Pearson................................................................................41
2.32.4 Ejercicio De Coeficiente De Pearson.................................................................................41
2.33 Curtosis......................................................................................................................................43
4
Unidad I, II, III
Estadística Descriptiva
2.34 Tipos de Curtosis.......................................................................................................................43
2.34.1 Leptocúrtica.......................................................................................................................43
2.34.2 Mesocúrtica.......................................................................................................................44
2.34.3 Platicúrtica.........................................................................................................................44
2.35 Coeficiente De Curtosis.............................................................................................................44
2.35.1 Ejercicio De Curtosis.........................................................................................................45
2.35.2 Ejercicio de Asimetría y Curtosis.......................................................................................46
2.36 Formulario de Medidas de Forma..........................................................................................47
Unidad 3: Análisis de datos e Introducción a la Probabilidad.............................................................48
3 ...........................................................................................................................................................48
3.1 Análisis de datos.......................................................................................................................48
3.2 Aplicaciones del Análisis de Datos..........................................................................................48
3.2.1 Estadística..........................................................................................................................48
3.2.2 Mercadotecnia....................................................................................................................48
3.2.3 Recursos Humanos............................................................................................................48
3.2.4 Ámbito Académico............................................................................................................48
3.3 Tipos de Análisis de datos.......................................................................................................49
3.3.1 Análisis de Datos Cualitativos...........................................................................................49
3.3.2 Análisis de Datos Cuantitativos.........................................................................................49
3.4 Ventajas del Análisis de Datos................................................................................................49
3.5 Métodos de análisis de datos...................................................................................................50
3.5.1 Análisis Descriptivo...........................................................................................................50
3.5.2 Análisis Exploratorio.........................................................................................................50
3.5.3 Análisis de Diagnóstico.....................................................................................................50
3.5.4 Análisis Predictivo.............................................................................................................50
3.5.5 Análisis Prescriptivo..........................................................................................................50
3.6 Diagrama de Árbol..................................................................................................................51
3.7 Ventajas del Diagrama de Árbol............................................................................................51
3.7.1 Ejemplo de Diagrama de Árbol..........................................................................................51
3.8 Diagramas de Caja..................................................................................................................52
3.9 Ventajas del Diagrama de Caja..............................................................................................53
3.9.1 Ejemplo de Diagrama de Caja............................................................................................53
5
Unidad I, II, III
Estadística Descriptiva
3.10 Terminología y conceptos básicos en probabilidades............................................................54
3.10.1 Conceptualización..............................................................................................................54
3.11 Terminología de probabilidades.............................................................................................55
3.11.1 Frecuencial.........................................................................................................................55
3.11.2 Matemática........................................................................................................................55
3.11.3 Binomial............................................................................................................................55
3.11.4 Objetiva.............................................................................................................................55
3.11.5 Subjetiva............................................................................................................................56
3.11.6 Hipergeométrica.................................................................................................................56
3.11.7 Lógica................................................................................................................................56
3.12 Combinaciones y Permutaciones............................................................................................57
3.13 Permutaciones:.........................................................................................................................57
3.14 Tipos de Permutaciones:.........................................................................................................57
3.14.1 Permutación Simple (o sin repetición)...............................................................................57
3.14.2 Permutación con Repetición..............................................................................................57
3.14.3 Permutación Lineal............................................................................................................57
3.14.4 Permutación Circular.........................................................................................................57
3.15 Combinaciones:........................................................................................................................58
3.16 Tipos de Combinaciones..........................................................................................................58
3.16.1 Combinación Simple (o sin repetición):.............................................................................58
3.16.2 Combinación con Repetición:............................................................................................58
3.17 Fórmulas....................................................................................................................................58
3.17.1 Permutaciones:...................................................................................................................58
3.17.2 Combinaciones:.................................................................................................................59
3.18 Ejemplos / Ejercicios...............................................................................................................59
3.18.1 Ejemplo 1:..........................................................................................................................59
3.18.2 Ejemplo 2:........................................................................................................................59
3.18.3 Ejercicio 1:........................................................................................................................59
3.18.4 Ejercicio 2:........................................................................................................................60
3.19 Distribuciones de Probabilidad...............................................................................................60
3.20 Distribución Discreta:..............................................................................................................60
3.20.1 Distribuciones Discretas más utilizadas.............................................................................61
6
Unidad I, II, III
Estadística Descriptiva
3.21 Distribución Continua:............................................................................................................61
3.21.1 Distribuciones Continuas más utilizadas............................................................................61
3.22 Cuadro comparativo................................................................................................................61
3.22.1 Distribución Discreta:........................................................................................................61
3.22.2 Distribución Continua:.......................................................................................................63
3.23 Ejemplificación........................................................................................................................64
3.23.1 Distribución Poisson..........................................................................................................64
3.24 Distribución Hipergeométrica................................................................................................65
Organizar Información
Segmentar Recopilación
Procesos Interpretación
Resultados Probabilidad
Análisis Toma de Decisiones
7
Unidad I, II, III
Estadística Descriptiva
1.1.2 Tipos de Interpretación
Numéricos
Gráficos
Analíticos
Interpretación Numérica: Análisis basado en valores numéricos para describir un conjunto de datos.
Juan 19 Tercero
Paco 19 Tercero
Pedro 18 Segundo
María 20 Tercero
Interpretación Gráfica: Uso de gráficos y diagramas para visualizar patrones y distribuciones en datos
de manera comprensible.
Edad
María Juan
27% 27%
Pedro Paco
18% 27%
8
Unidad I, II, III
Estadística Descriptiva
Semestre
27% 27%
18%
27%
Interpretación Analítica: Análisis profundo de datos para descubrir patrones y tendencias, utilizando
métodos lógicos y estadísticos.
Edad: El 50% de los encuestados tienen 19 años, el 25% tiene 18 y el otro 25% tiene 20 años.
Semestre: El 75% de encuestados está en 3er semestre y el 25% de encuestados están en 2do
semestre.
Descriptiva Inferencial
Estadística: Se encarga de recopilar, organizar, analizar e interpretar la información con el fin de obtener
conclusiones y tomar decisiones.
Recopilar datos: Es el proceso de recolectar datos ya sean cuantitativos y cualitativos mediante las
encuesta, censos, entrevistas y otros.
Organizar: Se refiere a la clasificación de los datos de la manera que sean fáciles de entender estos
datos, pueden ser clasificadas mediante tablas y otros.
Analizar: Implica la aplicación de métodos y técnicas estadísticas como el análisis descriptivo que
se encargan de resumir y describir los datos de manera concisa.
Interpretar: Es entender o comprender los resultados obtenidos para la toma de decisiones.
9
Unidad I, II, III
Estadística Descriptiva
1.2 Variabilidades
Población: Conjunto completo de elementos o individuos que comparten una característica común y
son objeto de estudio en estadística descriptiva.
Muestra: Subconjunto representativo de la población, utilizado para realizar inferencias sobre
características o comportamientos de la población total.
Dato: Valor individual o unidad de información recopilada sobre una variable en un estudio
estadístico.
Variable: Característica o atributo que puede medirse u observarse en distintas unidades de una
población, generando datos variados en un estudio estadístico descriptivo.
Caracteristicas: Atributo almacenamiento o escenario qué puede ocurrir dentro de la estadística.
Variables Continuas: Son valores dentro del rango y pueden tener decimales fracciones todos los
números. Ej. el peso, temperatura y altura.
Variables Discretas: Son valores específicos que no pueden tener decimales son valores enteros o la
cantidad de algo. Ej. Número de dedos.
Variables Nominales: Representan categorías o jerarquías sin ningún orden. Ej. Color de cabello,
color de ojos, país, etc.
Variables Ordinales: Representan una categoría o jerarquía, con un orden o una clasificación
específica. Ej. lugar de un podio, nivel de estudio, etc.
10
Unidad I, II, III
Estadística Descriptiva
1.3 Organización de datos y Distribución de Frecuencia
Mejor presentación.
Objetivizar los datos y analizar.
Interpretar los resultados y generar la toma de decisiones.
11
Unidad I, II, III
Estadística Descriptiva
1.4 Construcción de tablas de frecuencia
Variables
Nombre Edad Ciudad
Cristian 37 Penipe
Datos
Luis 27 Riobamba
Rosa 21 Guayaquil
12
Unidad I, II, III
Estadística Descriptiva
Histograma: Similar al gráfico de barras, pero utilizado para representar la distribución de frecuencias en
datos continuos. Las barras están contiguas, sin espacios entre ellas.
Gráfico de Líneas: Conecta puntos de datos mediante líneas rectas, mostrando la relación y tendencias
entre los valores a lo largo de una variable continua o a través del tiempo.
Diagrama de Dispersión: Muestra la relación entre dos variables representando puntos en un plano
cartesiano. Es útil para identificar patrones, correlaciones o tendencias.
A B C D E
Negro Azul Amarillo Rojo Azul
Azul Rojo Negro Amarillo Rojo
Rojo Amarillo Amarillo Azul Rojo
Negro Azul Rojo Negro Amarillo
Interpretación numérica
Frecuencia %
Frecuencia Frecuencia %
Color X Relativa Frecuencia
Relativa Absoluta Frecuencia
Absoluta Absoluta
Negro 4 0.20 4 0.20 20% 20%
Azul 5 0.25 9 0.45 25% 45%
Rojo 6 0.30 15 0.75 30% 75%
Amarillo 5 0.25 20 1 25% 100%
total 20 1 48
13
Unidad I, II, III
Estadística Descriptiva
Interpretación gráfica
Color Favorito
35%
30%
25%
20%
15%
10%
5%
0%
Negro Azul Rojo Amarillo
Interpretación analítica
El 25% tiene preferencia por el color azul, otro 25% es afín al color amarillo, un 20% prefiere el color
negro y como un porcentaje mayor de 30% prefieren el color rojo.
Se llega a la conclusión que un 45% tiene preferencias con los colores oscuros y un 55% prefiere los
colores vibrantes.
1.6.2 Ejercicio 2
En una concesionaria de vehículos se ha registrado la cantidad de autos de cierta marca (x) vendidos cada
día del mes de septiembre. obteniendo estos resultados.
0, 1, 2, 1, 2, 0, 3, 2, 4, 0, 4, 2, 1, 0, 3, 0, 0, 3, 4, 2, 0, 1, 1, 3, 0, 1, 2, 1, 2, 3
Frecuencia % %
Autos Frecuencia Frecuencia
X Relativa Frecuencia Frecuencia
Vendidos Relativa Absoluta
Acumulada Absoluta Relativa
0 8 0.2666 8 0.2666 26.66% 26.66%
1 7 0.2333 15 0.4999 23.33% 49.99%
2 7 0.2333 22 0.7332 23.33% 73.32%
3 5 0.1666 27 0.8998 16.66% 89.83%
4 3 0.1 30 1 10% 100%
total 30 1 100%
14
Unidad I, II, III
Estadística Descriptiva
1.6.3 Ejercicio 3
En la ciudad de Riobamba se desea construir una tabla de frecuencias para conocer el día más caluroso y
el día más frío del mes de agosto.
15º, 16º, 15º, 18º, 20º, 18º, 18º, 19º, 20º, 20º, 16º, 17º, 18º, 20º, 21º, 18º, 18º, 15º, 22º, 23º, 23º, 22º, 20º,
18º, 18º, 19º, 20º, 21º, 22º, 23º, 23º
Frecuencia Frecuencia
Frecuencia Frecuencia
Valor Absoluta Absoluta %
Absoluta Relativa
Acumulada Relativa
15 3 0.09 3 0.09 9.7%
16 2 0.06 5 0.15 6.5%
17 1 0.03 6 0.18 3.2%
18 8 0.26 14 0.44 25.8%
19 2 0.06 22 0.5 6.5 %
20 6 0.19 24 0.69 19.4%
21 2 0.06 27 0.75 6.5%
22 3 0.09 31 0.84 9.7%
23 4 0.13 0.97 12.9%
Total 31 1 1 100%
Unidad 2: Estadígrafos
1.7 Medidas de Tendencia Central
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un
conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Datos no agrupados: Son aquellos que no han recibido ningún tratamiento o clasificación luego de
ser recolectados.
15
Unidad I, II, III
Estadística Descriptiva
Datos agrupados: Son aquellos que están clasificados en función a un criterio, mostrando una
frecuencia para cada clase o grupo formado.
1.8 Media
La media también conocida como media aritmética es básicamente la cantidad que se obtiene al sumar
todos los datos de un conjunto de valores o cantidades para posteriormente dividir la cifra obtenida entre
la cantidad de valores que tenemos dentro del conjunto.
Fórmula de la Media
16
Unidad I, II, III
Estadística Descriptiva
1.8.3 Ejercicios de Media en Datos no Agrupados
Ejemplo 1
Ejemplo 2
La temperatura diaria en una ciudad durante una semana fue 28, 30, 26, 32, 29, 31, y 27 grados
Celsius. ¿Cuál es la temperatura media?
La media para datos agrupados o conocida también como media ponderada, como su nombre lo dice es
un promedio que se obtiene multiplicando cada valor con su respectiva frecuencia, sumo dichos productos
y luego se divide para la suma total de sus frecuencias.
Ejemplo 1
Las calificaciones en HMKTONLINE en los exámenes finales son (8, 7, 9, 10) y sus frecuencias son (3,
5, 4, 2) ¿Cuál será la media ponderada?
17
Unidad I, II, III
Estadística Descriptiva
( 8∗3 ) + ( 7∗5 ) + ( 9∗4 ) + ( 10∗2 )
x=
3+ 5+4 +2
24+35+ 36+20
x=
14
115
x=
14
x=8 , 21
1.9 Mediana
La mediana es importante porque proporciona una medida de tendencia central que es robusta ante
cambios en el conjunto de datos. A diferencia de la media aritmética, la mediana no se ve afectada por
valores extremos, por lo que es particularmente útil en un conjunto de datos con distribución sesgada o
valores atípicos.
Para encontrar la mediana muestral o poblacional de un conjunto de datos no agrupados se realizan los
siguientes pasos:
1. Se ordenan los datos de la serie del valor más pequeño al valor más grande, es decir, se organiza la
serie en orden creciente.
2. Observamos cuál es el tamaño de la muestra (n) o de la población (N) que se pretende analizar y
procedemos a encontrar la mediana bajo uno de los siguientes criterios:
b) Si el total de datos analizados es un número par, entonces la mediana es el promedio de los dos
valores que se encuentran en el centro de la serie ordenada. Es decir, es el promedio de los valores
n (n+ 2)
de los datos que ocupan las posiciones y de la serie ordenada.
2 2
18
Unidad I, II, III
Estadística Descriptiva
1.9.2 Ejercicios de Mediana en Datos no Agrupados
Ejemplo 1
Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
Hay 8 números en el conjunto (un número par). Así, encuentre el promedio de los dos números medios,
10 y 24.
Mⅇ =x n+1
2
10+24
Mⅇ =
2
34
Mⅇ = =17
2
Ejemplo 2
En el conjunto de datos ya ordenados 1,2,3,4,7,8,9.12,13,14,16. La mediana será
8.
1,2,3,4,6,7,9,10,12,13,14. La mediana es 7.
1.9.3 Mediana para datos agrupados
Donde:
[ ]
Li= Límite inferior de la clase mediana
Fórmula M =L +
( n
2
−F )
I
a N= Número de datos observados
Fa= Frecuencia acumulada anterior a la clase mediana
d i
fm I= Amplitud del intervalo
fm= Frecuencia de la clase media
19
Unidad I, II, III
Estadística Descriptiva
1.10 Moda
En estadística, la moda se refiere al valor que aparece con mayor frecuencia en un conjunto de datos. Es
una medida de tendencia central que identifica el valor más común o repetido en una distribución de
datos. Un conjunto de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal), o
más de dos modas (multimodal). La moda es especialmente útil en conjuntos de datos donde la frecuencia
de ciertos valores es más pronunciada.
Unimodal: cuando el máximo número de repeticiones que se da es solo para un solo número.
[ 3, 5, 5, 5, 6, 8, 9, 10,12,14]
UNIMODAL
3
0
3 5 6 8 9 10 12 14
La moda del conjunto es 5 porque se repite en tres ocasiones, mientras que el resto de los números se
repiten únicamente una vez.
[ 3, 5, 5, 5, 6, 7, 8, 8, 8, 9]
3.5 BIMODAL
3
2.5
2
1.5
1
La moda en este 0.5
conjunto sería 5 y 8 porque ambos números se repiten tres veces mientras que lo otros
0
3 5 6 8 9
números se repiten una vez.
[ 3, 3, 3, 3, 4, 5, 5, 5, 5, 6, 8, 8, 8, 8, 9]
20
Unidad I, II, III
Estadística Descriptiva
MULTIMODAL
5
4
3
2
1
0
3 4 5 6 8 9
La moda del conjunto en este caso serían tres números, porque los tres se repiten el mismo número de
veces: 3, 5, 8. Aunque no es muy común ver gráficas cuando se da este caso porque simplemente
visualizaremos una curva constante.
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de
frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una
muestra puede tener más de una moda.
Para calcular la moda de un conjunto de datos estadísticos basta con contar el número de veces que
aparece cada dato en la muestra, y el dato más repetido será la moda.
Así, el 9 es la moda.
Si la variable es de tipo discreto la moda o modo será al valor de la variable que tenga la mayor
frecuencia absoluta.
Donde:
Mo= Moda.
Li= Limite real inferior de la clase modal.
Fórmula M o=Li +
[ ∆1
∆ 1+ ∆ 2]I
∆ 1= Diferencia entre la mayor frecuencia y la
frecuencia anterior.
∆ 2= Diferencia entre la mayor frecuencia y la
frecuencia que le sigue.
I= Amplitud del intervalo de la clase modal.
21
Unidad I, II, III
Estadística Descriptiva
1.11 Ejercicios de Medidas de Tendencia Central datos agrupados
Las medidas de tendencia central como la media, mediana y moda tienen aplicaciones importantes en
diversos campos:
Estadística: Son las medidas más utilizadas para caracterizar conjuntos de datos tanto a nivel
descriptivo como inferencial. Permite resumir y representar el centro o valor típico de una
distribución.
Economía: Se utilizan para analizar variables económicas como ingresos, gastos, inflación, tipo de
cambio. Por ejemplo, calcular la media o mediana del PIB.
Demografía y ciencias sociales: Sirven para estudiar características de poblaciones como edad
media, ingreso per cápita, nivel educativo modal.
Psicometría: Se emplean para desarrollar test psicológicos estandarizados basándose en la media y
desviación estándar de las puntuaciones.
Medicina: La media y percentiles de valores como peso, talla, presión arterial, colesterol se usan para
evaluación de pacientes.
22
Unidad I, II, III
Estadística Descriptiva
Control de calidad: Permite establecer especificaciones y rangos de variación aceptables de
parámetros como dimensiones, concentraciones químicas, etc.
Meteorología: Para obtener valores típicos de temperatura, precipitaciones, velocidad del viento.
Negocios: Para evaluar desempeño de ventas, costos de producción, audiencia de marketing.
Educación: Como indicadores del rendimiento académico a través del promedio de calificaciones.
Existen varios tipos de gráficos que se pueden utilizar para representar visualmente las medidas de
tendencia central como la media, mediana y moda:
Diagrama de caja y bigotes (box plot): Es muy útil para observar la mediana. La caja representa la
línea central que es la mediana.
Histograma: Permite visualizar la distribución de los datos y ubicar la media o moda como el pico o
columna más alta.
Diagrama circular o de torta: Es útil para datos categóricos donde se pueden graficar fracciones
según la moda.
Diagrama de Pareto: Ordena los valores de forma descendente, permitiendo identificar rápidamente
la moda.
Histograma apilado: Separando categorías o segmentos para comparar medias o medianas entre
grupos.
La elección del gráfico dependerá del tipo y distribución de los datos, así como del objetivo del análisis.
Pero en general estos gráficos permiten visualizar fácilmente las medidas de tendencia central.
M.T.C Tipo de
Datos no Agrupados Datos Agrupados
. datos
23
Unidad I, II, III
Estadística Descriptiva
(
[ ]
−F )
N M e =x N +1 N
M e= o 2 a
Paramétrico 2 2
MEDIANA
M =L +d i I
fm
[ ]
Estadístico
M e=
n
2
o
M e =x n+1
2
M d =Li+
n
2
−F a( )
I
fm
Paramétrico
[ ]
MODA
Las medidas de dispersión muestran la variabilidad de una distribución. Hay dos tipos de medidas de
dispersión: las absolutas, que incluyen el recorrido, la desviación media, la varianza y la desviación típica,
que se utilizan con frecuencia en análisis estadísticos generales; y las relativas, que muestran la
distribución estadística de manera independiente de las unidades en las que se expresan las
variables. Entre ellos se encuentran los coeficientes de apertura, el recorrido relativo y los coeficientes de
variación forman un sistema de datos no definidos que se organizan en variables para buscar un patrón o
esquema.
1.15.1 Generalidades
¿Qué son las medidas de dispersión?
Es una ciencia formal e instrumental que estudia cada análisis y cada uso que se deriva del modelo. El
propósito es describir la relación entre dos variables numéricas, especialmente si los datos aumentan o
disminuyen.
Las medias de dispersión son valores numéricos que proporcionan información sobre la variabilidad de
los datos. En otras palabras, muestra la proximidad o separación de datos distribuidos entre sí. Los datos
están altamente clasificados, ampliamente distribuidos o similares.
24
Unidad I, II, III
Estadística Descriptiva
Las medidas de variabilidad describen la uniformidad o varianza de la distribución de datos. Aplicar
es rápido y fácil.
Los valores impares son siempre positivos, o 0 si son pares.
Las técnicas de degradación se pueden utilizar en una variedad de sectores, incluidos la salud, la
industria y la economía empresarial, etc.
Esto nos ayuda a comprender el conjunto de datos y uno de los principales usos de las medidas de
dispersión es ayudarnos a comprender la distribución de los datos. A medida que los datos se vuelven más
variables, aumenta el valor de la medida de dispersión.
Se refieren a conceptos que evalúan la dispersión o la extensión de los datos en un conjunto sin tener en
cuenta su relación con la magnitud de otros aspectos del conjunto. Estas medidas indican cuán dispersos
están los valores en relación con la media o entre sí.
25
Unidad I, II, III
Estadística Descriptiva
1.17 Medidas de Dispersión Absolutas
1.17.1 Rango
El rango o recorrido es una medida de dispersión que describe la diferencia entre valores extremos de un
conjunto. Es decir, la resta entre el valor máximo y el valor mínimo.
R=Max x −Min x
Ejercicio
Libros Precio
1 $33,00 Min(x)
R= Max(x)-Min(x)
2 $37,00
3 $50,00 R= 110-33
4 $110,00 R= 77
Max(x)
5 $95.00
DM =∑∨X i− X∨ ¿ ¿
N
Ejercicio
X = (3 + 5 + 7 + 9 + 11) / 5 = 7
DM =∑∨X i− X∨ ¿ ¿
N
(|3−7|+|5−7|+|7−7|+|9−7|+|11−7|)
DM =
5
26
Unidad I, II, III
Estadística Descriptiva
( 4+2+ 0+2+4 )
DM = =2 , 4
5
1.17.3 Desviación estándar o típica
Otra medida de dispersión es la desviación estándar o típica. Este es el método de la raíz cuadrada
de la media aritmética para calcular los cuadrados de diferentes valores. En resumen, es la raíz
cuadrada de la varianza y se expresa como:
σ =√ ∑1N ¿ ¿ ¿
Ejercicio
Se pide calcular la varianza y la desviación estándar de los siguientes datos: 1, 4, 6 y 9 sabiendo que
corresponden a una población.
En este caso nos indica que los datos forman una población, por lo que usaremos las fórmulas de varianza
y desviación estándar para la población, teniendo en cuenta que tenemos
4 datos, es decir, N = 4.
N
∑ i=1 X i
μ=
N
X 1+ X 2+ X 3 + X 4
μ=
N
1+ 4+6+ 9
μ=
4
20
μ=
4
μ=5
Después se calcula la varianza poblacional:
2 N
σ =∑1 ¿ ¿
2
σ =¿ ¿
2
σ =¿ ¿
2
σ =¿ ¿
2 16+ 1+ 1+ 16 34
σ = = =8 , 5
4 4
27
Unidad I, II, III
Estadística Descriptiva
El resultado de la varianza poblacional es 8,5
2
σ =√ σ
σ =√ 8 ,5=2,915
1.17.4 Varianza
Representa la variabilidad de un conjunto de datos con respecto a su media aritmética. Se expresa como el
cuadrado de las desviaciones de la media de una distribución estadística y se expresa utilizando la
siguiente sintaxis:
σ =∑ ¿ ¿ ¿
2
Ejercicio
(CV): Esta es una medida de dispersión relativa calculada como la relación entre la desviación
estándar y la media del conjunto de datos y multiplicada por 100 para expresarla como porcentaje.
El coeficiente de variación permite comparar la diferencia entre conjuntos de datos con diferentes
medidas. Cuanto mayor sea el coeficiente de variación, mayor será la dispersión relativa.
σ s
CV = ∗100 CV = ∗100
X X
Ejercicio
Una población de alumnos tiene una estatura media de 1,65cm con una desviación estándar de
28
Unidad I, II, III
Estadística Descriptiva
17cm. Estos mismos alumnos, tienen un peso medio de 65kg con una desviación estándar de 15kg.
¿Cuál de las dos variables presenta mayor variabilidad relativa?
(RI): Esta es una medida de dispersión relativa calculada como la diferencia entre el tercer cuartil
(Q3) y el primer cuartil (Q1) del conjunto de datos. El rango intercuartil representa el rango en el
que se encuentra el 50% central de los datos y es útil para comparar la diferencia entre diferentes
distribuciones. Cuanto mayor sea el rango promedio, mayor será la dispersión relativa.
RIC=Q3−Q1
(RP): Esta es una medida de dispersión relativa expresada como porcentaje dividiendo la diferencia entre
los valores máximo y mínimo de los datos establecidos por el máximo y multiplicando por 100. El rango
percentil es la diferencia relativa a todo el rango de datos. Cuanto mayor sea el rango porcentual, mayor
será la dispersión relativa.
f
f a+
2
RP= ∗100
N
Ejercicio
Obtención del rango percentil de la puntuación 7
X=2.3.4.6,7,7,7,7,8,8,8,9
4
4+
2
RP= ∗100
12
6
RP= ∗100
12
RP=0 , 5∗100
RP=50 %
29
Unidad I, II, III
Estadística Descriptiva
Se dirá que el Rango Percentil de 7 es igual a 50, lo que significa que el 50% de las puntuaciones presenta
valores inferiores a 7.
Los siguientes datos representan las edades en las que crece el consumo de comida
chatarra. 2,3,4,4,6,6,8,9,10,11,12,13,14,15,15,16,17,17,20
VARIANZA
∑ ¿ 1 ∙ ( xi−x ) ² ∑ ¿ 1 f 1 ∙ ( xi−x ) ²
2 1 2 1
S= S=
N −1 n−1
n k
DESVIACIÓN TÍPICA
∑ ¿ 1∙ ( xi−x ) ² ∑ ¿ 1 f 1 ∙ ( xi−x ) ²
i i
S=√ S=√
N −1 N −1
30
Unidad I, II, III
Estadística Descriptiva
k N
DESVIACIÓN MEDIA
∫ ¿ 1 f 1 ∙|xi− x| ∑ ¿ 1|xi− x|
T i
MAD= MAD=
N N
Coeficiente De CV =
S
∙ 100
RANGO R=Max x−Min x
|x|
Variación
Las medidas de posición son herramientas estadísticas que nos permiten describir la ubicación o posición
central de un conjunto de datos. Estas medidas nos brindan información sobre dónde se encuentra el valor
típico de un conjunto de datos y nos ayudan a entender su distribución.
Las medidas de posición en estadística son indicadores que nos permiten organizar los datos, además las
medidas son importantes en el análisis descriptivo, ya que permite agrupar y codificar los datos obtenidos,
también ayuda a comprender de mejor manera como se distribuyen, proporcionando información calve
que van a ser analizados dando la facilita de representar e interpretar los resultados generando un visión
clara y general de los datos recopilados.
31
Unidad I, II, III
Estadística Descriptiva
Los centiles en el área de ingeniería pueden ser utilizados para diseñar
Ingeniería motores y otros componentes que puedan soportar condiciones extremas,
por ejemplo, para determinar la temperatura máxima que puede soportar un
motor sin sufrir daños.
Media: es el valor del medio de todos los datos ordenados de menor a mayor.
Mediana: La mediana es el valor central en un conjunto de datos ordenado.
Moda: es el valor que más se repite del conjunto de datos.
Las medidas de posición no central son aquellas que no se centran en el valor central de los datos, si no
que se centran en otro valores de la distribución, que se dividen el conjunto de datos en partes iguales.
1.25 Cuartiles
Los cuartiles son tres valores que dividen un conjunto de datos ordenados en cuatro partes iguales.
El primer cuartil (Q1) representa el 25% de los datos, es decir, la mitad de los datos están por
encima de Q1 y la otra mitad por debajo.
El segundo cuartil (Q2) representa el 50% de los datos, es decir, la mediana de los datos.
El tercer cuartil (Q3) representa el 75% de los datos, es decir, la mitad de los datos están por
encima de Q3 y la otra mitad por debajo.
Los cuartiles se utilizan en una variedad de campos, como la estadística, la investigación y la economía.
Por ejemplo, los cuartiles se pueden utilizar para comparar conjuntos de datos diferentes o para identificar
valores atípicos.
Cuartiles
32
Unidad I, II, III
Estadística Descriptiva
100%
25% 50%
Q1 Q2 Q3
( )
K∗( n+1 ) k xN
QK k=1 , 2 ,3 −Fi−1
4 4
Q k =Li + xA
fⅈ
IMPAR
Kn
QK
4
1.26.1 Ejercicio 1
Calcular Q 1 ,Q 2 , Q 3 de los siguientes datos de edades: 15, 17, 16, 16, 15, 17, 15, 18, 14, 16, 15
33
Unidad I, II, III
Estadística Descriptiva
14 15 15 15 15 16 16 16 17 17 18
2∗( 11+1 )
Qk =
4
24
Qk = =6
4
1∗(11+1)
Qk =
4
12
Qk = =3
4
1.27 Quintiles
Los quintiles son una herramienta estadística que divide una muestra o población en cinco grupos iguales
según determinadas variables, permitiendo analizar la distribución de estas variables y comprender las
características de diferentes segmentos de la población.
El primer, segundo, tercer y cuarto quintil representa respectivamente el 20%, 40%, 60% y 80%
de los datos de la muestra. Los quintiles se representan mediante la letra K mayúscula junto con
el subíndice del quintil. El primer quintil es K1, el segundo quintil es K2, el tercer quintil es K3,
y el cuarto quintil es K4.
( )
k x (n+1)
−F i−1
5 k= 1,2,3,4
k∗(n+1) Qk =Li + x li
k=1 , 2, 3 , 4 fⅈ
5
34
Unidad I, II, III
Estadística Descriptiva
1.29 Deciles
Los deciles son medidas de posición que dividen a un conjunto de datos ordenados en diez partes iguales,
cada decil representa el valor 1/ 10 de la muestra o población, por debajo del cual se encuentra un
porcentaje específicos en datos.
Dividen a la distribución en 10 partes iguales (9 divisiones). D1,..,D9, correspondientes a
10%,...,90%
( )
k ⋅(n) K (N )
−F1−1
10
D K =Li +
10 *A
IMPAR fi
k ⋅(n+ 1)
10
1.30.1 Ejercicio 2
Son medidas de posición que dividen un conjunto de datos ordenados en 100 partes iguales. Cada
percentil representa el valor por debajo del cual se encuentra un porcentaje específico de los datos. Es una
35
Unidad I, II, III
Estadística Descriptiva
medida de posición no central dónde se puede observar el porcentaje de una variable ordenados de menor
a mayor.
1.32.1 Ejercicio 3
80∗10
100
800
=8 es la posición
100
36
Unidad I, II, III
Estadística Descriptiva
k ⋅(n+ 1)
100
Par
k ⋅(n)
( )
k⋅N 10
−F i−1
DECILES 10 Impar
Dk = Li + .A k ⋅(n+ 1)
fi
10
( )
k x (n+1)
−F i−1
5
QUINTILES Q k =Li + x li k∗(n+1)
fⅈ k=1 , 2, 3 , 4
5
k= 1,2,3,4
Par
K∗( n+1 )
QK k=1 , 2 ,3
( )
k.N 4
−F i−1
CUARTILES 4 Impar
Qk =Li + xA Kn
fⅈ QK
4
Las medidas de forma son estadísticas descriptivas que se utilizan para describir la forma de la
distribución de un conjunto de datos. En otras palabras, nos permiten analizar cómo se agrupan los
valores en torno a la media y si hay valores extremos o anomalías en datos.
Asimetría: indica el grado de simetría (o asimetría) de una distribución, es decir, muestra si una
distribución es simétrica o asimétrica.
Curtosis: indica el grado de concentración de una distribución alrededor de su media, es decir,
determina si una distribución es escarpada o achatada.
1.36 Asimetría
Las medidas de asimetría son indicadores que permiten establecer el grado de simetría (o asimetría)
que presentan los datos de la distribución sin tener que representarlos gráficamente. Para medir la simetría
37
Unidad I, II, III
Estadística Descriptiva
de una distribución de frecuencias se toma como eje de asimetría la recta paralela al eje de ordenadas que
pasa por la media aritmética de la muestra.
1.37.2 Simetría
La distribución tiene el mismo número de valores a la izquierda que a la derecha de la media.
El coeficiente de asimetría de Fisher es igual al tercer momento en torno a la media dividido por la
desviación estándar de la muestra.
38
Unidad I, II, III
Estadística Descriptiva
3
μ
Fórmula para Población g1 = 3
σ
3
m
Fórmula para Muestra g1 = 3
s
Equivalentemente, se puede usar cualquiera de las siguientes dos fórmulas para calcular el coeficiente de
Fisher:
∑ ( x i−x )3 . fi
As= i=1
n . s3
Por otro lado, si los datos están agrupados puedes usar la siguiente fórmula:
N
∑ ( x i−μ ) 3 . fi
As= i=1
N . σ3
N N
2 2
Población
∑ ( xⅈ −μ ) . fi ∑ xi fi
2 i =1 2 i =1
σ = σ = −μ2
N N
N N
2 2
Muestral
∑ ( x i−x ) . fi ∑ xi f i−n x 2
2 i=1 2 i=1
s= s=
n−1 n−1
Datos No Agrupados
Las puntuaciones de 10 personas de un test de ansiedad se muestran a continuación:
10, 12, 12, 10, 12, 15, 11, 13, 11, 14
39
Unidad I, II, III
Estadística Descriptiva
xi f x 3
( x i−x ) . fi
2
( x i−x ) . fi
10 2 20 -16 8
11 2 22 -2 2
12 3 36 0 0
13 1 13 1 1
14 1 14 8 4
15 1 15 27 9
Total 120/10=12 18 24
N
2
∑ ( x i−x ) . fi
1. s 2= i=1
n−1
2 24
s= =2.67
10−1
s= √ s2
s= √ 2.67=1.63
N
∑ ( x i−x )3 . fi
2. As= i=1
n . s3
18
As= 3
=0.41
10. ( 1.63 )
Datos Agrupados
De los siguientes datos sacar la asimetría de Fisher
x fi xi xi.fi 2
x . fi
3
( x i−x ) . fi
[26, 35) 1 30.5 30.5 930.25 -26463.592
[35, 44) 4 39.5 158 6241 -35995.648
[44, 53) 5 448.5 242.5 11761.25 -8215.16
[53, 62) 14 57.5 805 46287.5 -307.328
[62, 71) 14 66.5 931 61911.5 3336.592
[71, 80) 5 75.5 377.5 28501.25 17559.04
[80, 89] 2 84.5 169 14280.5 28344.976
45 2713.5 169913.25 -21741.12
∑ x i f i 2713.5
1) µ= = =60.3
n 45
40
Unidad I, II, III
Estadística Descriptiva
N
2
2)
∑ xi fi
2 i =1
σ = −μ2
N
2 169913.25 2
σ = −60.3 =139.7 6
45
σ =√ ( 139.76 ) = 11.822
2
N
2
3)
∑ xi f i−n x 2
169913.25−45 ( 60.3 )
2
2 i=1
s= = =142,9364
n−1 45−1
s= √ 142.9364=11.95
4)
∑ ( x i−x )3 . fi −2174.12
As= i=1 3
= 3
=−0.2827
n.s 45 ( 11.9556 )
μ−Mo
Población Ap=
σ
x−Mo
Muestra Ap=
S
41
Unidad I, II, III
Estadística Descriptiva
3 ( μ−Md )
Población As=
σ
3 ( x−Md )
Muestra As=
S
Datos no agrupados
La siguiente tabla muestra la distribución de la variable “número de hijos”, definida sobre un conjunto de
25 personas tomadas al azar
x f X.f 2
x .f
1 3 0 0
2 7 7 7
3 4 8 16
4 6 18 54
5 2 8 32
6 1 5 25
7 1 6 36
8 1 8 64
sumatoria 25 60 234
∑ x . f 60
1) x= = =2.4
n 25
3) s= √ s2
s= √ 3.75=1.9 4
42
Unidad I, II, III
Estadística Descriptiva
x−Mo 2.4−1
4) Ap= = =0.72
S 1.94
Datos Agrupados
La siguiente tabla corresponde a la temperatura (°F) máxima diaria registrada durante 45 días. A las 14:00
en una cierta estación meteorológica.
x f Fa xi xi . f 2
xi . f
26-35 1 1 30.5 30.5 930.25
35-44 4 5 39.5 158 6241
44-53 5 10 48.5 242.5 11761.25
53-62 14 24 57.5 805 46287.5
62-71 14 38 66.5 931 61911.5
71-80 5 43 75.5 377.5 28.501.25
80-89 2 45 84.5 169 14280.5
45 2713.5 169913.25
∑ xi . f 2713.5
1) x= = =60.3
n 45
( )
N
−faa
2)
Md=Lri+
2
fmd
⋅ A=53+
22.5−10
14 (
⋅9=61.04 )
n 45
3) Md= = =22.5=24
2 2
2
∑ xi ⋅f 2 169913.25 2
4) σ 2= −μ = − ( 60.3 ) =¿139.76
n 45
5) σ =√ σ 2
σ =√ 139.76=11.82
3 ( μ−Md ) 3 ( 60.3−61.04 )
A s= = =−0.187 8
σ 11.82
43
Unidad I, II, III
Estadística Descriptiva
1.39 Curtosis
1.40.1 Leptocúrtica
La distribución es muy apuntada, es decir, los datos están muy concentrados alrededor de la media. En
concreto, las distribuciones leptocúrticas se definen como aquellas distribuciones más apuntadas que la
distribución normal.
1.40.2 Mesocúrtica
La curtosis de la distribución es equivalente a la curtosis de la distribución normal. Por tanto, no se
considera ni apuntada ni achatada.
1.40.3 Platicúrtica
La distribución es muy achatada, es decir, la concentración en torno a la media es baja. Formalmente, las
distribuciones platicúrticas se definen como aquellas distribuciones más achatadas que la distribución
normal.
4
∑ ( x1 −x )
k= 4
−3
ns
44
Unidad I, II, III
Estadística Descriptiva
k=
(
1 Q3−Q1
2 P90−P10 )
La fórmula del coeficiente de curtosis para datos agrupados
Muestra
N
∑ ( x i−x ) 4 fi
K= i=1 −3
n s4
Población
N
∑ ( x i−μ )4 fi
K= i=1 −3
nσ4
Por último, la fórmula del coeficiente de curtosis para datos agrupados en intervalos.
N
∑ ( c i−μ ) 4 fi
1 i=1
K= . −3
N σ4
Una vez se ha calculado el coeficiente de curtosis, se debe interpretar de la siguiente manera para
identificar qué tipo de curtosis se trata:
Datos No Agrupados
Determine el coeficiente de curtosis de los siguientes datos.
10, 11, 11, 12, 12, 13, 13, 13, 14, 15, 17, 18, 20
Solución:
N= 12
45
Unidad I, II, III
Estadística Descriptiva
P10 10% (13+1) = 1.4 10+0.4(11-10) = 10.4
P90 90% (13+1) =12.6 18+0.6(20-18) = 19.2
k=
(
1 Q3−Q1
2 P90−P10 )
(
1 16−11.5
k= ⋅
2 19.2−10.4 )
k =0.255>0
Datos Agrupados
x fi xi xi . f 2
xi . f
4
( x i−x ) . fi
[26, 35) 1 30.5 30.5 930.25 788615.042
[35, 44) 4 39.5 158 6241 748709.478
[44, 53) 5 48.5 242.5 11761.25 96938.888
[53, 62) 14 57.5 805 46287.5 860.5184
[62, 71) 14 66.5 931 61911.5 20686.8704
[71, 80) 5 75.5 377.5 28501.25 266897.408
[80, 89) 2 84.5 169 14280.5 685948.419
45 2713.5 169913.25 2608656.62
N
2
1) ∑ xi f i−n∗ x 2
169913.25−45 ( 60.3 )
2
2 i=1
s= = =142.9364
n−1 45
s= √ 142.9364=11.9556
2) K= i=1
∑ ( x i−μ )4 fi 2608656.62
4
−3= 4
−3=−0.1626
nσ 45 ( 11.9556 )
K <0
46
Unidad I, II, III
Estadística Descriptiva
1.41.2 Ejercicio de Asimetría y Curtosis
Medidas de Forma
Coeficiente De
Población Muestra
Asimetría
3
3 m
μ g1 =
g1 = 3 s
3
Coeficiente de σ
asimetría de fisher
N N
Coeficiente de fisher 2 2
∑ xi fi ∑ ( x i−x ) . fi
σ 2= i =1 −μ2 s2= i=1
N n−1
47
Unidad I, II, III
Estadística Descriptiva
N
2
∑ xi f i−n x 2
2 i=1
s=
n−1
N N
2 2
∑ ( xⅈ −μ ) . fi ∑ ( x i−x ) . fi
σ 2= i =1 s2= i=1
N n−1
Varianza poblacional
y varianza muestral N N
2 2
en datos agrupados ∑ xi f i ∑ xi f i−n x 2
2 i =1 2 2 i=1
σ = −μ s=
N n−1
μ−Mo x−Mo
Ap= Ap=
Coeficiente de σ S
asimetría de pearson
3 ( μ−Md ) 3 ( x−Md )
Coeficiente de As= As=
asimetría de pearson σ S
Datos agrupados
Datos No Agrupados Datos Agrupados Agrupados En Intervalos
COEFICIENTE DE CURTOSIS
MUESTRA
∑ ( x1 −x ) 4 ∑ ( x i−x ) 4 fi
k= −3 K= i=1 −3
ns 4
n s4
N
POBLACIÓN
1 i=1
∑ ( c i−μ ) 4 fi
K= . −3
( ) σ4
1 Q3−Q1 N N
k=
2 P90−P10 ∑ ( x i−μ )4 fi
K= i=1 −3
nσ4
48
Unidad I, II, III
Estadística Descriptiva
Unidad 3: Análisis de datos e Introducción a la Probabilidad
1.43 Análisis de datos
El análisis de datos constituye la disciplina que aborda la evaluación minuciosa de conjuntos de datos,
con el fin de extraer conclusiones, informar decisiones, y expandir la comprensión de diversos temas.
Involucra la exploración y modelado de la información para identificar patrones y tendencias,
respaldando así la toma de decisiones informadas y el enriquecimiento del conocimiento en distintos
ámbitos.
El análisis de datos encuentra diversas aplicaciones en distintos contextos, proporcionando la base para
tomar decisiones fundamentadas y validar hipótesis. Este proceso es esencial para evaluar la viabilidad de
decisiones y confirmar o refutar suposiciones.
1.44.1 Estadística
En el ámbito estadístico, el análisis de datos desempeña un papel fundamental al explorar patrones y
relaciones en conjuntos de datos. Proporciona información esencial para tomar decisiones informadas y
formular conclusiones significativas. Este proceso estadístico permite comprender la variabilidad de los
datos y realizar inferencias basadas en evidencia.
1.44.2 Mercadotecnia
Dentro del campo de la mercadotecnia, el análisis de datos se emplea primordialmente para anticipar y
evaluar el comportamiento de los consumidores. También se utiliza para clasificar a los consumidores y
perfeccionar estrategias de campañas publicitarias.
49
Unidad I, II, III
Estadística Descriptiva
1.45 Tipos de Análisis de datos
Para obtener datos valiosos, es esencial someterlos a análisis, y este proceso requiere la aplicación de
diversas técnicas que varían según el tipo de información recopilada. Es crucial tener una técnica definida
antes de su implementación.
Contrastando con los datos cualitativos, el análisis de datos cuantitativos implica información presentada
de manera numérica y se basa en resultados tangibles. La recopilación de esta información suele llevarse
a cabo mediante métodos cuantitativos, como encuestas estructuradas, experimentos y análisis
estadísticos.
Realizar un análisis exhaustivo de datos mediante técnicas y herramientas apropiadas puede ofrecer
diversas ventajas para tu investigación. Entre estas destacan:
Facilita la toma de decisiones empresariales de manera más ágil y fundamentada, respaldada por
datos concretos.
Contribuye a que las empresas identifiquen problemas de rendimiento que requieren intervención.
Proporciona una comprensión más profunda de las necesidades de los clientes, generando relaciones
comerciales más sólidas.
50
Unidad I, II, III
Estadística Descriptiva
Aumenta la conciencia sobre riesgos, permitiendo la implementación de medidas preventivas.
Permite una visualización clara de la información, agilizando el proceso decisional.
Brinda a las empresas una posible ventaja competitiva.
Mejora la comprensión del rendimiento financiero del negocio.
Se ha demostrado que reduce costos, contribuyendo así al aumento de beneficios.
Además de los previamente mencionados tipos de análisis, existen diversos métodos para analizar datos,
los cuales pueden ser implementados según las necesidades y preguntas que orientan tu investigación:
Este método, esencial como punto de partida, busca responder a la pregunta "¿qué ha pasado?" mediante
la ordenación, manipulación e interpretación de datos brutos de diversas fuentes. El análisis descriptivo
organiza los datos, preparándolos para investigaciones posteriores. Sin embargo, por sí solo, no puede
prever resultados futuros ni abordar cuestiones sobre por qué ocurrieron ciertos eventos.
Realizado como parte de la investigación exploratoria, el análisis exploratorio busca conexiones y genera
hipótesis en situaciones donde aún no se comprende completamente la relación entre datos y variables. Es
especialmente útil en la minería de datos.
Este análisis proporciona una comprensión contextual de por qué ocurrieron ciertos eventos, permitiendo
la identificación precisa de enfoques para abordar problemas o desafíos. Ofrece respuestas directas y
procesables a preguntas específicas.
51
Unidad I, II, III
Estadística Descriptiva
1.47.5 Análisis Prescriptivo
Un diagrama de árbol es una representación gráfica jerárquica que utiliza ramificaciones y elementos para
mostrar de manera estructurada las relaciones entre diferentes conceptos o eventos. En este tipo de
diagrama, un elemento principal se divide en elementos secundarios, y así sucesivamente, creando una
estructura similar a la de un árbol.
Cada elemento representa un componente específico, y las conexiones entre elementos indican las
relaciones o dependencias entre esos componentes. Los diagramas de árbol son comúnmente utilizados en
diversas disciplinas, como la toma de decisiones, la planificación de proyectos y la representación visual
de sistemas de clasificación o estructuras de información.
Dadas las características inherentes al diagrama de árbol, las ventajas de este tipo de representación
gráfica incluyen:
Construye el diagrama de árbol de probabilidades del lanzamiento de tres monedas independientes. Luego
calcula la probabilidad de obtener cara en los tres lanzamientos.
1
P ( cara )= =0 ,5
2
52
Unidad I, II, III
Estadística Descriptiva
1
P ( sello )= =0 , 5
2
Así, en esta situación, se hace necesario multiplicar todas las probabilidades de obtener cara, ya que estas
representan las probabilidades a lo largo del camino que nos conduce al resultado deseado.
En definitiva, la probabilidad de conseguir tres veces cara de manera consecutiva es del 12,5%.
Los diagramas de caja, también conocidos como boxplots, son representaciones gráficas que muestran la
distribución de un conjunto de datos y resumen varias medidas estadísticas clave. En un diagrama de caja
típico, se traza una caja que abarca el rango intercuartílico (IQR), que es la distancia entre el primer
53
Unidad I, II, III
Estadística Descriptiva
cuartil (Q1) y el tercer cuartil (Q3). Dentro de la caja, se dibuja una línea para representar la mediana
(Q2).
Las "alas" o líneas que se extienden desde la caja, llamadas "bigotes", indican la dispersión de los datos
más allá de los cuartiles. Los puntos que pueden aparecer más allá de los bigotes se consideran valores
atípicos.
Los diagramas de caja son útiles para comparar la distribución y dispersión de diferentes conjuntos de
datos, identificar valores atípicos y tener una comprensión visual rápida de la variabilidad de los datos.
Resumen Estadístico: Resumen varias medidas estadísticas clave, como los cuartiles y la mediana,
proporcionando una visión rápida de la distribución central y la variabilidad.
Manejo de Datos Asimétricos: Son útiles para representar y comparar la distribución de datos
asimétricos o sesgados.
Facilidad de Interpretación: Son intuitivos y fáciles de interpretar, lo que los hace accesibles para
audiencias no especializadas en estadísticas.
Efectividad en Muestras Pequeñas: Son especialmente útiles para muestras pequeñas, donde otros
métodos gráficos podrían no ser tan informativos.
Los siguientes datos son las estaturas de 40 estudiantes en una clase de Estadística.
54
Unidad I, II, III
Estadística Descriptiva
59; 60; 61; 62; 62; 63; 63; 64; 64; 64; 65; 65; 65; 65; 65; 65; 65; 65; 65; 66; 66; 67; 67; 68; 68; 69; 70; 70;
70; 70; 70; 71; 71; 72; 72; 73; 74; 74; 75; 77
Construya un diagrama de caja con las siguientes propiedades; las instrucciones de la calculadora para los
valores mínimo y máximo, así como los cuartiles, siguen el ejemplo.
Valor mínimo = 59
Valor máximo = 77
1.52.1 Conceptualización
55
Unidad I, II, III
Estadística Descriptiva
1.53 Terminología de probabilidades
La probabilidad es una rama de las matemáticas que estudia la posibilidad de que ocurran ciertos eventos
o sucesos, basándose en el análisis de datos, la lógica y el azar. Existen diferentes tipos de probabilidad,
según el método o el enfoque que se utilice para calcularla. Algunos de los tipos más comunes son las
siguientes.
1.53.1 Frecuencial
Es la probabilidad que se obtiene al observar la frecuencia o el número de veces que se repite un evento,
en relación con el total de oportunidades o ensayos que se realizan.
Ejemplo
Si lanzamos una moneda 100 veces y sale cara 60 veces, la probabilidad frecuencial de que salga cara es
60/100 = 0.6.
1.53.2 Matemática
Es la probabilidad que se deduce a partir de principios lógicos y reglas matemáticas, sin necesidad de
realizar experimentos o ensayos. Se basa en el concepto de espacio muestral, que es el conjunto de todos
los posibles resultados de un experimento.
Ejemplo
Si lanzamos un dado, el espacio muestral es {1, 2, 3, 4, 5, 6}, y la probabilidad matemática de que salga
un número par es 3/6 = 0.5.
1.53.3 Binomial
Es un caso especial de probabilidad matemática, en el que el experimento solo tiene dos posibles
resultados: éxito o fracaso. Se utiliza cuando se realizan varios ensayos independientes y con la misma
probabilidad de éxito.
Ejemplo
Si lanzamos una moneda 10 veces, la probabilidad binomial de que salga cara 5 veces es
56
Unidad I, II, III
Estadística Descriptiva
1.53.4 Objetiva
Es la probabilidad que se basa en hechos o datos conocidos y verificables, que permiten estimar la
ocurrencia de un evento. Se suele expresar como una proporción o un porcentaje.
Ejemplo
Si sabemos que en una población hay 40% de hombres y 60% de mujeres, la probabilidad objetiva de que
al elegir una persona al azar sea mujer es 0.6 o 60%.
1.53.5 Subjetiva
Es la probabilidad que se basa en opiniones, creencias o intuiciones personales, que no se pueden
comprobar ni medir con exactitud. Depende de la información o la experiencia que tenga cada individuo
sobre el evento.
Ejemplo
Si alguien cree que tiene más posibilidades de ganar la lotería que de ser atropellado por un coche, esa es
su probabilidad subjetiva, pero no tiene que coincidir con la realidad.
1.53.6 Hipergeométrica
Es la probabilidad que se calcula cuando se extraen elementos de una población sin reemplazo, es decir,
que cada elemento que se extrae se descarta y no se vuelve a considerar.
Ejemplo
Si tenemos una urna con 10 bolas, 6 blancas y 4 negras, y extraemos 3 bolas sin reemplazarlas, la
probabilidad hipergeométrica de que las 3 sean blancas es
Ejemplo
57
Unidad I, II, III
Estadística Descriptiva
Si vemos que todos los cisnes que hemos observado son blancos, podemos asignar una alta probabilidad
lógica a que todos los cisnes sean blancos, aunque no podamos asegurarlo con certeza.
Las permutaciones y combinaciones son conceptos fundamentales en combinatoria, una rama de las
matemáticas que se ocupa de contar y organizar elementos en conjuntos. Ambos conceptos se utilizan
para calcular el número de formas distintas en que se pueden organizar o seleccionar elementos de un
conjunto.
1.55 Permutaciones:
Las permutaciones se refieren a la disposición ordenada de los elementos de un conjunto, donde el orden
de los elementos es crucial. Este proceso implica organizar los elementos de manera única, teniendo en
cuenta su posición. Es importante destacar que en las permutaciones no se permiten repeticiones, y cada
consideración de repeticiones afecta el número total de maneras en que se pueden organizar los
elementos.
Una permutación lineal implica organizar los elementos en una línea recta. Cada disposición única
58
Unidad I, II, III
Estadística Descriptiva
1.56.4 Permutación Circular
cualquier disposición que pueda obtenerse mediante rotaciones del círculo. Cada disposición única
1.57 Combinaciones:
el orden. Es decir, en las combinaciones, el orden de los elementos no importa; lo que importa es
pueden tener repeticiones de elementos, ya que el enfoque está en la elección sin considerar el orden.
cuenta el orden. En otras palabras, el arreglo de los elementos no importa; solo se trata de elegir un
1.59 Fórmulas
1.59.1 Permutaciones:
59
Unidad I, II, III
Estadística Descriptiva
n!
Permutación Simple nPr=
( n−r ) !
n!
Permutación Con Repetición Pr ( n )=
k1 ∙ k2 ∙ … kn !
1.59.2 Combinaciones:
()
n!
C n= n =
r
Combinación Simple
r r ! ∙ ( n−r ) !
( n+r−1 ) !
Combinación con Repetición
(
CR rn= n+r −1 =
r )
r ! ( n−1 ) !
1.60.1 Ejemplo 1:
1.60.2 Ejemplo 2:
¿De cuántas formas se pueden escoger dos letras del conjunto {A, B, C, D} sin importar el orden?
Solución: En este caso, se trata de una combinación de 4 elementos tomados de 2 en 2, es decir, C(4,2).
Aplicando la fórmula, tenemos que:
4! 4! 24
P ( 4 ,2 ) = = = =6
2 ! ( 4−2 ) ! 2 ! 2! 4
60
Unidad I, II, III
Estadística Descriptiva
Por lo tanto, hay 6 formas de escoger dos letras del conjunto {A, B, C, D} sin importar el orden. Estas
son: AB, AC, AD, BC, BD y CD.
1.60.3 Ejercicio 1:
1.60.4 Ejercicio 2:
¿De cuántas formas se pueden escoger tres letras de la palabra COPA sin importar el orden?
Solución: En este caso, se trata de una combinación de 4 elementos tomados de 3 en 3, es decir, C(4,3).
Aplicando la fórmula, tenemos que:
4! 4! 24
P ( 4 ,3 )= = = =4
3 ! ( 4−3 ) ! 3 ! 1 ! 6
Por lo tanto, hay 4 formas de escoger tres letras de la palabra COPA sin importar el orden. Estas son:
COP, COA, CPA y OPA.
61
Unidad I, II, III
Estadística Descriptiva
1.62 Distribución Discreta:
Una distribución discreta describe las probabilidades asociadas con los posibles valores de una variable
aleatoria discreta, que son valores contables, como enteros no negativos. Cada valor de la variable
aleatoria discreta tiene asignada una probabilidad no nula, lo que se representa de manera tabular en
una distribución de probabilidad discreta.
Uniforme discreta
Binomial
Hipergeométrica
Geométrica
Binomial negativa
Pascal
Poisson
Una distribución continua describe las probabilidades de los valores posibles de una variable aleatoria
continua. En el caso de variables aleatorias continuas, cuyo conjunto de valores posibles es infinito y no
contable, las probabilidades se definen como áreas bajo la curva de su función de densidad de
probabilidad (PDF). En este contexto, la probabilidad de que la variable aleatoria continua sea igual a un
valor específico es siempre cero, y las probabilidades se asocian con rangos de valores en lugar de valores
individuales.
62
Unidad I, II, III
Estadística Descriptiva
1.64 Cuadro comparativo
Modela el número de
Número fijo de Experimentos con
éxitos en una cantidad fija
ensayos resultados binarios, como
Binomial de ensayos independientes,
independientes con lanzar una moneda varias
con probabilidades
dos resultados. veces.
constantes.
Modela la probabilidad de
Muestreo sin Muestreo en poblaciones
obtener cierto número de
Hipergeométrica reemplazo, con éxito finitas, donde cada
éxitos en una muestra sin
y fracaso. resultado es exclusivo.
reemplazo.
Modela el número de
Número de ensayos Situaciones donde se
ensayos necesarios para
Binomial hasta obtener un repiten ensayos hasta que
obtener un número fijo de
Negativa número fijo de se alcanza un número fijo
éxitos en una secuencia de
éxitos. de éxitos.
ensayos.
63
Unidad I, II, III
Estadística Descriptiva
Similar a la binomial Modelar el número de
Número de ensayos
negativa, pero generaliza a ensayos necesarios para
hasta obtener un
Pascal casos donde se obtienen alcanzar un cierto número
número fijo de
éxitos después de varios de éxitos en una
éxitos.
intentos. secuencia.
Modela la probabilidad de
Aplicaciones en teoría de
un número fijo de eventos Número de eventos
colas, eventos raros como
Poisson en un intervalo dado, en un intervalo de
llamadas a una central
cuando los eventos son tiempo o espacio.
telefónica en un minuto.
raros.
Distribuciones
Definición Características Aplicación
Continuas
Modelar situaciones
Todos los puntos en el Igual probabilidad
Uniforme o donde cada punto en el
intervalo tienen la misma para todos los puntos
Rectangular intervalo es igualmente
densidad de probabilidad. en un intervalo.
probable.
Ampliamente utilizada en
Distribución simétrica que estadística y ciencias,
Simetría, campana de
Normal describe muchos fenómenos modelando datos como
Gauss.
naturales. alturas, IQ, errores de
medición.
64
Unidad I, II, III
Estadística Descriptiva
Utilizada para estimar la Relacionada con la Pruebas de hipótesis y
media de una población normal, pero adecuada estimación de parámetros
t de Student
cuando la desviación para muestras poblacionales con
estándar es desconocida. pequeñas. muestras pequeñas.
Cociente de dos
Utilizada en análisis de variables con Comparación de varianzas
F de Snedecor
varianza y regresión. distribución chi- en análisis estadístico.
cuadrado.
Ampliamente utilizado en
Puede describir diferentes Modela tiempos de
ingeniería para analizar
Weibull patrones de fallo en la vida vida o duración hasta
tiempos de vida y
de un producto. un evento.
fiabilidad de sistemas.
Aplicaciones en
Describe fenómenos donde economía, ciencias
algunos valores son Distribución de cola sociales y finanzas,
Pareto
significativamente mayores larga, eventos raros. modelando la distribución
que otros. de riqueza y eventos
extremos.
65
Unidad I, II, III
Estadística Descriptiva
expertos.
1.65 Ejemplificación
Ejercicio 1:
Suponga que los accidentes en una cierta calle siguen un proceso de poisson con una tasa de 2 accidentes
por semana.
a) λ=2
b) λ=4
a. P ( x=5 )=¿
b. P ( x ≤ 3 )=¿
66
Unidad I, II, III
Estadística Descriptiva
Ejercicio 2:
Supongo que un proceso de control de calidad se inspecciona un lote de 10 artículos, de los cuales cuatro
son defectuosos. sí se eligen 5 artículos al azar y sin reemplazo.
a) calcule la probabilidad de elegir dos artículos defectuosos.
P= ( x =2 )
b) calcule la probabilidad de elegir a lo más dos artículos defectuosos.
P= ( x ≤ 2 )
N=10
M =4
n=5
67
Unidad I, II, III
Estadística Descriptiva
68