Semana 3 Parte 1 Estadísitica y Probabilidad AR y BR
Semana 3 Parte 1 Estadísitica y Probabilidad AR y BR
Semana 3 Parte 1 Estadísitica y Probabilidad AR y BR
DEPARTAMENTO DE MATEMÁTICAS
Asignatura: Estadística y Probabilidad
Tema Medidas de Dispersión, Medidas de Ubicación
Docente: Carolina Vargas Contreras
Fecha: Semana 3 Parte 1 Primer Corte Grupos: AR, BR
MEDIDAS DE DISPERSIÓN
Parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética. Sirven
como indicador de la variabilidad de los datos; ya que una excesiva variabilidad o dispersión en los datos
indica la inestabilidad del proceso en análisis en la mayoría de los casos.
Las medidas de dispersión más utilizadas son el rango, la desviación estándar, la varianza y el coeficiente
de variación
➢ Rango o recorrido: Es la diferencia entre el valor más grande y el más pequeño del conjunto de
datos.
Ejemplo: Se han tomado como muestras las mediciones de la resistencia a la tensión de la soldadura
usada para unir dos cables, estas son: 87.3kg, 82.4, 78.5 , 78.0, 90.0, 86.5, 77.9, 93.4, 73.9, determine
su rango o recorrido.
Solución
𝑅𝑎𝑛𝑔𝑜 = 93,4 − 73,9 = 19,5 𝐾𝑔
2
∑(𝑋𝑖 − 𝑋̅)2
𝑆 =
𝑛−1
➢ Desviación Estándar: La desviación estándar mide el grado de dispersión de los datos con
respecto a la media, se denota como 𝑆 para una muestra o como 𝝈 para la población. Se define
como la raiz cuadrada de la varianza según la expresión:
∑(𝑋𝑖 −𝜇 )2
- Desviación estándar de la población 𝜎=√
𝑁
∑(𝑋𝑖 −𝑋̅)2
- Desviación estándar de la muestra 𝑆=√ 𝑛−1
Ejemplo 1: Dos compañías, A y B; venden bolsas de café instantáneo de 12 onzas. Se seleccionaron
aleatoriamente 5 sobres de cada compañía disponibles en el mercado, y se pesó cuidadosamente su
contenido, con los siguientes resultados.
Determine:
Solución: primero se determina la media en cada caso, luego se aplica la fórmula de la desviación estándar
para la muestra.
Compañía A Compañía B
12,02 + 12,08 + 11,99 + 11,96 + 11,98 12,40 + 12,21 + 12,36 + 12,22 + 12,27
𝑋̅𝐴 = 𝑋̅𝐵 =
5 5
60,03 61,46
𝑋̅𝐴 = 𝑋̅𝐵 =
5 5
Desviación Típica
0,00872 0,02868
𝑆𝐴 = √ = 0,0467 𝑆𝐵 = √ = 0,0847
5−1 5−1
1. . 𝐶𝑜𝑚𝑜 𝑋̅𝐵 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 𝑋̅𝐴 𝑠𝑒 𝑖𝑛𝑓𝑖𝑒𝑟𝑒 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑜𝑚𝑝𝑎ñí𝑎 𝐵 𝑚𝑢𝑦 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒
Solución: para calcular los datos solicitados completamos la tabla como se explicó en frecuencias de
datos agrupados, hay que añadirle dos columnas más, pero primero se debe calcular la media aritmética.
∑ 𝑓𝑋 585,5
Recuerda: 𝑋̅ = 𝑛 = 40 = 14,64 𝑘𝑔 El peso promedio de los niños entre 2 y 4 años es de 14,64 𝑘𝑔
∑ 𝑓∗(𝑋 −𝑋̅ )2
𝑆2 = ∑ 𝑓 ∗ (𝑋 − 𝑋̅)2
𝑛−1 𝑆=√
𝑛−1
17,944 17,944
𝑆2 = 𝑆 = √ 40−1
40 − 1
𝑆 2 = 0,46 𝑆 = 0,68
𝑆
𝐶𝑣 = ̅ ∗ 100
𝑋
Ejemplo 3: Una empresa fabrica bombillas eléctricas en dos tipos A y B. Con base en muestras
de producción se sabe que las distribuciones de la duración en horas de esas bombillas son:
A B
̅̅̅
𝑋𝐴 = 800 ̅̅̅̅
𝑋𝐵 = 650
𝑆𝐴 = √7800 𝑆𝐵 = √5400
𝑆𝐴 = 88,32 𝑆𝐵 = 73,48
88,32 73,48
𝐶𝑣𝐴 = ∗ 100 𝐶𝑣𝐵 = ∗ 100
800 650
1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,7 2,17 2,52 2,11 1,86 1,9 1,68 1,51
1,64 0,72 1,69 1,85 1,82 1,79 2,46 1,88 2,08 1,67
1,31 1,93 1,4 1,64 2,09 1,75 1,62 2,37 1,75 1,69
Cuartiles
Se definen los cuartiles como los valores que dividen a la distribución de valores ordenados en
cuatro partes iguales. Son los siguientes:
𝑄1: primer cuartil. Tiene el 25% de los datos detrás de él y el 75% delante.
𝑄2 segundo cuartil. Coincide con la mediana 𝑀𝑑. Tiene el 50% de los datos delante y el
otro 50% detrás de él.
𝑄3 : deja detrás de él el 75% de la distribución y delante el 25%.
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, 𝑎𝑙 20% … 𝑦 𝑎𝑙 90% de los datos.
El quinto decil coincide con la mediana: 𝐷5 = 𝑀𝑑 . Pero también, coincide con el segundo cuartil:
𝑄2 = 𝑀𝑑 .
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%… y al 99% de los datos
Para hallar las medidas de ubicación en datos no agrupados primero ordeno los datos de
menor a mayor y luego aplico la siguiente fórmula:
𝑛∗𝑘
1. Cuando n es par 𝑞
(𝑛+1)∗𝑘
2. Cuando n es impar 𝑞
Fórmula 1 Fórmula 2
𝒏 𝒆𝒔 𝒑𝒂𝒓 𝒏 𝒆𝒔 𝒊𝒎𝒑𝒂𝒓
𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el cuartil 𝑄: Si halla el cuartil 𝑄:
4 4
𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el decil 𝐷: 10
Si halla el decil 𝐷: 10
𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el percentil 𝑃: Si halla el percentil 𝑃:
100 100
Si el resultado da un número decimal lo aproxima a un entero y ese resultado indica la posición
de la medida de ubicación; en ocasiones hay que interpolar.
Datos no agrupados
Ejemplo No 1
Los siguientes datos expresan los puntajes obtenidos en una prueba de admisión:
16 10 4 8 12 10 8 20 4 13 12 22 16 26 20
4 4 8 8 10 10 12 12 13 16 16 20 20 22 26
a)
• Primer cuartil 𝑛 = 15; como n es impar aplico la fórmula 2.
𝑄1
(𝑛+1)∗𝑘 (15+1)∗1
= = 4 el 4 indica la posición donde se encuentra el primer cuartil, 𝑄1 = 8
𝑞 4
• Tercer cuartil
𝑄3
(𝑛+1)∗𝑘 (15+1)∗3
= = 12 el 12 indica la posición donde se encuentra el tercer cuartil, 𝑄3 = 20
𝑞 4
𝐷4 = 10,8
• Sexto decil
𝐷6
(𝑛+1)∗𝑘 (15+1)∗6
= = 9,6 La posición 9,6 debe estar entre la novena y la décima posición, siendo
𝑞 10
el valor de 13 la novena posición y la diferencia entre la décima y novena es 16 − 13 = 3 este
resultado se multiplica por la fracción 0.6 y se lo agregamos al valor anterior de 13. (Interpolar)
𝐷6 = 14,8
Concluir: El 60% de los estudiantes obtuvieron hasta 14,8 puntos en la prueba de admisión.
• Percentil 30
𝑃30
(𝑛+1)∗𝑘 (15+1)∗30
𝑞
= 100
= 4,8 La posición 4,8 debe estar entre la cuarta y la quinta posición, siendo
el valor de 8 la cuarta posición y la diferencia entre la quinta y cuarta es 10 − 8 = 2 este
resultado se multiplica por la fracción 0.8 y se lo agregamos al valor anterior de 8. (Interpolar)
• Percentil 90
𝑃90
(𝑛+1)∗𝑘 (15+1)∗90
= = 14,4
𝑞 100
𝑛∗𝑘
− ∑ 𝑓𝑎
𝑞
𝑈 = 𝐿𝑖 + ( )∗𝐴
𝑓𝑛∗𝑘
𝑞
𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑛∗𝑘
𝑖𝑛𝑑𝑖𝑐𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑢𝑏𝑖𝑐𝑎𝑐𝑖ó𝑛 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟
𝑞
𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑
Ejemplo No 2 : Los siguientes datos indican el peso en kilogramos de cuarenta niños entre los
2 y 4 años de edad.
13,9 14,7 13,7 15,6 14,3 14,9 15 16,1 15 14,2 14,4 15,8 13,3 14 14 15,8 13,9 14,7 13,3 14,5
15,1 14,5 15,3 13,9 14,3 15 16 14,7 14 14,8 16,1 14,3 15,3 15 14 15,4 14,7 14,2 14,5 14,8
I.
II.
𝑎) 𝑄1 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑛 ∗ 𝑘 40 ∗ 1
= = 10 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 4
𝑛∗𝑘
∑
𝑞 − 𝑓𝑎
𝑈 = 𝐿𝑖 + ( )∗𝐴
𝑓𝑛∗𝑘
𝑞
10 − 3
𝑄1 = 13,81 + ( ) ∗ (0,5)
11
𝑄1 = 14,13 kg
Conclusión: El 25% de los niños entre dos y cuatro años tienen un peso de hasta 14,13 𝑘𝑔
𝑏) 𝐷5 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑛 ∗ 𝑘 40 ∗ 5
= = 20 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 10
20 − 14
𝐷5 = 14,31 + ( ) ∗ (0,5)
12
𝐷5 = 14,56 kg
Conclusión: El 50% de los niños entre dos y cuatro años tienen un peso de hasta 14,56 𝑘𝑔
𝑐) 𝑃92 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑛 ∗ 𝑘 40 ∗ 92
= = 36,8 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 100
36,8 − 33
𝑃92 = 15,31 + ( ) ∗ (0,5)
4
𝑃92 = 15,79 kg
Conclusión: El 92% de los niños entre dos y cuatro años tienen un peso de hasta 15,79 𝑘𝑔
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro
de este rango es marcado e identificado individualmente
EJEMPLO: DISTRIBUCIÓN DE EDADES
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
ORDENAR LOS DATOS Para calcular los parámetros estadístico, lo primero es ordenar la
distribución
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
CALCULO DE CUARTILES
𝑄1
𝑛∗𝑘 20∗1
= = 5; el 5 indica la posición donde se encuentra el primer cuartil, 𝑄1 = 24
4 4
𝑛 20 𝑛∗𝑘 20∗2
Como = = 10 ; = = 10
2 2 4 4
𝑛+1 20+1 10
Mediana = = 10,5
2 2 11
(33 + 34)
𝑀𝑑 = 𝑄2 = = 33,5
2
𝑄3 ,
𝑛∗𝑘 20∗3 60
= = = 15; el 15 indica la posición donde se encuentra el tercer cuartil, 𝑄3 = 39
4 4 4
Dato menor 20
Primer Cuartil 24
Tercer cuartil 39
Dato mayor 45
El bigote de la izquierda ( Xmín, 𝑄1)es más corto que el de la derecha; por ello el 25% de los más
jóvenes están más concentrados que el 25% de los mayores.
1. Los siguientes datos expresan los pesos en kg de niños entre los 4 y 6 años con
problemas de sobrepeso.
33,5 57,1 49,7 40,2 44,2 45,2 47,8 38,0 53,9 41,1 41,7 40,8 41,7 55,5 43,5 49,9
𝑎) 𝑄2 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
Halla 𝑏) 𝐷6 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑐) 𝑃89 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
d)) Representa los datos en un diagrama de caja
𝑎) 𝑄3 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
Halla 𝑏) 𝐷2 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑐) 𝑃3 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎