Ejercicios Resueltos Estadistica Descriptiva CBS
Ejercicios Resueltos Estadistica Descriptiva CBS
Ejercicios Resueltos Estadistica Descriptiva CBS
PROBLEMA 1
Cierta empresa realizó un estudio para poder aplicar un producto que consiste en una pasta
flexible cementicia, para reparar defectos en los muros de concreto. El fabricante advierte
que se debe aplicar cuando la temperatura se encuentre entre 5°C y 30°C y la humedad
relativa del aire debe ser menor a 81%. De los ensayos realizados con la pasta, en diferentes
días, se tomó una muestra y se obtuvieron los siguientes resultados sobre la temperatura y 1
la humedad:
a) Según la información proporcionada. ¿Se puede afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior
al 40% que en los ensayos con humedad relativa de por lo menos 40%?
b) ¿En qué porcentaje de los ensayos en que se aplicó el producto, no estaban las
condiciones que indica el fabricante?
c) A consecuencia del cambio climático, se espera que la humedad relativa del aire
aumente en un 4%. Usando propiedades. ¿Cuál será la nueva humedad relativa
promedio y su desviación típica?
SOLUCIÓN 1-A
Datos
Sea:
X: Temperatura, cuando la humedad relativa es inferior al 40%, en °C.
Es conveniente realizar una tabla que contenga los parámetros específicos que se van a
analizar, como se expone a continuación.
Es por esto, que para realizar un análisis comparativo en cuanto a la dispersión entre ambas
frecuencias absolutas asociadas a la variable Temperatura, se estudiará el coeficiente de
variación, el cual se obtiene a partir de la ecuación (1)
𝑠(𝑥)
𝐶. 𝑉(𝑥) = (1)
𝑥
Así, los coeficientes de variación estarán dados de la siguiente forma:
𝑠(𝑥) 5,547
→ 𝐶. 𝑉(𝑥) = = = 0,261 → 26,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥 21,248
𝑠(𝑦) 6,433
→ 𝐶. 𝑉(𝑦) = = = 0,466 → 46,6% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑦 13,800
Conclusión
A partir del análisis del coeficiente de variación, es posible afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior al 40%
que en los ensayos con humedad relativa de por lo menos 40%. Esto se justifica, debido a
que 𝐶. 𝑉(𝑦) < 𝐶. 𝑉(𝑦)
SOLUCIÓN 1-B
𝑛∙𝑘
𝑎𝑖 ∙ ( 100 − 𝑁𝑖−1 )
𝑃𝑘 = 𝑋𝑖−1 + (2)
𝑛𝑖
Dónde:
𝑃𝑘 : 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘
𝑋𝑖−1 : 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
𝑎𝑖 : 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
𝑛: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
3
𝑘: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑐𝑜𝑛𝑡𝑒𝑛𝑖𝑑𝑜𝑠 𝑑𝑒𝑠𝑑𝑒 𝑒𝑙 𝑐𝑜𝑚𝑖𝑒𝑛𝑧𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 ℎ𝑎𝑠𝑡𝑎
𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑑𝑜 (𝑃𝑘 )
𝑁𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣á𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á
𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
𝑛𝑖 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
Temperatura 𝒏𝒊 𝑵𝒊
3 - 8,4 9 9
8,4 – 13,8 13 22
13,8 – 19,2 23 45
19,2 – 24,6 24 69
24,6 – 30,0 21 90 = n
Tabla 3. Temperatura expuesta en intervalos, con sus respectivas frecuencias absolutas y acumuladas.
90 ∙ 𝑘
5,4 ∙ ( 100 − 0)
→ 𝑃𝑘 = 3 + → 𝑘 = 3,7%
9
Conclusión
En un 3,7% de los productos, NO estaban las condiciones que indica el fabricante.
SOLUCIÓN 1-C
Sea
H: Humedad relativa del aire, expresada en porcentaje.
𝐻`: Nueva humedad posterior al cambio climático.
En general, siendo “x” una variable cualquiera, y “a” y “b” constantes, se tienen las
siguientes propiedades del promedio y la desviación estándar. 4
Promedio
Desviación Estándar
Para efectos del ejercicio, es necesario definir matemáticamente la variable 𝐻`, lo cual se
expone a continuación.
4
𝐻` = 𝐻 + ∙ 𝐻 = 1,04 ⋅ 𝐻
100
Así, es posible relacionar la expresión 𝐻` = 1,04 ⋅ 𝐻 con la generalidad expuesta
anteriormente. Esto asociando la variable “x” con “H”, y por otro lado las constantes “a” y
“b” con los valores 1,04 y 0 respectivamente.
Conclusión
La nueva humedad relativa promedio dada por el cambio climático y su desviación típica,
están dados por 39,694% y 14,127 respectivamente.
PROBLEMA 2
La información siguiente corresponde a longitudes en milímetros de 36 piezas fabricadas
en un proceso:
Longitud Stem-and-Leaf Plot
n mínimo máximo ∑x ∑ x2
36 31,0 32,8 1152,6 36907,06
Tabla 4. Datos asociados a longitudes de piezas fabricadas en un proceso.
SOLUCIÓN
Según lo requerido en el enunciado es necesario obtener el promedio y la desviación
estándar de las 36 piezas fabricadas en el proceso. A continuación, se expone el cálculo de
dichos parámetros.
Promedio
∑ 𝑥 1152,6
𝑥= = = 32,017 [𝑚𝑚]
𝑛 36
Desviación Estándar Muestra
Con el fin de encontrar una ecuación más práctica, considerando la forma en que se
entregan los datos en el presente problema, se reducirá la fórmula de la varianza de la
siguiente forma.
𝑘 𝑘 𝑘
(𝑥𝑖 − 𝑥)2 1 1 2
𝑉(𝑥) = ∑ = ∙ ∑(𝑥𝑖 − 𝑥)2 = ∙ ∑(𝑥𝑖 2 − 2 ⋅ 𝑥𝑖 ⋅ 𝑥 + 𝑥 )
𝑛−1 𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ∑ 𝑥𝑖 ⋅ 𝑥 + ∑ 𝑥 )
𝑛−1 6
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1 𝑖=1
𝑘 𝑘
1 𝑛 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 ⋅ + 𝑥 ⋅ 𝑛)
𝑛−1 𝑛
𝑖=1 𝑖=1
𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ 𝑥 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
𝑘
1 2 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ +𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
2
∑𝑘𝑖=1 𝑥𝑖 2 − 𝑛 ∙ 𝑥
→ 𝑉(𝑥) = (4)
𝑛−1
Así, reemplazando los valores dados en la ecuación (4) se obtiene la varianza muestral.
36907,06 − 36 ∙ 32,0162
→ 𝑉(𝑥) = = 0,1767
36 − 1
Luego, se sabe que la desviación estándar se relaciona con la varianza, de la forma expuesta
en la ecuación (5)
Conclusión
A partir del gráfico de tallo y hoja, es posible afirmar que existen 2 piezas con longitud
inferior a 31,6 [mm] de un total de 36 piezas estudiadas.
PROBLEMA 3 7
Máquinas
Diámetro
A(%) B(%)
4,95 – 7,25 5,0 7,5
7,25 – 9,55 26,0 13,0
9,55 – 11,85 37,5 17,0
11,85 – 14,15 12,5 34,0
14,15 – 16,45 10,0 15,0
16,45 – 18,75 9,0 13,5
Total 100 100
Tabla 5. Representación del diámetro expresado en milímetros de cierto producto, en las máquinas A y B.
Máquina C
200
∑ 𝑥𝑖 = 2798,90
𝑖=1
200
∑ 𝑥𝑖2 = 40891,3
𝑖=1
a) Se cree que la distribución del diámetro de los productos fabricados por la máquina
C es más homogénea que en los productos fabricados por la máquina A. Analice la
aseveración utilizando medidas estadísticas adecuadas.
SOLUCIÓN 3 - A
Sea:
𝑥𝑖 : Diámetro de cierto producto en milímetros, provenientes de la máquina "𝑖" ,con 𝑖 =
𝑎, 𝑏, 𝑐
Observación
Para el caso de la desviación típica, se reemplazará en las ecuaciones (4) y (5), ya expuestas
en problemas anteriores.
∑ 𝑥𝑖 𝑐 2798,90
→ 𝑥𝑐 = = = 13,995 [𝑚𝑚]
𝑛 200
s(𝑥𝑐 ) 2,942
→ 𝐶. 𝑉(𝑥𝑐 ) = ∙ 100% = ∙ 100% = 21,02%
𝑥𝑐 13,995
Por otro lado, para calcular el coeficiente de variación de los productos provenientes de la
máquina A, se calculará el promedio y la desviación estándar directo de la calculadora, a
partir de la siguiente tabla.
Máquina A
𝒙𝒊 𝑛𝑖
6,1 10
8,4 52
10,7 75
13 25 9
15,3 20
17,6 18
Tabla 7. Representación de marcas de clase y distribución de frecuencias de productos provenientes de máquina A.
→ 𝑥𝐴 = 11,2405 [𝑚𝑚]
→ 𝑆(𝑥𝐴 ) = 3,0413[𝑚𝑚]
3,0413
→ 𝐶. 𝑉(𝑥𝐴 ) = ∙ 100% = 27,056%
11,2405
Conclusión
A partir del análisis de coeficientes de variación, se observa que 𝐶. 𝑉(𝑥𝐴 ) > 𝐶. 𝑉(𝑥𝐶 ). Según
lo anteriormente expuesto, es posible afirmar que los diámetros de ciertos productos
provenientes de la máquina C son más homogéneos que la distribución de diámetros de
productos provenientes de la máquina A.
SOLUCIÓN 3 – B
Sea:
En general, se sabe que al realizar un análisis comparativo entre dos o más distribuciones
de cierta variable, se cumple la siguiente relación:
→ 𝑥𝐵 = 12,4595
→ 𝑠(𝑥𝐵 ) = 3,26067
3,26067
→ % 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 = ∙ 100% = 26,17%
12,4595
𝑋`𝐵 = 𝑥𝐵 − 1,5
10
Así, aplicando propiedades del promedio y la desviación típica, se obtienen los siguientes
valores de dichos parámetros.
3,26067
% 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒𝑠𝑝𝑢é𝑠 𝑑𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 = ∙ 100% = 29,75%
10,9595
Conclusión
A partir del análisis del porcentaje de variabilidad, es posible afirmar que la distribución de
diámetros de productos provenientes de la máquina B posterior al ajuste realizado es más
heterogénea que la de los productos provenientes de la máquina B antes del ajuste.
SOLUCIÓN 3 – C
Sea:
𝑋𝑐! : Diámetro modificado, en milímetros, de productos provenientes de la máquina C.
Conclusión 11
Según las expresiones expuestas anteriormente, el valor correcto de la desviación
estándar del diámetro del producto proveniente de la máquina C corresponde a
2,985[mm]
PROBLEMA 4
Se ha realizado un estudio en una empresa dedicada al área de las telecomunicaciones,
conductividad y redes, para ello se evaluaron entre otras variables, tipo de redes (Y) y el
costo de los productos (X); medidas en una muestra de 100 productos de esta empresa, las
cuales se muestran en la siguiente tabla:
Si el costo del producto es inferior a 180 mil pesos, se obtiene una utilidad diaria de
$5000, si fluctúa entre 180 mil pesos y 400 mil pesos, la utilidad aumenta en un 15%
y si el costo es superior a 400 mil pesos, la utilidad inicial sólo en un 10%.
Determine la utilidad promedio por producto.
c) Para comparar los costos de los primeros productos, para redes de empresas, se
solicita otro estudio de una muestra de 28 productos del año anterior.
Informe de costos de productos de redes para empresas
Tallo Hoja Frecuencia
2 699 3
3 011155568 9
4 003567889 9
5 244459 6
6 1 1 12
Multiplicar ∙ 101
Compare la dispersión del costo entre los dos estudios realizados e indique cual se
comporta en forma más homogénea.
SOLUCIÓN 4 - A
Sea:
𝑋: Costo de los productos utilizados en una empresa de Telecomunicaciones, en miles de
pesos.
Observación
Es necesario notar que el estudio solicitado, se aplica exclusivamente a redes para edificios.
Es por esto que se realiza la siguiente tabla para facilitar dicho análisis.
Cálculo de Mediana
Variables Discretas
𝑥𝑛+1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
2
𝑀𝑒(𝑥) = { 𝑥𝑛 + 𝑥𝑛+1 (6)
2 2
, 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2
Variables Contínuas
13
𝑎𝑖 𝑛
𝑀𝑒(𝑥) = 𝑥𝑖−1 + ∙ ( − 𝑁𝑖−1 ) (7)
𝑛𝑖 2
Es importante denotar que las variables contenidas en la ecuación (7) coinciden con la de
cálculo de percentiles, expuesta en la ecuación (2). Esto se explica ya que la mediana de una
distribución de variable representa el dato ubicado en el centro de ésta, por lo que su valor
es equivalente al del percentil 50.
Así, calculamos la mediana del costo, a partir de la ecuación (7) debido a que esta variable
estudiada es de tipo contínua.
100 40
→ 𝑀𝑒(𝑥) = 𝑃50 = 300 + ∙ ( − 15)
12 2
Polígono de Frecuencias
14
SOLUCIÓN 4 – B
Sea:
Así, es necesario saber la cantidad de casas que se encuentra en cada intervalo de “X”. Es
por esto, que a continuación se calculará el porcentaje de datos concentrados hasta los
$180.000 en costo, con ayuda de la fórmula de percentiles, expuesta en la ecuación (2)
32 ∙ 𝑘
( 100 − 0)
→ 180 = 100 + 100 ∙
15
→ 𝑘 = 37,5%
Así, la utilidad promedio queda dada a partir de la ecuación (9), donde “X” corresponde a
una variable cuantitativa cualquiera.
𝑥̅ = ∑ 𝑥𝑖 ∙ ℎ𝑖 (9)
̅ = ∑ 𝑢𝑖 ∙ ℎ𝑖
→𝑈
Conclusión
La utilidad promedio obtenida por las ventas de redes para casas en la empresa de
Telecomunicaciones, corresponde a 5461 miles de pesos.
SOLUCIÓN 4 – C
Para facilitar el análisis comparativo, para el presente inciso se considerarán las siguientes
variables:
𝑠(𝑥1 ) 68,525
→ 𝐶. 𝑉(𝑋1 ) = = = 0,190 → 19% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥1
̅̅̅ 360,714
𝑠(𝑥2 ) 101,715
→ 𝐶. 𝑉(𝑋2 ) = = = 0,241 → 24,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥2
̅̅̅ 421,429
Observación
Los valores expuestos anteriormente pueden ser obtenidos directamente con la
calculadora, o bien “manualmente” a partir de las fórmulas de varianza (4) y promedio.
Conclusión
A partir del análisis de coeficiente de variación, es posible afirmar a partir de la evidencia
estadística que se dispone, que la variable asociada a la distribución de costos del presente
año es más homogénea que la asociada a los costos del año anterior.