TAREA3PROB
TAREA3PROB
TAREA3PROB
Desarrollo de la Actividad
Datos discretos y continuos
14. El conjunto de datos adjunto se compone de observaciones del flujo de una regadera (L/min) para
una muestra de 𝒏 = 𝟏𝟐𝟗 casas en Perth, Australia (“An Application of Bayes Methodology to the
Analysis of Diary Records in a Water Use Study”, J. Amer. Stat. Assoc., 1987: 705-711):
Ordenando los datos para tener más facilidad para hacer el grafico de tallos y hojas:
2,2 2,3 3,2 3,3 3,4 3,4 3,5 3,6 3,7 3,7
3,8 3,9 4 4,1 4,3 4,5 4,6 4,8 4,8 4,9
5 5 5 5 5,1 5,1 5,1 5,4 5,4 5,5
5,5 5,6 5,6 5,6 5,7 5,8 5,9 6 6 6
6 6,1 6,2 6,2 6,2 6,2 6,3 6,3 6,4 6,4
6,4 6,5 6,6 6,6 6,6 6,7 6,7 6,8 6,9 6,9
6,9 6,9 7 7 7 7,1 7,2 7,2 7,3 7,3
7,4 7,5 7,5 7,5 7,5 7,5 7,6 7,6 7,8 8
8,2 8,2 8,3 8,3 8,4 8,4 8,8 9 9,1 9,2
9,2 9,3 9,3 9,3 9,3 9,5 9,6 9,6 9,6 9,7
9,8 9,8 10,2 10,3 10,4 10,4 10,4 10,5 10,5 10,6
10,8 10,8 11,2 11,3 11,3 11,5 11,9 11,9 11,9 12,3
12,7 13,8 14,3 14,6 15 15 15,3 15,5 18,9
Universidad Politécnica Salesiana- Sede Cuenca
2 2 3
3 2 3 4 4 5 6 7 7 8 9
4 |0 1 3 5 6 8 8 9
5 0 0 0 0 1 1 1 4 4 5 5 6 6 6 7 8 9
6 0 0 0 0 1 2 2 2 2 3 3 4 4 4 5 6 6 6 7 7 8 9 9 9 9
7 |0 0 0 1 2 2 3 3 4 5 5 5 5 5 6 6 8
8 0 2 2 3 3 4 4 8
9 0 1 2 2 3 3 3 3 5 6 6 6 7 8 8
10 2 3 4 4 4 5 5 6 8 8
11| 2 3 3 5 9 9 9
12 3 7
13 8
14| 3 6
15 0 0 3 5
18 9
Velocidad de flujo o gastos representativo es de 6(L/min) ya que, si se observa la gráfica, es la que más
valores presenta.
Aparentemente es simétrica, pero si se observa con detenimiento, entre algunos valores existe un salto
brusco, por lo cual se puede determinar que es una distribución asimétrica.
e. ¿Describiría alguna observación como alejada del resto de los datos (un valor extremo)?
Los datos no están tan alejados, con excepción del 18.9, que es el mas alejado.
Medidas de variabilidad
48. El ejercicio 34 presentó los siguientes datos sobre concentración de endotoxina en polvo asentado
obtenidos con una muestra de casas urbanas y una muestra de casas campestres:
∑(𝑥𝑖 )2
𝑆 2 = ∑ 𝑥𝑖2 −
𝑛
Muestra urbana
(237)2
𝑆𝑈2 = 10079 − = 4972.73
11
Desviación estándar
𝑆𝑈2 4972.73
𝑆𝑈 = √ =√ = 22.2996
𝑛−1 11 − 1
Muestra campestre
(128.4)2
𝑆𝐶2 = 1617.94 − = 518.83
15
𝑆2 518.83
𝑆𝐶 = √ 𝐶 = √ = 6.0876
𝑛−1 15 − 1
b. Calcule la dispersión de los cuartos de cada muestra y compare. ¿las dispersiones de os cuartos
transmiten el mismo mensaje sobre la variabilidad que las desviaciones estándar?
U: 4.0 5.0 5.0 6.0 11.0 17.0 18.0 23.0 33.0 35.0 80.0
5.0 + 6.0
𝐶𝑢𝑎𝑟𝑡𝑜 𝑈1 = = 5.5
2
23.0 + 33.0
𝐶𝑢𝑎𝑟𝑡𝑜 𝑈2 = = 28
2
Ahora: 28.0-5.5=22.5
C: 0.3 2.0 3.0 4.0 4.0 5.0 8.0 8.9 9.0 9.0 9.2 11.0 14.0 20.0 21.0
4.0 + 4.0
𝐶𝑢𝑎𝑟𝑡𝑜 𝐶1 = = 4.0
2
9.2 + 11.0
𝐶𝑢𝑎𝑟𝑡𝑜 𝐶2 = = 10.1
2
Resolviendo: 10.1-4.0=6.0
En este caso los cuartos se parecen al cálculo de la desviación estándar en las dos muestras.
∑ 𝑋𝑖
𝑋̅ =
𝑛
34.0 + 49.0 + 13.0 + 33.0 + 24.0 + 24.0 + 35.0 + 104.0 + 34.0 + 40.0 + 38.0 + 1.0
𝑋̅𝑈3 = = 35.66
12
𝑋̅𝑈3 = 35.66
∑(𝑋 − 𝑋̅)2
𝑆2 =
𝑛−1
(34.0 − 35.66)2 + (13.0 − 35.66)2 + (33.0 − 35.66)2 + (24.0 − 35.66)2 + (24.0 − 35.66)2
+(35.0 − 35.66)2 + (104.0 − 35.66)2 + (34.0 − 35.66)2 + (40.0 − 35.66)2 + (38.0 − 35.66)2
+(1.0 − 35.66)2
𝑆2 =
12 − 1
6694.3916
𝑆2 = 11
= 608.58
𝑆 = √608.58
𝑆𝑈 = 24.66
2.0 + 64.0 + 6.0 + 17.0 + 35.0 + 11.0 + 17.0 + 13.0 + 5.0 + 27.0 + 23.0 + 28.0
𝑋̅𝐶2 = +10.0 + 13.0 + 0.2
15
271.2
𝑋̅𝐶2 = = 18.08
15
∑(𝑋 − 𝑋̅)2
𝑆2 =
𝑛−1
(2.0 − 18.08)2 + (64.0 − 18.08)2 +(6.0 − 18.08)2 + (17.0 − 18.08)2 + (35.0 − 18.08)2
+(11.0 − 18.08)2 + (17.0 − 18.08)2 + (13.0 − 18.08)2
+(5.0 − 18.08)2 + (27.0 − 18.08)2 + (23.0 − 18.08)2 + (28.0 − 18.08)2
+(10.0 − 18.08)2 + (13.0 − 18.08)2 + (0.2 − 18.08)2
𝑆2 =
15 − 1
3661.74
𝑆2 = = 261.55
14
𝑆 = 16.1726
Construya una gráfica de caja comparativa (como se hizo en el artículo citado) y compare y contraste las
cuatro muestras
𝑆𝑈 = 22.2996
𝑆𝐶 = 6.0876
𝑆𝑈 = 24.66
𝑆 = 16.1726
Distribuciones empíricas
6.4.7 Determine la función de distribución empírica basada en los siguientes datos muestrales.
Basándose en la fda empírica, determine la mediana muestral, el primer y tercer cuartil y el intervalo
intercuartílico. ¿Cuál es su estimación de F (2)?
𝑛 = 20
𝒏+𝟏
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 =
𝟐
20 + 1
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = 10.5 ∴ 𝑙𝑎 𝑚𝑒𝑖𝑎𝑛𝑎 𝑠𝑒𝑟á 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖ó𝑛 10 𝑦 11.
2
Reemplazando valores de x(10) y x(11):
−0.03 + 0
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = = −0.015
2
𝒏+𝟏
𝑷𝒓𝒊𝒎𝒆𝒓 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 =
𝟒
20 + 1 21
𝑃𝑟𝑖𝑚𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = = = 5.25 ≈ 𝑥(5)
4 4
𝑃𝑟𝑖𝑚𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = −1.28
𝟑(𝒏 + 𝟏)
𝑻𝒆𝒓𝒄𝒆𝒓 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 =
𝟒
3(20 + 1) 3(21) 63
𝑇𝑒𝑟𝑐𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = = = = 15.75 ≈ 𝑥(16)
4 4 4
𝑇𝑒𝑟𝑐𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = 1.06
𝑹𝑰𝑪 = 𝒙𝟑 − 𝒙𝟏
𝑅𝐼𝐶 = −1.28 − 1.06 = −2.34
X(1) -1,42
X(2) -1,35
X(3) -1,34
X(4) -1,29
X(5) -1,28 Primer cuartil
X(6) -1,02
X(7) -0,58
X(8) -0,35
X(9) -0,24
X(10) -0,03 Mediana entre 10 y 11
X(11) 0
X(12) 0,38
X(13) 0,4
X(14) 0,44
X(15) 0,98
X(16) 1,06 Tercer cuartil
X(17) 1,06
X(18) 1,36
X(19) 2,05
X(20) 2,13