Estadistica
Estadistica
Estadistica
1. En concordancia con los datos de la National Health and Nutrition Examination Survey, suponga que los pesos
de los hombres se distribuyen normalmente, con una media de 172 libras y una desviación estándar de 29
libras. Es decir, suponga que la población de peso de hombres se distribuye de manera normal con µ=172 libras
y σ=29 libras.
Calcule la probabilidad de que 20 hombres elegidos al azar tengan un peso medio mayor que 175 libras (de
manera que su peso total exceda la capacidad segura de 3500 libras).[CITATION Tri13 \p 290-291 \l 2058 ]
SOLUCION:
Al trabajar con una media de una muestra de 20 hombres, utilizamos el método del teorema del límite central. La población
original de hombres tiene una distribución normal, de manera que las muestras de cualquier tamaño producirán medias
distribuidas normalmente. Como estamos trabajando con una distribución de medias muéstrales, debemos utilizar los
parámetros µ x́ y σ x́ , que se evalúan de la siguiente manera.
Estadística
µ x́ =¿ µ=172 Mario F. Triola/ pág. 291
σ 29
σ x́ = = =6.4845971
√ n √ 20
Queremos calcular el área sombreada. Si utilizamos nuestra tabla Z, encontraremos la puntuación z
relevante, la cual se calcula de la siguiente manera:
x́−µ x́ 175−172 3
z= = = =0.46
σ x́ 29 6.4845971
√ 20
Si revisamos la tabla Z, encontramos que z=0.46 corresponde a un área izquierda acumulada de
0.6772.
De manera que la región sombreada es 1-0.6772= 0.3228.
La probabilidad de que 20 hombres tengan un peso medio mayor que 175 libras es de 0.3228.
Por lo que existe una probabilidad de 0.3228 de que 20 hombres tengan un peso medio mayor de 175 libras, como la
capacidad segura del taxi acuático es de 3500 libras, es muy probable que se sobre cargue si se transporta a 20 pasajeros,
por lo que no es suficientemente segura.
q^ =0.30
E=z α
y n=1501, sustituyendo valores nos queda:
2 √ n
con
z α =1.96
2
, ^p=0.70 ,
E=1.96
√ (0.70)(0.30)
1501
=0.023183
b) Construir el intervalo de confianza es bastante fácil ahora que tenemos los valores de ^p y E.
Simplemente sustituimos esos valores para obtener este resultado:
^p−E< p< ^p + E
0.70 – 0.023183 ¿ p ¿ 0.70 + 0.023183
0.677 ¿ p <0.723 (Redondeando a tres dígitos significativos)
ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
5. Un fabricante de papel tiene un proceso de producción que opera de manera continua a través de un turno
completo de producción. Se espera que el papel tenga una longitud media de 11 pulgadas y que la desviación
estándar de la longitud sea de 0.02 pulgadas. A intervalos periódicos, se selecciona una muestra para
determinar si la longitud media del papel sigue siendo igual a 11 pulgadas o si el proceso de producción ha
fallado y se registra un cambio en tal longitud. Usted selecciona una muestra aleatoria de 100 hojas y encuentra
que la longitud media del papel es de 10.998 pulgadas. Construya un estimador del intervalo de 95% de
confianza para la media poblacional de la longitud del papel. [ CITATION Dav141 \l 2058 ]
SOLUCION:
Utilizando
z ∝=1.96 para un 95% de confianza.
2
σ 0.02
x́ ± z ∝ =10.998 ±(1.96)
2 √n √ 100
=10.998 ± 0.0039
10.9941 ≤ µ ≤ 11.0019
Por consiguiente, usted concluye que la media poblacional esta entre 10.9941 y 11.0019 pulgadas con un 95% de confianza.
Dado que el intervalo incluye a 11, el valor indica que el proceso de producción esta funcionando adecuadamente y no hay
razón para creer que existe alguna falla en él
TAMAÑO DE LA MUESTRA
7. Suponga que desea estimar, con un 95% de confianza, la fuerza media poblacional requerida para romper el
aislante dentro de ±25 libras. Con base en un estudio realizado el año anterior, la desviación estándar es de 100
libras. Determine el tamaño de la muestra necesario. [ CITATION Dav \l 2058 ]
SOLUCION:
Utilizando E=25, σ =100 y
z ∝=1.96 para un 95% de confianza:
2
1.96
¿
¿
100
¿
2 ¿
zα
n=
[ ]2
σ
= ¿2
¿
2
E 25
¿
¿
¿2
¿
¿
Por lo tanto, debe seleccionar una muestra de 62 aislantes porque la regla general para determinar el tamaño de la muestra
dice que siempre se debe redondear al siguiente valor entero para satisfacer un poco más de lo necesario los criterios
deseados.
x́−µ 112.85−120
t ESTAD. = = =−1.1908
s 20.80
√n √ 12
Dado que -2.2010 ¿ t ESTAD. = -1.1908 ¿ 2.2010, no se rechaza Ho No tiene evidencia suficiente para concluir que el
monto medio por factura de ventas difiera de $120. La auditoría sugiere que el monto medio por factura de ventas no ha
cambiado.
x́−µ 6.034−6.03
t ESTAD. = = =1.414
s 0.02
√n √50
Puesto que t ESTAD . =1.414< 2.4049 , el valor p es 0.0818 ¿ 0.01, no se rechaza la hipótesis nula. No existe
evidencia suficiente para concluir que el peso medio poblacional sea mayor que 6.03 onzas.
SOLUCION:
Se utilizara el método del valor p para la prueba de hipótesis. Se estipularan que el grupo de bolsas de aire constituya la
muestra 1, y que el grupo sin bolsas de aire constituye la muestra 2.
La afirmación de que la tasa de mortalidad es menor para los que viajaban en vehículos con bolsas de aire se expresa con p 1
¿ p2.
Si p1 ¿ p2. Es falso, entonces p1 ≥ p´2.
Como nuestra afirmación no contiene igualdad, se convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de
igualdad, de manera que tenemos.
Ho: p1=p2 H1: p1 ¿ p2 (afirmación original)
Con un nivel de significancia es ∝=0.05 .
Utilizaremos la distribución normal como una aproximación de la distribución binomial. Estimamos el valor común de p 1 y p2
con la estimación de la muestra agrupada p, con espacios decimales adicionales para minimizar los errores de redondeo en
cálculos posteriores.
x 1+ x 2 41+ 42
ṕ= = =0.004347
n 1+ n2 11541 +9583
Con ṕ=0.004347 , se deduce que q́=1−0.004347=0.995653
Ahora podemos calcular el valor del estadístico de prueba.
41 52
z=
p 1− ^
(^ p 2 )− ( ^
p 1− ^
p2 )
=
( 11541 −
9853 )
−0
=−1.91
pq
´ pq´ ( 0.004347 ) ( 0.995653 ) ( 0.004347 )( 0.995653 )
√ +
n1 n 2 √ 11541
+
9853
c) El valor P es P (X2 ≥ 32.8). La tabla muestra que 0.025 < P < 0.05. Por lo que P = 0.0253.
PRUEBA JI-CUADRADA
14. En 200 lanzamientos de una moneda, se observaron 115 caras y 85 cruces. Probar la hipótesis de que la
moneda no está cargada con base en un nivel de significancia de:
a) 0.05, b) 0.01? , c) ¿Cuál es el valor p de la prueba?
La frecuencia observada de caras y cruces son X1=115, X2=85, respectivamente.
Las frecuencias esperadas de caras y cruces si la moneda no está cargada son np 1=100, np2=100,
respectivamente. En consecuencia.[ CITATION Mur131 \l 2058 ]
SOLUCION:
2 2 2 2
( x 1−np1 ) ( x 2−np2) (115−100) (85−100)
x 2= + = + =4.50
np1 np 2 100 100
Puesto que el número de categorías o clases (caras, cruces) es K=2, y v = k -1 = 2-1 = 1 .
a) El valor crítico X20.95 de 1 grado de libertad es 3.84. puesto que 4.50 ¿ 3.84, se rechaza la hipótesis de que la
moneda no está cargada a un nivel de significancia de 0.05.
b) El valor critico X20.99, de un grado de libertad es 6.63. Puesto que 4.50 <6.63, no se puede rechazar la hipótesis de
que la moneda no está cargada un nivel de significancia de 0.01.
Concluimos que los resultados observados son probablemente significativos y que la moneda esta probablemente
cargada.
c) El valor P es P (X2 ≥ 4.50). La tabla nos muestra que 0.025 < P < 0.05.Por medio de software de computadora.
P= 0.039.
15. La tabla muestra las frecuencias observadas y esperadas al lanzar un dado 120 veces: a) Probar la hipótesis
de que el dado no está cargado con el uso de un nivel de significancia de 0.05. b) Determinar el valor P de la
prueba. [ CITATION Mur132 \l 2058 ]
Cara 1 2 3 4 5 6
Frecuencias 25 17 15 23 24 16
observadas
Frecuencias 20 20 20 20 20 20
esperadas
SOLUCION:
a)
2 2 2 2 2 2
2 ( x 1−np1 ) ( x 2−np2) (x 3−np3 ) ( x 4 −np 4 ) (x 5−np 5) ( x6 −np6 )
x= + + + + +
np1 np 2 np3 np4 np5 np6
TABLAS DE CONTINGENCIA
16. La tabla muestra los números de estudiantes que fueron aprobados y reprobados por tres instructores: Sr. X,
Sr. Y y Sr. Z. Probar la hipótesis de que las proporciones de estudiantes que los tres instructores no aprobaron
son iguales. [ CITATION Mur133 \l 2058 ]
Frecuencias observadas
Sr. X Sr. Y Sr. Z TOTAL
Aprobados 50 47 56 153
Reprobados 5 14 8 27
TOTAL 55 61 64 180
SOLUCION:
Con base en la hipótesis Ho de que las proporciones de estudiantes no aprobados por los tres instructores son iguales,
hubieran reprobado 27/180=15% de los estudiantes y aprobado 85% de ellos. Las frecuencias esperadas con base en H o se
muestran a continuación.
2 2 2 2 2 2
2 (50−46.7) (47−51.85) (56−54.40) (5−8.25) (14−9.15) (8−9.60)
x= + + + + + =4.84
46.75 51.85 54.40 8.25 9.15 9.60
Frecuencias observadas bajo H0
Sr. X Sr. Y Sr. Z TOTAL
Aprobados 85% de 55= 46.75 85% de 61= 51.85 85% de 64=54.40 153
Reprobados 15% de 55=8.25 15% de 61=9.15 15% de 64=9.60 27
TOTAL 55 61 64 180
Para determinar el número de grados de libertad, observemos la siguiente tabla, que es igual a las anteriores excepto que
solo se muestran los totales. Es claro que se tiene la libertad de poner solo un numero en una celda vacía de la primera
columna y un número en cada celda vacía en la segunda o la tercera columna, después de lo cual los números de las celdas
restantes serán determinados de manera única a partir de los totales indicados. Por tanto, en este caso hay 2 grados de
libertad.
Como X20.95=5.99, no es posible rechazar H0 a un nivel de significancia de 0.05. No obstante, observamos que puesto que
X20.90=4.61, se puede rechazar Ho a un nivel de 0.10 si se está dispuesto a tomar el riesgo de 1 en 10 posibilidades de
equivocarse. El valor p de las frecuencias observadas es P (X2 ≥ 4.84)=0.089.
Control 50 65 72 46 38 29 70 85 72 40 57 59
25mg 49 47 30 602 62 60 19 28 56 62 55 40
50mg 20 59 64 61 28 47| 29 41 60 57 61 38
100mg 20 23 38 31 27 16 27 18 22 12 24 11
125mg 18 30 22 26 31 11 15 12 31 36 16 13
SOLUCION:
En este caso se quiere contrastar si el medicamento es efectivo y en qué dosis respecto al control observado. Por tanto, y
dado que se dispone de datos para diferentes tratamientos (en este caso 2 o más), es factible utilizar un análisis de la
varianza de un factor, contraste para la media de una variable continua normal en dos o más grupos, donde el factor es la
dosis, que contiene cinco clases o grupos o niveles, y la variable numérica a analizar es el número de parásitos contabilizados
en cada uno de los 60 peces estudiados, agrupados en los diferentes tratamientos y el control.
Planteamiento de la hipótesis
Del planteamiento del contraste anterior se deduce que las hipótesis a contrastar para analizar si existen diferencias entre
los k grupos son:
H0: Todas las medias poblaciones de los k grupos son iguales. β
H1: Al menos una media poblacional difiere. α =0.05
H0: µ0 = µ1 = µ2 = µ3 = µ4 = µ5 → β
H1: Al menos una igualdad no es cierta → α = 0.05
El resumen de os datos observados se presentan en la siguiente tabla, agrupados para cada una de las clases para poder
observar las posibles diferencias entre las medias y también analizar las varianzas:
Clase n1 X́ i S 2i Si
Control 12 56.917 279.538 16.719
25mg 12 47.500 224.818 14.994
50mg 12 47.088 238.629 15.448
100mg 12 22.417 60.629 7.786
125mg 12 21.750 76.386 8.740
Desarrollando las ecuaciones obtenemos como resultado la tabla de ANOVA del ejercicio:
x́−µ 72.300−70.000
z= = =2.76
σ 5.000
√n √ 36
En la tabla normal estándar, observamos que la probabilidad de que el calor de Z se 2.76 o mayor es 0.0029. Como esta
probabilidad es muy baja, podemos concluir que es probable que la renta media de la población no sea de 70.000$ sino
mayor. Este resultado es una poderosa prueba de que la renta media de la población es de más de 70.000$ y de que la
tienda de café probablemente será un éxito.
ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
19. Tiempo en la tienda de alimentos (intervalo de confianza)
Supongamos que el tiempo de permanecen los clientes en una tienda local de alimentación sigue una
distribución normal con una desviación típica poblacional conocida de 20 minutos. Una muestra aleatoria de 64
clientes tenía un tiempo medio de 75 minutos. Halle el erro típico, el margen de error y el límite superior e
inferior de confianza de un intervalo de confianza de la media poblacional, µ al 95%[CITATION Pau131 \l
2058 ]
SOLUCION:
El error típico y el margen de error son:
σ 20
Error típico = = =2.5
√ n √ 64
σ
ME= z∝ =1.96∗2.5=4.9
2 √n
Por tanto, el límite superior e inferior de un intervalo de confianza al 95% son los siguientes:
σ
LSC= x́+ z ∝ =75+ 4.9=79.9
2 √n
σ
LIC= x́−z ∝ =75−4.9=70.1
2 √n
Basados en la muestra de 64 observaciones, un intervalo de confianza de la media poblacional desconocida al 95% va de
alrededor de 70 minutos, a alrededor de 80 minutos.
261
P=
^ =0.759
344
z α =z 0.05=1.645
2
Por tanto un intervalo de confianza al 90% de la proporción de la población es.
( 0.759 )( 0.241 )
0.759 ±1.645
√ 344
0.759 ± 0.038
115−100
Z= =2.34
625 400
√ +
25 25
Comparando el valor calculado de Z=2.34 con Z 0.05=1.645, Sara llega a la conclusión de que se rechaza
claramente la hipótesis nula. De hecho, observamos que el p- valor de este contraste es 0.0096. Existen, pues
pruebas contundentes de que la productividad es mayor con el estiércol de pavo que con el de vaca.
x́ M − ý s 1.078−908.2
t= = =1.08
2 2
310.700 310.700
√ S S
p
+
nx n y
p
√ 25
+
25
Utilizando un nivel de significancia de 0.05 y 48 grados de libertad, observamos que el valor critico de t es
1.677. Por tanto, llegamos a la conclusión de que no existen pruebas suficientes para rechazar la hipótesis nula
y, por tanto, no existe razón alguna para concluir que las ventas son mayores los lunes.
SOLUCION:
1.- La recta de regresión de Y sobre X.
Xi Yi X 2i Y 2i Xi*Yi
189 402 35721 161604 75978
190 404 36100 163216 76760
208 412 43264 169744 85696
227 425 51529 180625 96475
239 429 57121 184041 102531
252 436 63504 190096 109872
257 440 66049 193600 113080
274 447 75076 199809 122478
293 458 85849 209764 124094
308 469 94864 219961 144452
316 469 99856 219961 148204
∑. 2753 4791 708933 2092421 1209720
2753 4791
X́ = =250.27 Ý = =435.55
11 11
708933 2092421
σ 2x = −250.272=1813.38 σ 2y = −435.552=516.29
11 11
σ x =√ 1813.38=42.58 σ y = √ 516.29=22.72
1209720
σ xy = −250.27∗435.55=469.45
11
y−435.55=0.53 ( x−250.27 ) → y=0.53+302.91
2.- El coeficiente de correlación lineal.
469.45
r= =0.998
42.58∗22.81
3.- Es un coeficiente de correlación positivo y cercano a uno, por lo que la correlación es directa y fuerte.
Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de la compañía en
este año?
y=0.53∗325+302.91=475.16
ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
26. La American Management Association estudia el ingreso medio de los gerentes de tiendas de la industria
del menudeo. Una muestra aleatoria de 49 gerentes revela una media muestral de 45 4520 dólares y una
desviación estándar de 2 050 dólares. A la asociación le gustaría responder las siguientes preguntas.
a) ¿Cuál es la media de la población?
b) ¿Cuál es un intervalo de valores razonable para la media poblacional?
c) ¿Cómo se deben interpretar tales resultados?[ CITATION Dou10 \l 2058 ]
SOLUCION:
a) En este caso se ignora, pero se sabe que la media de la muestra es de 45 420 dólares. De ahí que la mejor
estimación del valor de población sea el estadístico de la muestra correspondiente: por consiguiente, la media de
la muestra de 45 420 dólares constituye un estimador puntual de la media poblacional desconocida.
b) La asociación decide utilizar in nivel de confianza de 95%. Para determinar el intervalo de confianza
correspondiente, se aplica:
σ $ 2050
X́ ± Z =$ 45420 ± 1.96 =$ 45420 ± $ 574
√n √ 49
Los límites del intervalo de confianza son 44846 y 45994 dólares. (Que se calcula restando 574 dólares y sumando
574 dólares a la media muestral). El grado o nivel de confianza es de 95%, y el intervalo de confianza abarca de
44846 hasta 45994 dólares. A±$574 s e le llama margen de error.
c) Suponga que usted selecciona varias muestras de 49 gerentes, tal vez varios cientos. Para cada muestra, calcula la
media y después constituye un intervalo de confianza de 95%, como en la sección anterior. Puede esperar que
alrededor de 95% de estos intervalos de confianza contenga la media de la población.
libertad:
X́−μ0
t=
S
√n
169.5−180
t= =−4.12
5.7
√5
Decisión: dado que t=−4012 es menor que −3.747 , la hipótesis nula debe rechazarse al nivel α =0.01
. En otras palabras, la resistencia a la rotura está por debajo de las especificaciones. La probabilidad de cola exacta, o valor
P, es 0.0073.
La evidencia contra la resistencia a la rotura media de 180 libras es incluso más fuerte que 0.01.
Decisión: puesto que Z =1.38 no supera 1.645, la hipótesis nula no puede rechazarse; esto es , la
diferencia observada entre las dos medias muéstrales no es significativa.
El valor P=0.0838, de modo que la evidencia contra medias iguales no es muy fuerte.
Para juzgar la fortaleza, con la finalidad de apoyar la hipótesis nula cuando no se rechaza, considere errores
tipo II para los cuales las probabilidades dependen de las diferencias alternativas reales δ ’ ¿ μ1−μ2 .
Por fortuna, estas pueden determinarse con los resultados muéstrales individuales (en tanto se tomen muestras
de poblaciones normales con desviaciones estándares, o ambas muestras sean grandes).
∑ Y 2i =9.1097
i=1
Y luego se obtiene
S XY 505.40
b= = =0.00383
S XX 132000
Y entonces
Ý =0.069+ 0.00383 X
S 2XY 2
(505.40 )
S YY − =2.13745− =0.20238
S XX 132000
Para evitar confusión, se deja en claro que hay dos posibles líneas de regresión.
TRABAJOS CITADOS
Douglas A. Lind, ,. W. (2010). Estadística aplicada a los negocios y la economía . McGraw-Hill.