Estadistica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 19

TEOREMA DEL LIMITE CENTRAL

1. En concordancia con los datos de la National Health and Nutrition Examination Survey, suponga que los pesos
de los hombres se distribuyen normalmente, con una media de 172 libras y una desviación estándar de 29
libras. Es decir, suponga que la población de peso de hombres se distribuye de manera normal con µ=172 libras
y σ=29 libras.
Calcule la probabilidad de que 20 hombres elegidos al azar tengan un peso medio mayor que 175 libras (de
manera que su peso total exceda la capacidad segura de 3500 libras).[CITATION Tri13 \p 290-291 \l 2058 ]
SOLUCION:
Al trabajar con una media de una muestra de 20 hombres, utilizamos el método del teorema del límite central. La población
original de hombres tiene una distribución normal, de manera que las muestras de cualquier tamaño producirán medias
distribuidas normalmente. Como estamos trabajando con una distribución de medias muéstrales, debemos utilizar los
parámetros µ x́ y σ x́ , que se evalúan de la siguiente manera.
Estadística
µ x́ =¿ µ=172 Mario F. Triola/ pág. 291
σ 29
σ x́ = = =6.4845971
√ n √ 20
Queremos calcular el área sombreada. Si utilizamos nuestra tabla Z, encontraremos la puntuación z
relevante, la cual se calcula de la siguiente manera:

x́−µ x́ 175−172 3
z= = = =0.46
σ x́ 29 6.4845971
√ 20
Si revisamos la tabla Z, encontramos que z=0.46 corresponde a un área izquierda acumulada de
0.6772.
De manera que la región sombreada es 1-0.6772= 0.3228.
La probabilidad de que 20 hombres tengan un peso medio mayor que 175 libras es de 0.3228.
Por lo que existe una probabilidad de 0.3228 de que 20 hombres tengan un peso medio mayor de 175 libras, como la
capacidad segura del taxi acuático es de 3500 libras, es muy probable que se sobre cargue si se transporta a 20 pasajeros,
por lo que no es suficientemente segura.

ESTIMACION PUNTUAL Y POR INTERVALO DE UNA PROPORCION


2.- Una encuesta realizada por Pew Research Center, que incluyo a 1501 adultos estadounidenses elegidos al
azar, revelo que el 70% creía en el calentamiento global. Los resultados muéstrales son n=1501 y ^p=0.70
a) Calcule el margen de error E que corresponde a un nivel de confianza del 95%.
b) Calcule la estimación de un intervalo de confianza del 95% de la proporción poblacional p.
c) Con base en los resultados, ¿podemos concluir con seguridad que la mayoría de los adultos creen en el
calentamiento global?[ CITATION Tri131 \l 2058 ]
SOLUCION:
^p q^
a) El margen de error se calcula usando la formula

q^ =0.30
E=z α
y n=1501, sustituyendo valores nos queda:
2 √ n
con
z α =1.96
2
, ^p=0.70 ,

E=1.96
√ (0.70)(0.30)
1501
=0.023183

b) Construir el intervalo de confianza es bastante fácil ahora que tenemos los valores de ^p y E.
Simplemente sustituimos esos valores para obtener este resultado:

^p−E< p< ^p + E
0.70 – 0.023183 ¿ p ¿ 0.70 + 0.023183
0.677 ¿ p <0.723 (Redondeando a tres dígitos significativos)

Este mismo resultado podría expresarse ene l formato de 0.70±0.023 o (0.677,0.723).


Si queremos el intervalo de confianza del 95% para el porcentaje real de la población, podemos expresar el
resultado como 67.7% ¿ p <72.3 % .
c) Con base en el intervalo de confianza obtenido en el inciso b), parece que la proporción de adultos que creen en el
calentamiento global es mayor que 0.5(o 50%), por lo que podemos concluir con certeza que la mayoría de los
adultos creen en el calentamiento global. Como es probable que los límites de 0.677 y 0.723 contengan la
proporción poblacional verdadera, parece que la proporción de la población es un valor mayor que 0.5.
d) La siguiente afirmación resume los resultados: el 70% de los adultos estadunidenses creen que la tierra se esta
calentando. El porcentaje se basa en una encuesta realizada por el Pew Researchn Center con 1501 adultos
estadunidense elegidos al azar.
En teoría, en el 95% de este tipo de encuestas, el porcentaje difiere en no más de 2.3 puntos porcentuales, en
cualquier dirección, del porcentaje que se obtendría al entrevistar a todos los adultos estadunidenses.

TAMAÑO DE LA MUESTRA PARA LA ESTIMACIOND DE PROPORCION POBLACIONAL


3. ¿Cuántos adultos usan internet? Internet nos está afectando a todos de muchas formas diferentes, y por eso
existen muchas razones para estimar la proporción de adultos que lo utilizan. Suponga que un gerente de e-bay
desea determinar el porcentaje actual de adultos estadunidenses que utilizan internet. ¿A cuántos adultos se
debe encuestar para tener una confianza del 95% de que el porcentaje muestral es erróneo por no más de tres
puntos porcentuales?
a) Utilice este resultado de una encuesta del Pew Research Center: en 2006, el 73% de los adultos
estadunidenses usaban internet.
b) suponga que no contamos con información previa que sugiera un valor posible de la proporción. [ CITATION
Mar13 \l 2058 ]
SOLUCION:
a) El estudio previo sugiere que ^p=0.73 , de modo que q ^ =0.27( obtrenido de q^ =1−0.73) . Con
un nivel de confianza del 95%, tenemos α =0.05 , de modo que
z α =1.96 . Además, el margen de
2
error es E=0.03 (el equivalente decimal de “tres puntos porcentuales”). Puesto que tenemos un valor estimado de
^p , usamos la fórmula:
2
z α ^p q^
n=
[ ] 2
=
2
[ 1.96 ] (0.73)(0.27)
=841.3104=842 (Redondeado)
2 2
E 0.03
Debemos obtener una muestra aleatoria simple que incluya al menos 842 adultos.
b) Como el inciso a), nuevamente utilizamos
z α =1.96 y E=0.03, pero sin conocimiento previo de
2
^p (o q^ ) .
2
z α ∗0.25
n=
[ ] 2
=
2
[ 1.96 ] (0.25)
=1067.1111=1068 (Redondeado)
2 2
E 0.03

ERROR ESTANDAR DE LA MEDIA


4. Al retomar el proceso de llenado de las cajas de cereal, si se seleccionan al azar una muestra de 25 cajas, sin
reemplazo, de los miles de cajas que se llenan durante un turno, la muestra contiene mucho menos de 5% de la
población. Considerando que la desviación estándar del proceso de llenado de creal es de 15 gramos, clacule el
error estándar de la media. [ CITATION Dav14 \l 2058 ]
SOLUCION:
Usando n=25 y σ =15, el error estándar de la media es:
σ 15 15
σ x́ = = = =3
√n √ 25 5
La varianza en las medidas muéstrales para las muestras de n=25 es mucho menor que la desviación
en las cajas individuales de cereal, es decir, σ x́ =3 , mientras que σ =15

ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
5. Un fabricante de papel tiene un proceso de producción que opera de manera continua a través de un turno
completo de producción. Se espera que el papel tenga una longitud media de 11 pulgadas y que la desviación
estándar de la longitud sea de 0.02 pulgadas. A intervalos periódicos, se selecciona una muestra para
determinar si la longitud media del papel sigue siendo igual a 11 pulgadas o si el proceso de producción ha
fallado y se registra un cambio en tal longitud. Usted selecciona una muestra aleatoria de 100 hojas y encuentra
que la longitud media del papel es de 10.998 pulgadas. Construya un estimador del intervalo de 95% de
confianza para la media poblacional de la longitud del papel. [ CITATION Dav141 \l 2058 ]
SOLUCION:
Utilizando
z ∝=1.96 para un 95% de confianza.
2

σ 0.02
x́ ± z ∝ =10.998 ±(1.96)
2 √n √ 100
=10.998 ± 0.0039
10.9941 ≤ µ ≤ 11.0019
Por consiguiente, usted concluye que la media poblacional esta entre 10.9941 y 11.0019 pulgadas con un 95% de confianza.
Dado que el intervalo incluye a 11, el valor indica que el proceso de producción esta funcionando adecuadamente y no hay
razón para creer que existe alguna falla en él

ESTIMACIÓN PUNTUAL Y POR INTERVALO DE UNA MUESTRA PEQUEÑA (� ≤ 30).


6. Se reúnen los datos seleccionados de una muestra de 100 facturas de ventas de la población de facturas de
ventas del mes. Una vez que reunió los datos, los organiza en una hoja de cálculo. Para analizar los datos, se
calcula que la media muestral de las 100 facturas de ventas es igual a $110.27 y la desviación estándar muestral
es igual a $28.95. Para un 95% de confianza, el valor crítico de la distribución t es 1.9842.[ CITATION Dav142 \l
2058 ]
SOLUCION:
s 28.95
x́ ± t ∝ = 110.27 ± (1.9842)
2 √n √ 100
=110.27 ± 5.74
104.53 ≤ µ ≤ 116.01
De esta manera, con un 95% de confianza, se concluye que la media del monto de todas las facturas de ventas esta entre
$104.53 y $116.01. El nivel de 95% de confianza indica que si se seleccionan todas las muestras posibles de 100, 95% de los
intervalos creados incluirían a la media poblacional en algún punto dentro del intervalo.

TAMAÑO DE LA MUESTRA
7. Suponga que desea estimar, con un 95% de confianza, la fuerza media poblacional requerida para romper el
aislante dentro de ±25 libras. Con base en un estudio realizado el año anterior, la desviación estándar es de 100
libras. Determine el tamaño de la muestra necesario. [ CITATION Dav \l 2058 ]
SOLUCION:
Utilizando E=25, σ =100 y
z ∝=1.96 para un 95% de confianza:
2
1.96
¿
¿
100
¿
2 ¿

n=
[ ]2
σ
= ¿2
¿
2
E 25
¿
¿
¿2
¿
¿
Por lo tanto, debe seleccionar una muestra de 62 aislantes porque la regla general para determinar el tamaño de la muestra
dice que siempre se debe redondear al siguiente valor entero para satisfacer un poco más de lo necesario los criterios
deseados.

PLANTEAMIENTO DE PRUEBA DE HIPOTESIS


8. Se es gerente de un restaurante de comida rápida y se desea determinar si el tiempo de espera para realizar
un pedido ha cambiado en el último mes a partir de su valor medio poblacional anterior a 4.5 minutos.
Establezca la hipótesis nula y la alternativa.[ CITATION Dav143 \l 2058 ]
SOLUCION:
La hipótesis nula establece que la media poblacional no ha cambiado de su valor anterior de 4.5 minutos. Esto se plantea
como.
Ho: µ=4.5
La hipótesis alternativa es lo opuesto a la hipótesis nula. Debido a que la hipótesis nula establece que la media poblacional
es de 4.5 minutos, la hipótesis alternativa plantea que la media poblacional no es de 4.5 minutos. Esto se indica cómo.
H1: µ ≠ 4.5

PRUEBA DE HIPOTESIS SOBRE LA MEDIA


9. Se es el gerente de un restaurante de comida rápida. El problema de negocios consiste en determinar si el
tiempo medio poblacional de espera para realizar un pedido ha cambiado en el último mes a partir de su valor
medio poblacional anterior de 4.5 minutos. Por experiencia se supone que la población se distribuye de manera
normal con una desviación estándar poblacional de 1.2 minutos. Se seleccionó una muestra de 25 pedidos
durante un lapso de una hora. La media muestral es de 5.1 minutos. Con un nivel de significancia de 0.05, existe
evidencia de que el tiempo medio poblacional de espera para realizar un pedido ha cambiado en el último mes
a partir de su valor medio poblacional anterior de 4.5 minutos. [ CITATION Dav144 \l 2058 ]
SOLUCION:
La hipótesis nula establece que la media poblacional no ha cambiado de su valor previo de 4.5 minutos:
Ho: µ=4.5
La hipótesis alternativa es lo opuesto a la hipótesis nula. Puesto que la hipótesis nula plantea que la media poblacional es de
4.5 minutos, la hipótesis alternativa plantea que la media poblacional no es de 4.5 minutos:
H1: µ ≠ 4.5
Seleccionando una muestra de n=25. El nivel de significancia es de 0.05, es decir, σ =0.05 .
Como se supone que conocemos σ se utiliza entonces la distribución normal y el estadístico de prueba Z ESTAD .
Puesto que ∝=0.05 , los valores críticos del estadístico de prueba Z ESTAD . Son -1.96 y 1.96. La región de
rechazo es
Z ESTAD . ←1.96 o Z ESTAD . >1.96 . La región de no rechazo es -1.96 ≤ Z ESTAD. ≤ 1.96.
Siendo x́=5.1
x́ −µ 5.1−4.5
Z ESTAD . = = =+2.50
σ 1.2
√n √ 25
Z ESTAD. =+2.50>+1.96 , se rechaza la hipótesis nula y concluye que existe evidencia de que el tiempo medio
poblacional de espera para realizar un pedido ha cambiado de su valor previo de 4.5 minutos. El tiempo medio de espera de
los clientes ahora es mayor que el mes pasado. Como gerente, le gustaría determinar la manera de reducir el tiempo de
espera para mejorar el servicio.

PRUEBA DE HIPÓTESIS SOBRE LA MEDIA, CON VARIANZA DESCONOCIDA.


10. El objetivo de negocios consiste en determinar si la cantidad de la media por factura de ventas no ha
variado de los $120 de los últimos cinco años. Como contador de la empresa, se necesita determinar si esta
cantidad cambia. En otras palabras, la prueba de hipótesis se utiliza para tratar de determinar si la cantidad
media por factura de ventas está aumentando o disminuyendo. Con ∝=0.05

108.98 152.22 111.45 110.59 127.46 107.26


93.32 91.97 111.56 75.71 128.58 135.11
[ CITATION Dav145 \l 2058 ]
SOLUCION:
La hipótesis nula seria Ho: µ=$ 120
La hipótesis alternativa seria H1: µ ≠ $ 120
La hipótesis alternativa incluye la afirmación que se está tratando de demostrar.
Puesto que no se conoce σ , se utiliza la distribución t y el estadístico de prueba t ESTAD. Se debe suponer que la población
de las facturas de ventas se distribuye de manera normal, ya que el tamaño de muestra es de 12 es demasiado pequeño
para que tenga efecto el teorema del límite central.
Para un tamaño de muestra dado, n, el estadístico de prueba tESTAD. Presenta una distribución t con n-1 grados de libertad.
Los valores críticos de la distribución t con 12-1=11 grados de libertad encontrados en la tabla t
La hipótesis alternativa H1: µ ≠ $ 120 tiene dos colas. El área en la región de
x́=$ 112.85 y S=$20.80

x́−µ 112.85−120
t ESTAD. = = =−1.1908
s 20.80
√n √ 12
Dado que -2.2010 ¿ t ESTAD. = -1.1908 ¿ 2.2010, no se rechaza Ho No tiene evidencia suficiente para concluir que el
monto medio por factura de ventas difiera de $120. La auditoría sugiere que el monto medio por factura de ventas no ha
cambiado.

METODO DEL VALOR P


11. Una empresa que fabrica barras de chocolate está especialmente interesada en que el peso medio de una
barra de chocolate no sea mayor que 6.03 onzas. Se selecciona una muestra de 50 barras de chocolate; la
media muestral es de 6.034 onzas y la desviación estándar muestral es de 0.02 onzas. Con un nivel de
significancia ∝=0.01 , ¿existe evidencia de que el peso medio poblacional de las barras de chocolate sea
mayor que 6.03 onzas? [ CITATION Dav146 \l 2058 ]
SOLUCION:
Se definen las hipótesis:
Ho: µ ≤ 6.03
H1: µ> 6.03
Puesto que se desconoce σ , σ se utiliza entonces la distribución normal y el estadístico de prueba t ESTAD .
La región de rechazo está completamente contenida en la cola superior de la distribución muestral de la media, ya que se
desea rechazar Ho solo cuando la media muestral sea significativamente mayor que 6.03 onzas. Como toda la región de
rechazo se encuentra en ka cola superior de la distribución t y contiene un área de 0.01, el valor crítico de la distribución t
con 50 -1=49 grados de libertad es 2.4049.
En su muestra de 50 barras de chocolate, se encuentra que el peso medio muestral es de 6.034 onzas y la desviación
estándar muestral es de 0.02onzas. Utilizando n=50, x́=6.034 , S=0.02

x́−µ 6.034−6.03
t ESTAD. = = =1.414
s 0.02
√n √50
Puesto que t ESTAD . =1.414< 2.4049 , el valor p es 0.0818 ¿ 0.01, no se rechaza la hipótesis nula. No existe
evidencia suficiente para concluir que el peso medio poblacional sea mayor que 6.03 onzas.

PRUEBA DE HIPÓTESIS SOBRE LA IGUALDAD DE DOS PROPORCIONES


12. ¿Las bolsas de aire salvan vidas? La siguiente tabla incluye los resultados de una aleatoria simple de
ocupantes del asiento delantero involucrados en choques de automiviles (según datos de “Who Wants
Airbaga”, de Meyer y Finney, Chance, vol.18, núm. 2). Utilice un nivel de significancia de 0.05 para someter a
prueba la afirmación de que la tasa de mortalidad de los ocupantes es menor en el cas de los automóviles
equipados con bolsas de aire. [ CITATION Dav147 \l 2058 ]

Con bolsa de aire Sin bolsa de aire


Muertes de ocupantes 41 52
Número total de ocupantes 11541 9853

SOLUCION:
Se utilizara el método del valor p para la prueba de hipótesis. Se estipularan que el grupo de bolsas de aire constituya la
muestra 1, y que el grupo sin bolsas de aire constituye la muestra 2.
La afirmación de que la tasa de mortalidad es menor para los que viajaban en vehículos con bolsas de aire se expresa con p 1
¿ p2.
Si p1 ¿ p2. Es falso, entonces p1 ≥ p´2.
Como nuestra afirmación no contiene igualdad, se convierte en la hipótesis alternativa. La hipótesis nula es la afirmación de
igualdad, de manera que tenemos.
Ho: p1=p2 H1: p1 ¿ p2 (afirmación original)
Con un nivel de significancia es ∝=0.05 .
Utilizaremos la distribución normal como una aproximación de la distribución binomial. Estimamos el valor común de p 1 y p2
con la estimación de la muestra agrupada p, con espacios decimales adicionales para minimizar los errores de redondeo en
cálculos posteriores.

x 1+ x 2 41+ 42
ṕ= = =0.004347
n 1+ n2 11541 +9583
Con ṕ=0.004347 , se deduce que q́=1−0.004347=0.995653
Ahora podemos calcular el valor del estadístico de prueba.

41 52
z=
p 1− ^
(^ p 2 )− ( ^
p 1− ^
p2 )
=
( 11541 −
9853 )
−0
=−1.91
pq
´ pq´ ( 0.004347 ) ( 0.995653 ) ( 0.004347 )( 0.995653 )
√ +
n1 n 2 √ 11541
+
9853

Se trata de una prueba de cola izquierda, por lo


que el valor P es el área ubicada a la izquierda
del estadístico de prueba z=-1.91 y se encuentra
que el estadístico de prueba z= -1.91 es 0.0281;
por lo tanto, el valor P es 0.0281.
Puesto que el valor P de 0.0281 es menor que el
nivel de significancia de ∝ =0.05, se
David M. Levine/Estadística para rechaza la hipótesis nula de P1 =P2.
administración/pág. 465

PRUEBA EN LAS QUE INTERVIENE LA DISTRIBUCION DE JI-CUADRADA.


13. En el pasado, la desviación estándar de los pesos de ciertos paquetes de 40.0 onzas que se llenaban
médiate una maquina era de 0.25 onzas. Una muestra aleatoria de 20 paquetes mostro una desviación estándar
de 0.32 onzas. ¿Es el aumento en la variabilidad significativo a un nivel de significancia de
a) 0.05
b) 0.01?
c) ¿Cuál es el valor p de la prueba? [ CITATION Mur13 \l 2058 ]
SOLUCION:
Se necesita decidir entre las hipótesis.
Ho: σ =0.25 onzas y los resultados observados se deben al azar.
H1: σ >¿ 0.25 onzas y la variabilidad se ha incrementado.
ns 2 (20)(0.32)2
El valor de X2 de la muestra es X2 = = =32.8
σ2 0.25 2
a) Usando una prueba de una cola, se rechaza H o a un nivel de significancia de 0.05 si el valor muetras de X 2 fuera
mayor que X20.95, que equivale a 30.1 para V=20-1=19 grados de libertad. En consecuencia de rechaza H o a un nivel
de significancia de 0.05.
b) Con base en una prueba de una cola, se debería rechazar H o a un nivel de significancia de 0.01 si el valor muestral
de X2 fuera mayor que X20.99, que equivale a 36.2 para 19 grados de libertad. Por tanto, se debería rechazar H o a un
nivel de significancia de 0.01.
Concluimos que la variabilidad tiene mayor probabilidad. Sería necesario revisar la máquina.

c) El valor P es P (X2 ≥ 32.8). La tabla muestra que 0.025 < P < 0.05. Por lo que P = 0.0253.

PRUEBA JI-CUADRADA
14. En 200 lanzamientos de una moneda, se observaron 115 caras y 85 cruces. Probar la hipótesis de que la
moneda no está cargada con base en un nivel de significancia de:
a) 0.05, b) 0.01? , c) ¿Cuál es el valor p de la prueba?
La frecuencia observada de caras y cruces son X1=115, X2=85, respectivamente.
Las frecuencias esperadas de caras y cruces si la moneda no está cargada son np 1=100, np2=100,
respectivamente. En consecuencia.[ CITATION Mur131 \l 2058 ]
SOLUCION:
2 2 2 2
( x 1−np1 ) ( x 2−np2) (115−100) (85−100)
x 2= + = + =4.50
np1 np 2 100 100
Puesto que el número de categorías o clases (caras, cruces) es K=2, y v = k -1 = 2-1 = 1 .
a) El valor crítico X20.95 de 1 grado de libertad es 3.84. puesto que 4.50 ¿ 3.84, se rechaza la hipótesis de que la
moneda no está cargada a un nivel de significancia de 0.05.
b) El valor critico X20.99, de un grado de libertad es 6.63. Puesto que 4.50 <6.63, no se puede rechazar la hipótesis de
que la moneda no está cargada un nivel de significancia de 0.01.
Concluimos que los resultados observados son probablemente significativos y que la moneda esta probablemente
cargada.
c) El valor P es P (X2 ≥ 4.50). La tabla nos muestra que 0.025 < P < 0.05.Por medio de software de computadora.
P= 0.039.

15. La tabla muestra las frecuencias observadas y esperadas al lanzar un dado 120 veces: a) Probar la hipótesis
de que el dado no está cargado con el uso de un nivel de significancia de 0.05. b) Determinar el valor P de la
prueba. [ CITATION Mur132 \l 2058 ]

Cara 1 2 3 4 5 6
Frecuencias 25 17 15 23 24 16
observadas
Frecuencias 20 20 20 20 20 20
esperadas

SOLUCION:
a)
2 2 2 2 2 2
2 ( x 1−np1 ) ( x 2−np2) (x 3−np3 ) ( x 4 −np 4 ) (x 5−np 5) ( x6 −np6 )
x= + + + + +
np1 np 2 np3 np4 np5 np6

(25−20)2 (17−20)2 (15−20)2 (23−20)2 (24−20)2 (16−20)2


¿ + + + + + =5.00
20 20 20 20 20 20
Puesto que el número de categorías o clases (caras 1, 2, 3, 4, 5, 6) es k=6, v = k -1 = 6 -1 = 5.
El valor crítico X20.95 de 5 grados de libertad es 11.1. En razón de que 5.00 < 11.1, no se puede rechazar la hipótesis
de que el dado no está cargado.
En el caso de 5 grados de libertad X 20.05 = 1.15, por lo que X 2= 5.00 ¿ 1.15. Se concluye que la concordancia no
es excepcionalmente buena de modo de que queden dudas.
b) El valor P de la prueba es P (X2 ≥ 5.00). La tabla nos muestra que 0. 25 < P < 0. 5. Obtenemos que P=0.42

TABLAS DE CONTINGENCIA
16. La tabla muestra los números de estudiantes que fueron aprobados y reprobados por tres instructores: Sr. X,
Sr. Y y Sr. Z. Probar la hipótesis de que las proporciones de estudiantes que los tres instructores no aprobaron
son iguales. [ CITATION Mur133 \l 2058 ]

Frecuencias observadas
Sr. X Sr. Y Sr. Z TOTAL
Aprobados 50 47 56 153
Reprobados 5 14 8 27
TOTAL 55 61 64 180

SOLUCION:
Con base en la hipótesis Ho de que las proporciones de estudiantes no aprobados por los tres instructores son iguales,
hubieran reprobado 27/180=15% de los estudiantes y aprobado 85% de ellos. Las frecuencias esperadas con base en H o se
muestran a continuación.

2 2 2 2 2 2
2 (50−46.7) (47−51.85) (56−54.40) (5−8.25) (14−9.15) (8−9.60)
x= + + + + + =4.84
46.75 51.85 54.40 8.25 9.15 9.60
Frecuencias observadas bajo H0
Sr. X Sr. Y Sr. Z TOTAL
Aprobados 85% de 55= 46.75 85% de 61= 51.85 85% de 64=54.40 153
Reprobados 15% de 55=8.25 15% de 61=9.15 15% de 64=9.60 27
TOTAL 55 61 64 180

Para determinar el número de grados de libertad, observemos la siguiente tabla, que es igual a las anteriores excepto que
solo se muestran los totales. Es claro que se tiene la libertad de poner solo un numero en una celda vacía de la primera
columna y un número en cada celda vacía en la segunda o la tercera columna, después de lo cual los números de las celdas
restantes serán determinados de manera única a partir de los totales indicados. Por tanto, en este caso hay 2 grados de
libertad.

Frecuencias observadas bajo H0


Sr. X Sr. Y Sr. Z TOTAL
Aprobados 153
Reprobados 27
TOTAL 55 61 64 180

Como X20.95=5.99, no es posible rechazar H0 a un nivel de significancia de 0.05. No obstante, observamos que puesto que
X20.90=4.61, se puede rechazar Ho a un nivel de 0.10 si se está dispuesto a tomar el riesgo de 1 en 10 posibilidades de
equivocarse. El valor p de las frecuencias observadas es P (X2 ≥ 4.84)=0.089.

ANALISIS DE VARIANZA (ANOVA)


17. Se quiere estudiar el efecto de distintas dosis de un medicamento para combatir a los parásitos de
peces criados en acuicultura. Para ello, se tomaron 60 peces al azar, y se dividieron en 5 grupos de 12
individuos cada uno. El primer grupo no fue medicado, pero a los restantes se les suministró el
medicamento en dosis crecientes. Tras una semana de tratamiento, se contabilizaron los parásitos
existentes en cada individuo, obteniendo los resultados siguientes:
Contrastar si el medicamento es efectivo contra los parásitos y si existen diferencias según la dosis
aplicada.[ CITATION Uni \l 2058 ]

Control 50 65 72 46 38 29 70 85 72 40 57 59
25mg 49 47 30 602 62 60 19 28 56 62 55 40
50mg 20 59 64 61 28 47| 29 41 60 57 61 38
100mg 20 23 38 31 27 16 27 18 22 12 24 11
125mg 18 30 22 26 31 11 15 12 31 36 16 13

SOLUCION:
En este caso se quiere contrastar si el medicamento es efectivo y en qué dosis respecto al control observado. Por tanto, y
dado que se dispone de datos para diferentes tratamientos (en este caso 2 o más), es factible utilizar un análisis de la
varianza de un factor, contraste para la media de una variable continua normal en dos o más grupos, donde el factor es la
dosis, que contiene cinco clases o grupos o niveles, y la variable numérica a analizar es el número de parásitos contabilizados
en cada uno de los 60 peces estudiados, agrupados en los diferentes tratamientos y el control.
Planteamiento de la hipótesis
Del planteamiento del contraste anterior se deduce que las hipótesis a contrastar para analizar si existen diferencias entre
los k grupos son:
H0: Todas las medias poblaciones de los k grupos son iguales.  β
H1: Al menos una media poblacional difiere.  α =0.05
H0: µ0 = µ1 = µ2 = µ3 = µ4 = µ5 → β
H1: Al menos una igualdad no es cierta → α = 0.05
El resumen de os datos observados se presentan en la siguiente tabla, agrupados para cada una de las clases para poder
observar las posibles diferencias entre las medias y también analizar las varianzas:

Clase n1 X́ i S 2i Si
Control 12 56.917 279.538 16.719
25mg 12 47.500 224.818 14.994
50mg 12 47.088 238.629 15.448
100mg 12 22.417 60.629 7.786
125mg 12 21.750 76.386 8.740

Y la información referente al conjunto de los datos:


k=5
n = n1 + n1 + n2 + n3 + n4 + n5 = 60
k ni
1
X́ = ∑ ∑ X =39.133
n i=1 j=1 ij
Para desarrollar el contraste se debe completar la tabla de ANOVA

F de Suma de cuadrados Grados de Cuadrados F Pr(>F)


variación libertad medios
K
ENTRE QE =∑ n1 ( X́ i− X́ j)2 K-1 QE QE
i=1 S 2E =
K−1 k −1
F=
QD
n−1
DENTRO K
n-K QD
QD =∑ (n1−1)2 S2i S 2D =
i=1 n−k

TOTAL Q=QE+QD n-1 Q


S2=
n−1

Desarrollando las ecuaciones obtenemos como resultado la tabla de ANOVA del ejercicio:

F de Suma de cuadrados Grados de Cuadrados F Pr(>F)


variación libertad medios

ENTRE 12372.878 4 3093.22 17.575 P valor < 0.01

DENTRO 9680 55 176


TOTAL 22052.878 59 373.778

El contraste resulta ser significativo, dado que:


Fespt=17.575 < 2.56 = F4,55,0.055 → SE RECHAZA H0
P ( F4,55 > Fespt )= p- VALOR < 0.01 < 0.05= α → SE RECHAZA H0
En conclusión: Se rechaza H y por lo tanto al menos alguna de las clases son diferentes entre sí (existen diferencias en los
resultados para las dosis aplicadas). Es decir, existe al menos una dosis que tiene resultados diferentes a las demás. Como lo
interesante una vez comprobado H0 es averiguar cuál o cuáles son diferentes y en qué sentido para detectar si alguna de las
dosis es más efectiva se debe desarrollar un contraste a posteriori con objeto de identificar las diferencias ya detectas (pero
no identificadas) en el análisis de ANOVA.

TEOREMA DEL LIMITE CENTRAL


18. Estudio de mercado para Cafés Antílope (Probabilidad normal)
Cafés Antílope, S.A. esta considerado la posibilidad de abrir una tienda de cafés selectos en Villalegre. Según
algunos estudios de mercado realizados anteriormente, sus tiendas tendrán éxito en las ciudades de ese
tamaño si la renta familiar anual media es de más de 70.000$. También se supone que la desviación típica de la
renta es de 5.000$ en esta ciudad.
Se ha obtenido una muestra aleatoria de 36 personas y la renta media es de 72.300$ ¿Constituye esta muestra
una prueba para concluir que se debe abrir una tienda?[ CITATION Pau13 \l 2058 ]
SOLUCION:
Se sabe que la distribución de las rentas esta sesgada, pero el teorema del límite central nos permite concluir que la media
muestral sigue aproximadamente una distribución normal. Para responder a esta pregunta, tenemos que hallar la
probabilidad de obtener una media muestral de X́ =72.300 o más si la media poblacional es µ=70.000
Primero calculamos el valor estadístico Z normal estandarizado.

x́−µ 72.300−70.000
z= = =2.76
σ 5.000
√n √ 36
En la tabla normal estándar, observamos que la probabilidad de que el calor de Z se 2.76 o mayor es 0.0029. Como esta
probabilidad es muy baja, podemos concluir que es probable que la renta media de la población no sea de 70.000$ sino
mayor. Este resultado es una poderosa prueba de que la renta media de la población es de más de 70.000$ y de que la
tienda de café probablemente será un éxito.

ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
19. Tiempo en la tienda de alimentos (intervalo de confianza)
Supongamos que el tiempo de permanecen los clientes en una tienda local de alimentación sigue una
distribución normal con una desviación típica poblacional conocida de 20 minutos. Una muestra aleatoria de 64
clientes tenía un tiempo medio de 75 minutos. Halle el erro típico, el margen de error y el límite superior e
inferior de confianza de un intervalo de confianza de la media poblacional, µ al 95%[CITATION Pau131 \l
2058 ]
SOLUCION:
El error típico y el margen de error son:
σ 20
Error típico = = =2.5
√ n √ 64
σ
ME= z∝ =1.96∗2.5=4.9
2 √n
Por tanto, el límite superior e inferior de un intervalo de confianza al 95% son los siguientes:
σ
LSC= x́+ z ∝ =75+ 4.9=79.9
2 √n
σ
LIC= x́−z ∝ =75−4.9=70.1
2 √n
Basados en la muestra de 64 observaciones, un intervalo de confianza de la media poblacional desconocida al 95% va de
alrededor de 70 minutos, a alrededor de 80 minutos.

ESTIMACIÓN PUNTUAL Y POR INTERVALO DE UNA MUESTRA PEQUEÑA (� ≤ 30).


20. Camiones: consumo de gasolina 8intervalo de confianza)
Los precios de la gasolina han experimentado una vertiginosa subida recientemente. Supongamos que se ha
realizado un estudio con camioneros que tenían más o menos el mismo número de años de experiencia para
comprobar el comportamiento de 24 camioneros de un determinado modelo en la misma autopista. Estime la
media poblacional de los consumos de combustible de este modelo de camión con una confianza del 90%
suponiendo que el consumo, en millas por galón, de estos 24 camiones es. [ CITATION Pau132 \l 2058 ]

15.5 21 18.5 19.3 19.7 16.9 20.2 14.5


16.5 19.2 18.7 18.2 18 17.5 18.5 20.5
18.6 19.1 19.8 18 19.8 18.2 20.3 21.8
SOLUCION:
Calculando la media y la desviación típica, tenemos que:
x́=18.68 S=1.69526 t α =t 23,0.05=1.714
n−1,
2
El intervalo de confianza al 90% es:
s 1.69526
x́ ± t n−1 , ∝ =19.68 ± t 23,0.05 =18.68± ( 1.714 )∗( 0.3460 ) =18.68± 0.5930
2 √n √ 24

Si se seleccionan repentinamente muestras aleatorias


independientes de 24 camiones de la población y se calculan
intervalos de confianza para cada una de las muestras, en un
número muy grande de pruebas repetidas el 90% de estos
intervalos contendrán el valor verdadero de consumo medio de
combustible de este modelo de camión.

ESTIMACION PUNTUAL Y POR INTERVALO DE UNA PROPORCION


21. Plan de pluses modificado (intervalo de confianza)
La dirección quiere una estimación de la proporción de los empleados de la empresa que es partidaria de un
plan de pluses modificado. Se ha observado que en la muestra aleatoria de 344 empleados, 261 estarán a favor
de este plan. Halle una estimación de un intervalo de confianza al 90% de la verdadera proporción de la
población que es partidaria de este plan modificado. [ CITATION Pau133 \l 2058 ]
SOLUCION:
Se observa que la proporción muestral, ^
P y el factor de fiabilidad de un estimación de un intervalo de confianza al 90% (
α =0.10 ¿ de la verdadera proporción de la población, P, son:

261
P=
^ =0.759
344
z α =z 0.05=1.645
2
Por tanto un intervalo de confianza al 90% de la proporción de la población es.

( 0.759 )( 0.241 )
0.759 ±1.645
√ 344
0.759 ± 0.038

PRUEBA DE HIPOTESIS SOBRE LA MEDIA


22. Evaluación de un nuevo proceso de producción (contraste de hipótesis)
El director de producción de Ventanas Norte, S.A., le he pedido que evalué un nuevo método propuesto para
producir su línea de ventas de doble hoja. El proceso actual tiene una producción media de 80 unidades por
hora con una desviación típica poblacional de σ =8 . El director no quiere sustituirlo por el nuevo
método, a menos que existan pruebas contundentes de que el nivel medio de producción es mayor
con ese nuevo método. [ CITATION Pau134 \l 2058 ]
SOLUCION:
El director solo adoptara el nuevo método si existen pruebas contundentes a su favor. Por tanto, la hipótesis nula es:
Ho: µ ≤ 80
H1: µ> 80
Si fijamos el nivel de significancia α =0.05 y llegamos a la conclusión de que el nuevo método es más productivo,
nuestra probabilidad de error es de 0.05 o menos. Eso implica que existen pruebas contundentes a favor de nuestra
recomendación.
Obtenemos una muestra aleatoria de n=25 horas de producción utilizando el nuevo método propuesto y calculamos la
media muestral x́ , a menudo utiliza un ordenador. Con un nivel de significación de α =0.05 , la regla de decisión
es:
x́−80
>1.645
Rechazar H0 si 8
√25
Donde se obtiene z0.05=1.645 en la tabla normal estándar. También podríamos utilizar la regla.
σ 8
Rechaza Ho si x́> x́c =μ 0+ z α
√n
=80+1.645∗
√25 ( )
=82.63
Supongamos que la media muestral resultante fuera x́=83. Basándonos en ese resultado,
83−80
z= =1.875>1.645
8
√ 25
Rechazaríamos la hipótesis nula y concluiríamos que tenemos pruebas contundentes para apoyar la conclusión de que el
nuevo método aumenta la productividad. Dada esta media muestral, también podríamos calcular el p- valor de la forma
siguiente:
P-valor =p (Z > 1.875)=0.03
Podríamos recomendar, pues, el nuevo método al director de producción.

PRUEBA DE HIPÓTESIS PARA DOS POBLACIONES


23. Comparación e dos fertilizantes (contraste de hipótesis de diferencias entre medias)
Sara briones, economista agraria, quiere comparar el uso de estiércol de vaca con el de pavo como fertilizante.
Históricamente, los agricultores han utilizado estiércol de vaca en los maizales. Desde hace poco, un importante
criador de pavos vende el estiércol de pavo aun precio favorable. Los agricultores han decidido que solo
utilizaran este nuevo fertilizante si existen pruebas contundentes de que la productividad es mayor que cuando
se utiliza estiércol de vaca. Le han pedido a Sara que realice el estudio y el análisis estadístico para hacerles una
recomendación. [ CITATION Pau135 \l 2058 ]
SOLUCION:
Para comenzar el estudio, Sara especifica un contraste de hipótesis con una hipótesis nula
Ho: µ x −μ y ≤ 0
H1: µ x −μ y > 0
Donde µ x es la media poblacional de la productividad utilizando estiércol de pavo y µ y es la media
poblacional de la productividad utilizando estiércol de vaca H1 indica que el estiércol de pavo aumenta la
productividad. Los agricultores no cambiaran de fertilizante a menos que existan pruebas contundentes de que
la productividad aumenta. Sara decide antes de recoger los datos que utilizara para este contraste un nivel de
significancia de α =0.05 .
Sara realiza un experimento para contrastar la hipótesis. Utilizando estiércol de vaca en un conjunto de n y=25
explotaciones agrícolas seleccionadas aleatoriamente. La media muestral de la productividad es ý=100 .
2
Basándose en la experiencia, supone que la varianza de la productividad de estas explotaciones es σ =
y
400. Utiliza estiércol de pavo en una segunda muestra aleatoria de n x=25 explotaciones y la media muestral de
la productividad es x́=115 . Basándose en algunos estudios publicados, se supone que la varianza de estas
2
explotaciones es σ =625 Los dos conjuntos de muestras aleatorias son independientes. La regla de
x
decisión es rechazar Ho en favor de H1 sí.
x́− ý
> zα
σ 2x σ 2y
√ +
nx n y

Los estadísticos calculados para este problema son:


2
n x =25 x́=115 σ x =625
n y =25 x́=100 σ 2y =400

115−100
Z= =2.34
625 400
√ +
25 25

Comparando el valor calculado de Z=2.34 con Z 0.05=1.645, Sara llega a la conclusión de que se rechaza
claramente la hipótesis nula. De hecho, observamos que el p- valor de este contraste es 0.0096. Existen, pues
pruebas contundentes de que la productividad es mayor con el estiércol de pavo que con el de vaca.

PRUEBA DE HIPÓTESIS PARA LA IGUALDAD DE MEDIAS PARA MUESTRAS PEQUEÑAS (n 1+n2≤30)


24. Pautas de ventas al por menor (contraste de hipótesis de las diferencias entre medias)
Una tienda de artículos de deportes se encuentra en un centro comercial de mediano tamaño. Para planificar el
volumen de personal, el director nos pide que le ayudemos a averiguar si existen pruebas contundentes de que
las ventas son mayores los lunes que los sábados.[ CITATION Pau136 \l 2058 ]
SOLUCION:
Para responder a esta pregunta, decidimos recoger muestras aleatorias de 25 sábados y 25 lunes de una población de varios
años de datos. Las muestras se extraen independientemente.
Decidimos constatar la hipótesis nula.
Ho: µ M −μ s ≤ 0
H1: µ M −μ s >0
Donde los subíndices M y S representan las ventas de los lunes y de los sábados estadísticos muéstrales son:
x́ M =1.078 s M =633 n M =25
ý s =908.2 s s =469.8 ns =25
La estimación agrupada de la varianza es:
2 ( 25−1 )( 6.33 )2 +(25−1)(469.8)2
S =
p =310.700
25+25−2
El estadístico del contraste es:

x́ M − ý s 1.078−908.2
t= = =1.08
2 2
310.700 310.700
√ S S
p
+
nx n y
p
√ 25
+
25
Utilizando un nivel de significancia de 0.05 y 48 grados de libertad, observamos que el valor critico de t es
1.677. Por tanto, llegamos a la conclusión de que no existen pruebas suficientes para rechazar la hipótesis nula
y, por tanto, no existe razón alguna para concluir que las ventas son mayores los lunes.

REGRESION SIMPLE Y CORRELACION


25. Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a partir de la
relación de éstas y la renta nacional. Para investigar la relación cuenta con los siguientes datos:
X representa la renta nacional en millones de euros e Y representa las ventas de la compañía en miles de euros
en el periodo que va desde 1990 hasta 2000 (ambos inclusive). Calcular:
1. La recta de regresión de Y sobre X.
2. El coeficiente de correlación lineal e interpretarlo.
3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de
la compañía en este año?[ CITATION Mar \l 2058 ]
X Y
189 402
190 404
208 412
227 425
239 429
252 436
257 440
274 447
293 458
308 469
316 469

SOLUCION:
1.- La recta de regresión de Y sobre X.
Xi Yi X 2i Y 2i Xi*Yi
189 402 35721 161604 75978
190 404 36100 163216 76760
208 412 43264 169744 85696
227 425 51529 180625 96475
239 429 57121 184041 102531
252 436 63504 190096 109872
257 440 66049 193600 113080
274 447 75076 199809 122478
293 458 85849 209764 124094
308 469 94864 219961 144452
316 469 99856 219961 148204
∑. 2753 4791 708933 2092421 1209720

2753 4791
X́ = =250.27 Ý = =435.55
11 11

708933 2092421
σ 2x = −250.272=1813.38 σ 2y = −435.552=516.29
11 11
σ x =√ 1813.38=42.58 σ y = √ 516.29=22.72
1209720
σ xy = −250.27∗435.55=469.45
11
y−435.55=0.53 ( x−250.27 ) → y=0.53+302.91
2.- El coeficiente de correlación lineal.
469.45
r= =0.998
42.58∗22.81
3.- Es un coeficiente de correlación positivo y cercano a uno, por lo que la correlación es directa y fuerte.
Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la predicción para las ventas de la compañía en
este año?
y=0.53∗325+302.91=475.16

ESTIMACION PUNTUAL Y POR INTERVALO DE UNA MEDIA PARA UNA MUESTRA GRANDE (N>30)
26. La American Management Association estudia el ingreso medio de los gerentes de tiendas de la industria
del menudeo. Una muestra aleatoria de 49 gerentes revela una media muestral de 45 4520 dólares y una
desviación estándar de 2 050 dólares. A la asociación le gustaría responder las siguientes preguntas.
a) ¿Cuál es la media de la población?
b) ¿Cuál es un intervalo de valores razonable para la media poblacional?
c) ¿Cómo se deben interpretar tales resultados?[ CITATION Dou10 \l 2058 ]
SOLUCION:
a) En este caso se ignora, pero se sabe que la media de la muestra es de 45 420 dólares. De ahí que la mejor
estimación del valor de población sea el estadístico de la muestra correspondiente: por consiguiente, la media de
la muestra de 45 420 dólares constituye un estimador puntual de la media poblacional desconocida.
b) La asociación decide utilizar in nivel de confianza de 95%. Para determinar el intervalo de confianza
correspondiente, se aplica:

σ $ 2050
X́ ± Z =$ 45420 ± 1.96 =$ 45420 ± $ 574
√n √ 49
Los límites del intervalo de confianza son 44846 y 45994 dólares. (Que se calcula restando 574 dólares y sumando
574 dólares a la media muestral). El grado o nivel de confianza es de 95%, y el intervalo de confianza abarca de
44846 hasta 45994 dólares. A±$574 s e le llama margen de error.
c) Suponga que usted selecciona varias muestras de 49 gerentes, tal vez varios cientos. Para cada muestra, calcula la
media y después constituye un intervalo de confianza de 95%, como en la sección anterior. Puede esperar que
alrededor de 95% de estos intervalos de confianza contenga la media de la población.

TEOREMA DEL LIMITE CENTRAL


27. Si una lata de 1 galón de pintura cubre, en promedio, 513.3 pies cuadrados con una desviación estándar de
31.5 pies cuadrados, ¿Cuál es la probabilidad de que el área media muestral, cubierta por una muestra de 40 de
dichas latas de 1 galón, estará en alguna parte entre 510 a 520 pies cuadrados?[CITATION Ric \l 2058 ]
SOLUCION:
Se deberá encontrar el área de curva normal entre
510−513.3 520−513.3
Z= =−0.066 y Z= =1.34
31.5 31.5
√ 40 √ 40
Luego, al comprobar estos valores en la tabla 3, se obtiene una probabilidad de 0.6553.
Advierta que, si X́ evidencia ser mucho menor que 513.3, por decir, menor que 500, ello provocaría serias dudas acerca
de si la muestra realmente proviene de una población con μ=513.3 y σ =31.5 ; la probabilidad de obtener tal
valor pequeño (un valor Z menor que -2.67) tan solo es de 0.0038.

PRUEBA DE HIPÓTESIS SOBRE LA MEDIA, CON VARIANZA DESCONOCIDA.


28. Las especificaciones para cierto tipo de listón requiere una resistencia a la rotura media de 180 libras. Si
cinco piezas del listón (seleccionadas aleatoriamente de diferentes rollos) tienen un resistencia a la rotura
media de 169.5 libras, con una desviación estándar de 5.7 libras, pruebe la hipótesis nula μ=1180 libras
contra la hipótesis alternativa μ<180 libras al nivel de significancia 0.01. Suponga que la distribución
poblacional es normal.[ CITATION Ric1 \l 2058 ]
SOLUCION:
Hipótesis nula: μ=180 libras
Hipótesis alterna: μ<180 libras
α =0.01
Criterio: Se rechaza la hipótesis nula si t←3.747 , donde 3.747 es el valor de t 0.01 para 5−1=4 grados de

libertad:

X́−μ0
t=
S
√n
169.5−180
t= =−4.12
5.7
√5
Decisión: dado que t=−4012 es menor que −3.747 , la hipótesis nula debe rechazarse al nivel α =0.01
. En otras palabras, la resistencia a la rotura está por debajo de las especificaciones. La probabilidad de cola exacta, o valor
P, es 0.0073.
La evidencia contra la resistencia a la rotura media de 180 libras es incluso más fuerte que 0.01.

PRUEBA DE HIPÓTESIS PARA DOS POBLACIONES


29. Una compañía afirma que sus bombillas eléctricas tiene un promedio de vida superior a las de su principal
competidor. Si un estudio demostró que una muestra de n1=40 de sus bombillas tiene una vida media de
1.647 horas de uso continuo, con una desviación estándar de 27 horas, mientras que una muestra de
n2=40 bombillas fabricadas por su principal competidor tiene una vida media de 1.638 horas de uso
continuo, con una desviación estándar de 31 horas, ¿esto respalda la afirmación con un nivel de significancia de
0.05?[ CITATION Ric2 \l 2058 ]
SOLUCION:
1−¿ μ2=0
Hipótesis nula:
μ¿
1−¿ μ2 >0
Hipótesis alterna::
μ¿
α =0.05
Criterio: rechazar la hipótesis nula si Z > 1.645, donde Z está dada por:
x́− ý 1.647−1.638
z= Z= =1.38
2 2
σ σ 27 2 312
√ x
+
nx n y
y
√ +
40 40

Decisión: puesto que Z =1.38 no supera 1.645, la hipótesis nula no puede rechazarse; esto es , la
diferencia observada entre las dos medias muéstrales no es significativa.
El valor P=0.0838, de modo que la evidencia contra medias iguales no es muy fuerte.
Para juzgar la fortaleza, con la finalidad de apoyar la hipótesis nula cuando no se rechaza, considere errores
tipo II para los cuales las probabilidades dependen de las diferencias alternativas reales δ ’ ¿ μ1−μ2 .
Por fortuna, estas pueden determinarse con los resultados muéstrales individuales (en tanto se tomen muestras
de poblaciones normales con desviaciones estándares, o ambas muestras sean grandes).

REGRESION SIMPLE Y CORRELACION (METODO DE MINIMOS CUADRADOS)


30. Las siguientes son mediciones de la velocidad del aire y el coeficiente de evaporación e gotas de
combustible quemado en un motor de impulso:[ CITATION Ric3 \l 2058 ]
Velocidad del aire (cm/s) Coeficiente de evaporación Ajuste una línea recta a tales datos usando el método
X (mm2/s) de mínimos cuadrados; úsela para estimar el
Y coeficiente de evaporación de una gotita cuando la
20 0.18 velocidad del aire sea de 190 cm/s.
60 0.37 SOLUCION:
100 0.35
Para los n=10 pares ( X i , Y i ) , se calcula primero.
140 0.78
n n
180 0.56
220 0.75 ∑ X i=2,000 ∑ X 2i =532,000
i=1 i=1
260 1.18
300 1.36 n n

340 1.17 ∑ Y i=8.35 ∑ X i Y i=2,175.40


380 1.65 i=1 i=1

∑ Y 2i =9.1097
i=1

Y luego se obtiene

( 2000 )2 ( 2000 )( 8.35 )


S XX =532000− =132000 S XY =2175.40− =505.40
10 10
( 8.35)2
S YY =9.1097− =2.13745
10
En consecuencia,

S XY 505.40
b= = =0.00383
S XX 132000
Y entonces

´ = 8.35 −0.0038 2000 =0.069


a=Ý −bX
10 10
Por consiguiente, la ecuación de la línea recta que se ajusta mejor a los datos dados e sentido de mínimos cuadrados es

Ý =0.069+ 0.00383 X

Mientras que para X =190 se predice que el coeficiente de evaporación será

Y^ =0.069+ 0.00383 (190 )=0.80 m m2 / s


Finalmente, la suma de cuadrados residual es:

S 2XY 2
(505.40 )
S YY − =2.13745− =0.20238
S XX 132000
Para evitar confusión, se deja en claro que hay dos posibles líneas de regresión.
TRABAJOS CITADOS
Douglas A. Lind, ,. W. (2010). Estadística aplicada a los negocios y la economía . McGraw-Hill.

Johnson, R. A. (s.f.). Probabilidad y estadistica para ingenieros. Pearson.

Johnson, R. A. (s.f.). Probabilidad y estadistica para ingenieros. Pearson.

Johnson, R. A. (s.f.). Probabilidad y estadistica para ingenieros. Pearson.

Johnson, R. A. (s.f.). Probabilidad y estadistica para ingenieros. Pearson.

Levine, D. M. (2014). Estadistica para administracion. Mexico: Pearson.

Levine, D. M. (2014). Estadistica para administracion. Mexico : Pearson.

Levine, D. M. (2014). Estadistica para administracion. Mexico: Pearson .

Levine, D. M. (2014). Estadistica para administracion. Mexico: Pearson .

Levine, D. M. (2014). Estadistica para administracion. Mexico : Pearson.

Levine, D. M. (2014). Estadistica para administracion. Mexico: Pearson.

Levine, D. M. (2014). Estadistica para administracion. Mexico: Pearson.

Levine, D. M. (2014). Estadistica pra administracion . Mexico: Pearson.

Levine, D. M. (s.f.). Estadistica para administracion. Mexico: Pearson.

Marta. (s.f.). Superprof material didactico. Obtenido de Ejercicios de correlacion y regresion :


https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/ejercicios-de-correlacion-y-regresion.html

Paul Newbold, W. L. (2013). Estadistica para administracio y eocnomia. Madrid: Pearson.

Paul Newbold, W. L. (2013). Estadistica para administracion y economia. Madrid: Pearson .

Paul Newbold, W. L. (2013). Estadistica para administracion y economia. Madrid: Pearson.

Paul Newbold, W. L. (2013). Estadistica para administracion y economia. Madrid: Pearson .

Paul Newbold, W. L. (2013). Estadistica para administracion y economia. Madrid: Pearson.

Paul Newbold, W. L. (2013). Estadistica para administracion y economia . Madrid: Pearson.

Paul Newbold, W. L. (2013). Estadistica pra administracion y econoimia. Madrid: Pearson.

Spiegel, M. R. (2013). Probabilidad y estadistica. McGraw-Hill.

Spiegel, M. R. (2013). Probabilidad y estadistica. McGraw-Hill.

Spiegel, M. R. (2013). Probabilidad y estadistica. McGraw-Hill.

Spiegel, M. R. (2013). Probabilidad y estadistica . McGraw-Hill.

Triola, M. F. (2013). Estadistica. Mexico: Pearson.

Triola, M. F. (2013). Estadistica. Mexico: Pearson.

Triola, M. F. (2013). Estadística. Mexico: PEARSON.

Universidad de Alicante. (s.f.). docencia en Estadistica Aplicada. . Obtenido de https://rua.ua.es/dspace/bitstream/10045/25453/6/ANOVA-


resuelto.pdf

También podría gustarte