Guia 10A. Introduccion A La Inferencia

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

1

Programa para la inmersión a la Educación Superior - PIES

Departamento de Ciencias Básicas


Área: Estadı́stica
Guı́a # 10B
Programas: Ingenierı́a de alimentos, Ingenierı́a de Automatización, Ingenierı́a Ambiental
y sanitaria, Ingenierı́a Eléctrica, Ingenierı́a Civil, Ingenierı́a Quı́mica, Administración de
Empresas, Contadurı́a Pública, Urbanismo, Biologı́a, Economı́a, Finanzas y comercio inter-
nacional, Negocios y Relaciones Internacionales, Trabajo Social, Optometrı́a, Veterinaria,
Zootecnia y Administración de Agronegocios.

Elaborado por: Edgar Palacios Segura

Fecha de elaboración: Abril 20 de 2018

Tema: Inferencia Comparación de dos Medias

INTENCIONALIDAD

Habilidades que se pretenden desarrollar.


Describir los intervalos de confianza para la comparación de medias de dos poblaciones.
Describir las pruebas de hipótesis para la comparación medias de dos poblaciones.

DESARROLLO DEL CONCEPTO:

Inferencia acerca de la diferencia entre dos medias poblacionales


El objeto de la guı́a consiste en extender los métodos de estimación, como los métodos de
pruebas de hipótesis y/o intervalos de confianza en situaciones que incluyen dos muestras.
La inferencia de dos medias es la comparación de las respuestas de dos tratamientos o la
comparación de las caracterı́sticas de dos poblaciones. Tenemos una muestra distinta de
cada población o de cada tratamiento.
Dos muestras son independientes si los valores muestrales seleccionados de una población
no están relacionados, pareados o asociados de alguna manera con los valores muestrales
seleccionados de la otra población.
Dos muestras son dependientes si los valores muestrales están pareados. [Es decir, cada
par de valores muestrales consiste en dos medidas del mismo sujeto (por ejemplo, datos de
antes/después), o si cada par de valores muestrales consiste en datos asociados (por ejemplo,
datos de esposo/esposa), donde la asociación se basa en alguna relación inherente].
Inferencia de la diferencia entre dos medias poblacionales: σ1 y σ2 conocidas con
muestras independientes
Sean µ1 la media de la población 1 y µ2 la media de la población 2, se hace inferencia acerca
de la diferencia entre las medias: µ1 − µ2 . Se elige una muestra aleatoria simple de tamaño
n1 de la población 1 y otra muestra aleatoria simple n2 de la población 2.
2

Estimación por intervalo de µ1 − µ2


La estimación puntual de la diferencia entre las dos medias poblacionales es la diferencia
entre las dos medias muestrales: x̄1 − x̄2
Error estándar de x̄1 − x̄2 es:
s
σ12 σ22
σx̄1 −x̄2 = +
n1 n2
Una estimación por intervalo esta dada por:
estimacion puntual ± margen de error
Como la distribución muestral de x̄1 − x̄2 tiene una distribución normal, el margen de error
se escribe como sigue: s
σ12 σ22
Margen de error = z 2 α +
n1 n2
La estimación por intervalo con un nivel de confianza 1 − α entre dos medias poblacionales
con σ1 y σ2 conocidas es: s
σ12 σ22
x̄1 − x̄2 ± z α2 +
n1 n2
Prueba de hipótesis acerca de µ1 − µ2
Las tres formas que tiene una prueba de hipótesis son:
H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0 H0 : µ1 − µ2 = D0
Ha : µ1 − µ2 < D0 Ha : µ1 − µ2 > D0 Ha : µ1 − µ2 6= D0
Cuando D0 = 0 significa que la hipótesis nula es que µ1 y µ2 son iguales.
Estadistico de prueba para la prueba de hipótesis acerca µ1 −µ2 y σ1 y σ2 conocidas

(x̄1 − x̄2 ) − (µ1 − µ2 )


z= r 2
σ1 σ22
+
n1 n2
Inferencias de la diferencia entre dos medias poblacionales: σ1 y σ2 desconocidas
e iguales
En este caso para estimar las dos desviaciones estándar poblacionales desconocidas se usan
las desviaciones estándar muestrales s1 y s2 . Cuando se usan las desviaciones estándar
muestrales en las estimaciones por intervalo y en las pruebas de hipótesis, se emplea la
distribución t de student en lugar de la distribución normal estándar.
La principal diferencia se encuentra en que este método utiliza un estimador agrupado común
de la varianza poblacional igual. (Es la media ponderada de las dos varianzas muetrales).
Este estimador es:
(n1 − 1) s21 + (n2 − 1) s22
Sp2 =
n1 + n2 − 2
3

La estimación por intervalo con un nivel de confianza 1 − α entre dos medias poblacionales
con σ1 y σ2 desconocidas e iguales es:
r
1 1
x̄1 − x̄2 ± t α2 Sp +
n1 n2
Estadı́stico de prueba para la prueba de hipótesis acerca µ1 − µ2 y σ1 y σ2
desconocidas e iguales

(x̄1 − x̄2 ) − (µ1 − µ2 )


t= r
1 1
Sp +
n1 n2
Los grados de libertad para la distribución t de Student se obtienen con
Grados de libertad = n1 + n2 − 2
Inferencias de la diferencia entre dos medias poblacionales: σ1 y σ2 desconocidas
y diferentes
En este caso para estimar las dos desviaciones estándar poblacionales desconocidas se usan
las desviaciones estándar muestrales s1 y s2 . Cuando se usan las desviaciones estándar
muestrales en las estimaciones por intervalo y en las pruebas de hipótesis, se emplea la
distribución t de student en lugar de la distribución normal estándar.
La estimación por intervalo con un nivel de confianza 1 − α entre dos medias poblacionales
con σ1 y σ2 desconocidas es: s
s21 s2
x̄1 − x̄2 ± t α2 + 2
n1 n2
Estadı́stico de prueba para la prueba de hipótesis acerca µ1 − µ2 y σ1 y σ2
desconocidas y diferentes

(x̄1 − x̄2 ) − (µ1 − µ2 )


t= r 2
s1 s2
+ 2
n1 n2
Los grados de libertad para la distribución t de Student se obtienen con la ecuación.


2 2

2

s 1 s 2

+
n 1 n 2

Grados de libertad =  2 2  2 2

s1 s2

n n
1 2
+
n1 − 1 n2 − 1

Inferencia de la diferencia entre dos medias poblacionales: Muestras dependien-


tes (pareadas)
4

En el diseño de muestras dependientes se considera la diferencias de las observaciones


di = x1i − x2i .
Sea µd la media de las diferencias en una población.Para hacer inferencias sobre µd se usa
¯
la distribución de muestreo para la media muestral de las diferencias d:
d¯ − µd
t= s
√d
n
Donde d¯ es la media de la diferencias muestrales di y sd es la desviación estándar muestral
de la diferencias. La distribución t de Student con n − 1 grados de libertad.
Estimación por intervalo de Confianza para µd
sd
d¯ ± t α2 √
n
Estadı́stico de prueba para la prueba de hipótesis para µd

d¯ − µd
t= s
√d
n
Con (n − 1) grados de libertad.

EJEMPLOS

Ejemplo 1.
Un agricultor quiere probar si un nuevo insecticida es más eficiente debido a que reducirá
las perdidas debidas al daño de los insectos. Para aprobar la afirmación, el agricultor rocı́a
21 arboles con el nuevo insecticida y otros 16 árboles con el insecticida tradicional. Se
obtuvieron los siguientes datos en relación al rendimiento por árbol (en libras de fruta):
Insecticida Nuevo Insecticida Tradicional
Promedio 240 227
Varianza 900 325
Los datos proporcionan evidencia suficiente para concluir que el insecticida nuevo es más
eficiente que el normal. Compara los promedio por mediante un intervalo de confianza del
90 %. Suponga que no hay diferencia significativa entre las varianzas poblacionales.
Solución:
X1 : Cantidad de fruta recolectada en los arboles tratados con el insecticida nuevo
X2 : Cantidad de fruta recolectada en los arboles tratados con el insecticida tradicional
n1 = 21, n2 = 16, x̄1 = 240, x̄2 = 227, s1 = 30, s2 = 25
Se necesita estimar la varianza conjunta que comparten las muestras:
(21 − 1) ∗ 900 + (16 − 1) ∗ 625
Sp2 = = 782,143
21 + 16 − 2
5

Sp = 27,967
Los grado de libertad son n1 + n2 − 2 = 21 + 16 − 2 = 35
El valor crı́tico para un nivel de confianza del 90 % es t0,05,35 = 1,69
La estimación puntual es: 240 −r 227 = 13
1 1
Margen de error = 1,69 ∗ 27,967 + = 15,68
21 16
Se obtiene el intervalo
13 ± 15,68
−2,68 < µ < 28,68
Con una confianza del 90 % se estima que la diferencia real entre la cantidad promedio de
fruta recolectada en los árboles tratados con el insecticida nuevo y el promedio de fruta
recolectado en los árboles tratados con el insecticida tradicional se encuentra entre -2.68 y
28.68.
Puesto que el intervalo contiene el valor cero, no hay diferencia significativa en los rendi-
mientos por árbol al usar estos dos insecticidas.
Ejemplo 2.
En una comparación sobre la reducción media de peso (libras) en un mes para mujeres de
20 a 30 año, se obtienen los siguientes resultados.

Dieta I Dieta II
Tamaño de muestra 18 15
Promedio 10 8
Varianza 4.3 5.7

Estos datos representan evidencia suficiente para pensar que la reducción promedio de peso
entre quienes siguen la dieta I es mayor que entre aquellos que eligen la dieta II. Pruebe a
un nivel de significancia del 5 %. Suponga que las varianza poblacionales son iguales.
Solución
Paso 1. Planteamiento de las Hipótesis
X1 : Reducción del peso en la mujeres sometidas a la dieta I
X2 : Reducción del peso en las mujeres sometidas a la dieta II
Planteamos la hipótesis nula como la reducción promedio del peso entre las dos dietas es
igual, y la hipótesis alternativa que el la reducción del peso promedio es mayor en la dieta
I que en la dieta II.

H0 : µ1 − µ2 = 0
Ha : µ1 − µ2 > 0
Paso 2. estadı́stico de prueba
Los estadı́sticos son: n1 = 18, n2 = 15, x̄1 = 10, x̄2 = 8, s21 = 4,3, s22 = 5,7
El estadı́stico de prueba es la distribución t student con 18 + 15 − 2 = 31 grados de libertad,
6

suponiendo que la población tiene una distribución normal. Se necesita estimar la varianza
conjunta que comparten las muestras:
(18 − 1) ∗ 4,3 + (15 − 1) ∗ 5,7
Sp2 = = 4,9323
18 + 15 − +2
Sp = 2,221
(10 − 8) − 0
tc = r = 2,576
1 1
2,221 +
18 15
Paso 3. Valor P
El valorP para t = 2,576 es el área situada a la derecha de 2.576 por debajo de la curva de
la distribución t con 31 grados de libertad. Con un programa estadı́stico como R o la tabla
t student, obtenemos el
V alorP = P (T > 2,576) = 0,00749
Como el Valor P es menor que el nivel de significancia α. se rechaza la hipótesis nula.
Paso 4. Conclusión
Existe suficiente evidencia muestral que indica que la reducción promedio de peso entre las
personas que siguen la dieta I es mayor que aquelos que se someten a la dieta II con un
nivel de significancia de 0.05

EJERCICIOS PROPUESTOS

1. En un ensayo aleatorizado y controlado realizado con niños que padecı́an infecciones


respiratorias virales, 46 niños fueron tratados con bajos niveles de humedad, mientras
que otros 46 niños fueron tratados con altos niveles de humedad. Los investigadores
utilizaron la puntuación Westley Croup para evaluar los resultados después de una
hora. El grupo con bajo nivel de humedad tuvo una puntuación media de 0.98, con una
desviación estándar de 1.22, y el grupo con alto nivel de humedad tuvo una puntuación
media de 1.09, con una desviación estándar de 1.11 (según datos de ”Controlled Delivery
of High vs Low Humidity vs Mist Therapy for Croup Emergency Department”, de
Scolnik, et al., Journal of the American Medical Association, vol. 295, núm. 11). Utilice
un nivel de significancia de 0.05 para someter a prueba la afirmación de que los dos
grupos provienen de poblaciones con la misma media. ¿Qué sugiere el resultado acerca
del tratamiento común con humedad?
2. A continuación se presentan los tiempos (en segundos) durante los cuales se exhibe el
consumo de tabaco y alcohol en pelı́culas de dibujos animados de Disney. Utilice un
nivel de significancia de 0.05 para someter a prueba la afirmación de que la media de
las diferencias es mayor que 0 segundos, de manera que el consumo de tabaco se exhibe
durante más tiempo que el consumo de alcohol. ¿Cuánto tiempo se debe exhibir el
consumo de tabaco y alcohol en las pelı́culas de dibujos animados para niños?
7

Consumo de tabaco (seg) 175 51 0 295 74 2 23 205 6 155


Consumo de alcohol (seg) 88 33 113 51 0 3 46 73 5 74

3. Un estudio sobre métodos de enseñanza asistidos por ordenador, utilizó pictogramas


(piensa, por ejemplo, en los jeroglı́ficos egipcios) para la formación de niños con dificul-
tades de comunicación. El investigador diseñó dos lecciones de ordenador para enseñar
la misma materia, los mismos ejemplos. En una de las lecciones era necesario que los
niños interaccionaran con el ordenador; en la otra, los niños simplemente podı́an con-
trolar la velocidad de desarrollo de la lección. Vamos a llamar a estos dos tipos de
enseñanza: ”Activa” y ”Pasiva”, respectivamente. Después de las lecciones, el ordena-
dor presentaba una prueba en la que los niños tenı́an que identificar 56 pictogramas.
El número de identificaciones correctas de los 24 niños del grupo Activo fueron las
siguientes:

29 28 34 31 15 24 27 23 20 22 23 21
24 35 21 24 44 28 17 21 21 20 28 16

En el grupo Pasivo, el número de identificaciones correctas fue:

16 14 17 15 26 17 12 25 21 20 18 21
20 16 18 15 26 15 13 17 21 19 15 12
a) ¿Existe evidencia de que el método de enseñanza activo es mejor que el método
pasivo? Plantea las hipótesis, lleva a cabo la prueba y halla el valor P. ¿Cuáles son
tus conclusiones?
b) Calcula un intervalo de confianza del 90 % para el número medio de pictogramas
identificados correctamente por una gran población de niños que han pasado la
lección activa de ordenador.
c) ¿En qué supuestos se basan los procedimientos utilizados en (a) y (b)? ¿En cuál
de estos procedimientos puedes utilizar los datos para comprobar si se cumplen
los supuestos? Para los procedimientos que sea oportuno, utiliza los datos para
comprobar si se cumplen los supuestos que permiten su utilización. ¿Cuáles son
tus conclusiones?
4. Unos ”buscadores de talentos” sometieron a la prueba SAT, pensada para jóvenes
que han terminado sus estudios de secundaria, a muchachos de 13 años. Entre 1980 y
1982, participaron en las pruebas 19.883 muchachos y 19.937 muchachas. Los resultados
medios de los dos sexos en la prueba de Lengua son casi iguales, pero hay una clara
diferencia entre ambos sexos en la prueba de Matemáticas. No se conoce cuál es la
razón de esta diferencia. He aquı́ los datos.

Grupos x̄ s
Chicos 416 87
Chicas 380 74
8

Calcula un intervalo de confianza del 99 % para la diferencia entre la media de los resul-
tados de los muchachos y la media de los resultados de las muchachas de la población.
Los resultados de la prueba SAT, ¿tienen que tener una distribución normal para que
tu intervalo de confianza sea válido? ¿Por qué?
5. El maı́z común no tiene la cantidad de lisina que necesitan los animales en su pienso.
Unos cientı́ficos han desarrollado ciertas variedades de maı́z que contienen una mayor
cantidad de lisina. En una prueba sobre la calidad del maı́z con alto contenido en
lisina destinado a pienso animal, un grupo experimental de 20 pollos de un dı́a de edad
empezó a recibir una ración que contenı́a el nuevo maı́z. Un grupo de control de otros
20 pollos recibió una ración que era idéntica a la anterior, con la excepción de que
contenı́a maı́z normal. He aquı́ las ganancias de peso (en gramos) de los pollos a los 21
dı́as.
Grupo Control Grupo Experimental
380 321 366 356 345 361 447 401 375 430
283 349 402 462 455 434 403 393 426 339
356 410 324 399 360 446 318 467 403 440
350 384 316 272 431 427 420 472 392 326

a) Representa gráficamente los datos. ¿Hay observaciones atı́picas o asimetrı́as claras


que pudieran impedir la utilización de los procedimientos t?
b) ¿Existe suficiente evidencia de que los pollos alimentados con el maı́z con un alto
contenido en lisina ganan peso más deprisa? Lleva a cabo una prueba. ¿Cuáles son
tus conclusiones?
c) Calcula un intervalo de confianza del 95 % para la diferencia entre la media de los
pollos alimentados con maı́z con un alto contenido en lisina y la media de los pollos
alimentados con maı́z común.

BIBLIOGRAFÍA

1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman
and Company (2010).
2. Triola Mario F. ESTADISTICA. Decimoprimera Edición. Pearson Educación 2013.
3. Devore Jay l. PROBABILIDAD Y ESTADÍSTICA para ingenierı́a y ciencias. Octava
edición . Cengage Learnig 2010
4. Canavos George C. PROBABILIDAD Y ESTADÍSTICA, Aplicaciones y Métodos. Pri-
mera edición en español, Mc Graw Hill 1987.
5. Levin Richard I. y Rubı́n David S. ESTADÍSTICA para ADMINISTRADORES. Sexta
edición, Prentice Hall.
9

6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTADÍSTICA PARA


ADMINISTRACION Y ECONOMIA. Décima edición, Cengage Learnig.
7. Paul Newold, William L. Carlson y Betty Thorne. Estadı́stica para administración y
economı́a. Sexta edición. Prencice Hall.

También podría gustarte