Intervalo de Confianza para La Diferencia de Medias

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

INTERVALO DE CONFIANZA PARA LA RAZON DE VARIANZAS

Sean 𝑆12 y 𝑆22 dos cuasivarianzas de muestras con tamaños m y n , extraídas de poblaciones
normales con varianzas 𝜎12 y 𝜎22

Entonces, el intervalo de confianza para la razón de varianzas al (1- α)100% es

𝑆12 1 𝜎12 𝑆12


[ ≤ ≤ 𝐹 𝛼]
𝑆22 𝐹𝑚−1,𝑛−1,𝛼 𝜎22 𝑆22 𝑛−1,𝑚−1, 2
2
𝛼
𝐹𝑚−1,𝑛−1,𝛼 es un valor F que deja un área de 2 a la derecha.
2

Interpretación

(𝑎, 𝑏)

• 𝑎 y 𝑏 ambos (0,1) → 𝜎12 < 𝜎22 , el numerador de la varianza 1 es menor que la varianza
2, la varianza 1 tiene mayor concentración de datos que la varianza 2 y tiende hacer una
curva de diferente curtosis a la muestra 2(la primera puede ser leptocúrtica y la segunda
platicúrtica). Entonces difiere.
• 𝑎 y 𝑏 ambos mayor que 1 → 𝜎12 > 𝜎22 , este cociente es con un numerador mayor que el
denominador, los datos son más dispersos en la varianza 1 que la varianza 2, la varianza
1 es más disperso que la varianza 2. Entonces no hay homogenización de varianzas.
• Si 𝑎 ∈ (0,1)& 𝑏 > 1 → 𝜎12 = 𝜎22 . Entonces las varianzas son homogéneas.

Ejemplo 01

Un experimento publicado en popular a Science comparó el ahorro de combustible para dos


tipos de camiones compactos que funcionan con diesel y están equipados de forma similar.
Suponga que se utilizaron 12 camiones Volkswagen y 10 Toyota en pruebas con una velocidad
constante de 90 km/h. Si los 12 camiones Volkswagen promedian 16 km por litro con una
desviación estándar de 1 km por litro, y los 10 Toyota promedian 11 km por litro con una
desviación estándar de 0,8 km por litro, construya un intervalo de confianza del 90% para la
relación de varianzas.

Solución
2 =1
𝑠𝑚

𝑠𝑛2 = 0.64
m = 12
n = 10
𝛼/2 = 0.05
𝐹0.05 (11,9) = 3.16
𝐹0.05 (9,11) = 2.90
2
1 1 𝜎𝑚 1
( )< 2 < (2.90)
0.64 3.16 𝜎𝑛 0.64

1
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

2
𝜎𝑚
0.4945 < < 4.5313
𝜎𝑛2
Entonces las varianzas son homogéneas con un nivel de confianza del 90%.

Ejemplo 02
Se comparan el rendimiento de la gasolina de dos automóviles, A y B, probando cinco marcas de gasolina
con el automóvil A y cuatro con B. Cada uno de los vehículos gasta un tanque de cada marca, y el
resultado, en millas por galón, es el siguiente.

Calcule un intervalo de confianza de 99% para el cociente de las varianzas de los rendimientos de
gasolina con los automóviles A y B.

Ejemplo 03
Los siguientes datos corresponden a la resistencia a la compresión a los 28 días (en kg/cm2) reportados
por dos laboratorios.

Con 95% de confianza, ¿podemos asumir que existe homogeneidad de las varianzas de los resultados de
resistencia a la compresión? Asuma poblaciones normales.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE LAS MEDIAS DE DOS VARIABLES


ALEATORIAS NORMALES INDEPENDIENTES

Caso1: las varianzas poblacionales se conocen

2
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

Si 𝑋𝐴 y 𝑋𝐵 son las medias muestrales aleatorias independientes de tamaño 𝑛𝐴 y 𝑛𝐵 de


poblaciones con varianzas 𝜎𝐴2 y 𝜎𝐵2 , respectivamente, un intervalo de confianza (1 − 𝛼)100%
para 𝜇𝐴 − 𝜇𝐵 esta dada por:

𝜎2 𝜎2 𝜎2 𝜎2
(𝑋𝐴 − 𝑋𝐵 ) − 𝑍1−𝑎/2 √ 𝐴 + 𝐵 < 𝜇𝐴 − 𝜇𝐵 < (𝑋𝐴 − 𝑋𝐵 ) + 𝑍1−𝑎/2 √ 𝐴 + 𝐵
𝑛𝐴 𝑛𝐵 𝑛𝐴 𝑛𝐵

Donde Z1−𝛼/2 es el valor de Z que deja un área de 1 − 𝛼/2 a la izquierda.

Interpretación

[++] ⟶ a favor del primero

[−−] ⟶ a favor del segundo

[−+] ⟶ son iguales

Ejemplo 4

Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B . Se mide el


rendimiento de millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y
75 con el motor B. La gasolina que se utiliza y las demás condiciones se mantienen constantes
el rendimiento promedio de gasolina para el motor A es de 36 millas por galón y en promedio
para el motor B es 42 millas por galón. Encuentre un intervalo de confianza de 96% sobre 𝜇𝐵 −
𝜇𝐴 , dónde 𝜇𝐵 y 𝜇𝐴 son el rendimiento de gasolina medio poblacional para los motores B y A,
respectivamente. Suponga que las desviaciones estándar poblacionales son seis y ocho para los
motores A y B, respectivamente.

Población A Población B
nA = 50 n𝐵 = 75
𝑥𝐴 = 36 𝑥𝐵 = 42
𝜎𝐴 = 6 𝜎8 = 8

𝛼 = 4% = 0.04
𝛼/2 = 2%

𝑋𝐵 − 𝑋𝐴 = 42 − 36 = 6
Desviación estándar muestral

𝜎𝐴2 𝜎𝐵2 (6)2 (8)2


√ + = √ + = 1.254
𝑛𝐴 𝑛𝐵 50 75

Valor critico o percentil 0.98

𝑍1−𝛼/2 = 𝑍0.98 = 2.055

3
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

𝐼𝐶 = ((𝑋𝐵 − 𝑋𝐴 ) − error, (𝑋𝐵 − 𝑋𝐴 ) + error )

𝑁(6,1.254)

𝜎2 𝜎2
error = 𝑍𝛼/2 √ 𝐴 + 𝐵
𝑛𝐴 𝑛𝐵

error = 2.055 ∗ 1.254 = 2.58


Intervalo de confianza

𝐼𝐶 = ((𝑋𝐵 − 𝑋𝐴 ) − error, (𝑋𝐵 − 𝑋𝐴 ) + error )

𝐼𝐶 = (6 − 2.58,6 + 2.58)
𝐼𝐶 = (3.42,8.58)
+3.42 < 𝜇𝐵 − 𝜇𝐴 < +8.58

[++] ⟶ a favor del primero

4
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

𝑁(6,1.254)

Interpretación

Si hay una diferencia sustancial entre las medias de rendimiento del motor B y del motor A, es
a favor del motor B con un 96% de confianza.

Ejemplo 5

El gasto diario en llamadas telefónicas de dos departamentos X e Y de una misma empresa sigue
una distribución normal, con gasto medio desconocido en ambos. Sin embargo, se conocen las
desviaciones típicas, que son 100 y 110 dólares para X e Y, respectivamente. La dirección ha
observado que una muestra aleatoria de 20 días, el gasto medio diario en llamadas realizadas
por el departamento X ha sido de 1100 dólares, y de 1400 en el departamento Y. Obtenga un
intervalo de confianza del 90% para la diferencia de gastos medios entre ambos departamentos.

Caso 2: las varianzas poblacionales no se conocen pero son iguales


Muestras pequeñas
A partir de una de una muestra de tamaño n, para la variable X y de una muestra de
tamaño m para la variable Y, ambas independientes, se encuentra que un intervalo para
estimar la diferencia de medias 𝜇1 − 𝜇2 al nivel de confianza del (1-α)100%, es:

  Sc2   Sc2   Sc2   Sc2  


( X − Y ) − t1−   n  +  m  , ( X − Y ) + t1−   n  +  m  
 2     2     
Donde

2 ( n−1)S x2 +( m−1)S y2
Sc = ; t t n+ m−2
n+ m−2

5
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

Ejemplo 6

25 pacientes de cada uno de los hospitales y se registra el número de días de estancia de los
pacientes. Los datos recogidos en cada hospital son:

Hospital 34 34 22 20 20 30 30 17 21 20 27 27 17 25
A 21 20 27 26 26 15 19 20 22 22 23
Hospital 30 30 35 19 19 30 28 29 27 19 23 23 26 30
B 27 26 23 16 29 24 29 26 33 32 22

A B
n 𝑛1 =25 𝑛2 =25
𝑋1 =23.4 𝑋2 =26.2
𝑠1 =5.05799697 𝑠2 =4.81317636

𝑛1 + 𝑛2 − 2 = 48
𝛼= 0.01
𝛼/2 = 0.005
1 − 𝛼/2 = 0.995
𝑡0.995,48 = 2.682

(𝑛 − 1)𝑠12 + (𝑛2 − 1)𝑠22 1 1


(𝜇1 − 𝜇2 ) ∈ ((𝑥1 − 𝑥2 ) ± 𝑡(1−𝛼,𝑛 √ 1 √ + )
2 1 +𝑛2 −2) 𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

(25 − 1)5, 0582 + (25 − 1)4, 813182 1 1


(𝜇1 − 𝜇2 ) ∈ ((23,4 − 26,2) ± 2,682√ √ + )
25 + 25 − 2 25 25

−6.54549 ≤ 𝜇1 − 𝜇2 ≤ 0.9454941

Interpretación

Con un nivel de confianza del 99% se puede decir que el promedio de estancia de los pacientes
hospitalizados en la ciudad B no es diferente al de la ciudad A, ya que no existe diferencia
estadística significativa.

Ejemplo 07

Con el fin de comparar los promedios de tiempo, en minutos, en que los trabajadores de dos
turnos diferentes, A y B, realizan una tarea, se registraron los tiempos correspondientes a 9
trabajadores de cada uno de los turnos. Para el turno A se obtuvo: 32 37 35 28 41 44 35 31 34 y
para el turno B: 35 31 29 25 34 40 27 32 31. A un nivel de confianza del 99% diga usted si los
tiempos promedios son iguales en los dos turnos

Caso 3: las varianzas poblacionales no se conocen y son diferentes

En este caso el intervalo para estimar la diferencia de medias 𝜇1 − 𝜇2 al nivel de confianza


del (1-α)100%, es:

6
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

𝑆12 𝑆22 𝑆12 𝑆22


̄ ̄ )
[(𝑋 − 𝑌 − 𝑡1−𝛼,𝑟 √( ̄
(𝑋 ̄ )
) + ( ) , − 𝑌 + 𝑡1−𝛼,𝑟 √( ) + ( )]
2 𝑛 𝑚 2 𝑛 𝑚

Donde

𝑡 ∼ 𝑡𝑟

2
 S12 S22 
 + 
r=  n m 
2 2
 S12   S22 
   
 n   m 
+
n −1 m −1
Si r es mayor que 30, el estadístico t se aproxima a la distribución normal estándar y el
procedimiento a seguir es como el primer caso

Ejemplo 08

El consultor A tiene 10 años de experiencia, mientras que el consultor B tiene 1 año de


experiencia. Use α = 0.05 y determine si el consultor que tiene más años de experiencia obtuvo
una puntuación más alta. Se supone que las puntuaciones de los consultores, tiene distribución
normal

Intervalo de confianza para la diferencia de medias pareadas

Tenemos muestras pareadas o correlacionadas cuando sabemos de antemano que una


observación está relacionada con la otra. Pueden ser observaciones tomadas al mismo tiempo,
diseño pareado o medidas tomadas en un mismo sujeto o unidad en dos oportunidades o
tiempo distintos.

Sea (x1,y1), (x2,y2),……, (xn,yn) una muestra aleatoria pareada correspondiente a la poblaciones

7
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

( ) (
N  x , x2 , N  y , y2 )
Si se desconocen las varianzas, el intervalo de confianza es:
𝑠𝑑 𝑠𝑑
[𝑑 − 𝑡1−𝛼,𝑛−1 , 𝑑 + 𝑡1−𝛼,𝑛−1 ]
2 √𝑛 2 √𝑛

Siendo 𝑑 y 𝑠𝑑 media y desviación de las diferencias 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 ; 𝑖 = 1, . . . . , 𝑛 , además 𝑡 ∼


𝑡𝑛−1
Ejemplo 09

Como gerencia de Recursos Humanos en su empresa usted debe evaluar si una capacitación
laboral adicional dirigida a 10 empleados del sector productivo será eficiente, por lo que decide
evaluar a sus empleados con una prueba antes y después de habérseles impartido dicha
capacitación. Con base en los puntajes mostrados en la tabla siguiente, usted debe estimar con
un 90% de confianza si después de la capacitación se obtienen mayores puntajes.

Empleado Puntaje antes Puntaje después


1 9.0 9.2
2 7.3 8.2
3 6.7 8.5
4 5.3 4.9
5 8.7 8.9
6 6.3 5.8
7 7.9 8.2
8 7.3 7.8
9 8.0 9.5
10 7.5 8.0

Solución
𝛼 = 10%
g.l =9
𝐭 = 𝟏, 𝟖𝟑𝟑
Diferencia promedio entre las observaciones pareadas

Puntaje Puntaje
Empleado diferencia =d
antes después
1 9 9.2 -0.2
2 7.3 8.2 -0.9
3 6.7 8.5 -1.8
4 5.3 4.9 0.4
5 8.7 8.9 -0.2
6 6.3 5.8 0.5
7 7.9 8.2 -0.3

8
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

8 7.3 7.8 -0.5


9 8 9.5 -1.5
10 7.5 8 -0.5
suma -5
suma/10 -0.5

Promedio de las diferencias

Σ𝑑𝑖 −5
𝑑= = = −0.5
𝑛 10
Desviación estándar de las diferencias entre las observaciones pareadas

∑(𝑑𝑖 − 𝑑)2
𝑠𝑑 = √ = 0.736357
𝑛−1

𝑠𝑑
𝜇𝑑 = 𝑑 ± 𝑡
√𝑛
−0.927 ≤ 𝜇𝑑 ≤ −0.073
Conclusión: El gerente de RR.HH. Puede tener el 90% de confianza que antes de la capacitación
se obtienen entre 0.073 y 0.927 puntos menos que después de recibir la capacitación.

Ejemplo 10

Un profesor desea examinar el cambio en el rendimiento de los Estudiantes en cálculo I cuando


se usa un método de enseñanza A. Antes de iniciar la enseñanza con este método 6 Estudiantes
fueron evaluados. Al finalizar la enseñanza estos mismos estudiantes fueron evaluados, los
resultados se encuentran en el siguiente cuadro. Suponiendo que los rendimientos de los
estudiantes siguen una distribución normal, determine el intervalo de confianza del 98% para la
diferencia de rendimientos y diga si hubo influencia del método de enseñanza empleado en el
rendimiento

Prueba antes 75 70 75 65 70 90

Prueba después 85 70 80 80 75 100

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES EN DOS POBLACIONES


INDEPENDIENTES

Una aproximación del intervalo de confianza al nivel (1-α) para la diferencia de proporciones

9
INTERVALO DE CONFIANZA PARA DOS VARIABLES ALEATORIAS NORMALES INDEPENDIENTES

𝜋1 − 𝜋2 es:


( p1 − p2 ) − Z1−2

( p1 (1− p1 )
n1 )+( p2 (1− p2 )
n2 ), ( p − p ) + Z (
1 2 1− 2
p1 (1− p1 )
n1 )+( p2 (1− p2 )
n2 ) 
Ejemplo 11
Muestras de dos tipos de materiales A y B, sujetos a cambios extremos de temperatura, produjeron los
resultados que se muestran en la siguiente tabla

A un 98% de nivel de confianza, ¿la proporción de desintegrados del material A es la misma que para el
material B?

Ejemplo 12

Una encuesta de 1000 estudiantes concluye que 274 eligen al equipo profesional de béisbol A como su
equipo favorito. En 1991, se realizó la misma encuesta con 760 estudiantes. Concluyó que 240 de ellos
también eligieron al equipo A como su favorito. Calcule un intervalo de confianza del 95% para la
diferencia entre la proporción de estudiantes que favorecen al equipo A entre las dos encuestas. ¿Hay una
diferencia significativa?

10

También podría gustarte