5.1 Prueba Z para La Diferencia Entre 2 Proporciones: P N1P1 N1

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

5.

1 Prueba Z para la diferencia entre 2 proporciones


Sean P1 y P2 las proporciones muestrales de muestras grandes de tamaños N1 y N2 obtenidas de
poblaciones cuyas proporciones son p1 y p2. Considérese la hipótesis nula de que no hay
diferencia entre estos parámetros poblacionales (es decir, p1 = p2) y que por lo tanto las muestras
se han obtenido realmente de la misma población.

Haciendo, p1 = p2 = p, se ve que la distribución muestral de las diferencias entre las proporciones


es aproximadamente normal, y que su media y su desviación estándar están dadas por:

μp 1−μ p 2=0 y σp 1−σp 2= pq (


√ 1
+
N1 N2
1
)

N 1 P 1+ N 2 P 2
Donde: p=
N 1+ N 2

Se usa como estimación de la proporción poblacional y donde q = 1 − p.

P1−P 2−0 P 1−P 2


Empleando la variable estandarizada: z= =
σ P 1−P 2 σ P 1−P 2

Se puede probar la diferencia observada a nivel de significancia apropiado y con esto probar la
hipótesis nula.
Se pueden hacer pruebas con otros estadísticos de manera similar.

Ejemplo
Encontrar la probabilidad de obtener entre 40 y 60 caras inclusive en 100 lanzamientos de una moneda que
no esté cargada.

De acuerdo con la probabilidad binomial, la probabilidad buscada es:

( )( ) ( ) ( )( ) ( ) ( )( ) ( )
40 60 41 59 60 40
100 1 1 100 1 1 100 1 1
+ +…+
40 2 2 41 2 2 60 2 2

Como tanto Np=1/2 como Nq=1/2 son mayores que 5, para evaluar esta suma puede emplearse la
aproximación normal a la distribución binomial. La media y la desviación estándar de la cantidad de caras en
100 lanzamientos están dadas por:

μ=Np=100 ( 12 )=50 Y σ =√ Npq=√ 100( 12 )( 12 )=5


En una escala continua, entre 40 y 60 caras corresponden a entre 39.5 y 60.5 caras. Por lo tanto, se tiene
39.5 en unidades estándar = (39.5-50)/5 =-2.10 y 60.5 en unidades estándar= (60.5-50)/5 =2.10
Probabilidad buscada = área bajo la curva normal entre z = −2.10 y z = 2.10

= 2(área entre z = 0 y z = 2.10) = 2(0.4821) = 0.9642.

A. Encontrar la probabilidad de rechazar la hipótesis en caso de que en realidad sea correcta.

De acuerdo con el problema 10.1, la probabilidad de que no se obtengan entre 40 y 60 caras inclusive si la
moneda no está cargada es 1 − 0.9642 = 0.0358. Por lo tanto, la probabilidad de rechazar la hipótesis (nula)
cuando en realidad sea correcta es 0.0358.

B. ¿A qué conclusión se llega si en la muestra de 100 lanzamientos se obtienen 53 caras? ¿Y si se


obtienen 60 caras?

De acuerdo con la regla de decisión, en ambos casos debe aceptarse la hipótesis de que la moneda no está
cargada. Puede argumentarse que bastará que se obtenga una cara más para que se rechace la hipótesis. Esto
es a lo que se enfrenta cuando se emplea una clara línea divisoria para tomar una decisión.

Curva normal estándar en la que se


muestran las regiones de aceptación y
de rechazo para probar que una moneda
no está cargada.
5.2 Prueba para la diferencia entre dos proporciones
Considere el problema en el que se busca estimar la diferencia entre dos parámetros binomiales
p1 y p2. Por ejemplo, p1 podría ser la proporción de fuma dores con cáncer de pulmón y p2 la
proporción de no fumadores con cáncer de pulmón, y el problema consistiría en estimar la
diferencia entre estas dos proporciones. Primero seleccionamos muestras aleatorias
independientes de tamaños n1 y n2 a partir de las dos poblaciones binomiales con medias n1 p1 y
n2 p2, y varianzas n1 p1 q1 y n2 p2 q2, respectivamente, después determinamos los números x1 y
x2 de personas con cáncer de pulmón en cada muestra, y formamos las proporciones pˆ1 = x1 /n y
pˆ2 = x2 /n. El estadístico Pˆ1 – Pˆ2 provee un estimador puntual de la diferencia entre las dos
proporciones, p1 – p2. Por lo tanto, la diferencia de las proporciones muestrales, pˆ1 – pˆ2, se
utilizará como la estimación puntual de p1 – p2.

Se puede establecer un intervalo de confianza para p1 – p2 considerando la distribución muestral


de P ^ 1 - P ^ 2. De la sección 9.10 sabemos que P ^ 1 y P ^ 2 están distribuidos cada uno de forma
aproximadamente normal, con medias p1 y p2, y varianzas p1 q1 /n1 y p2 q2 / n2,
respectivamente. Al elegir muestras independientes de las dos poblaciones nos aseguramos de
que las variables P ^ 1 y P ^ 2 serán independientes y luego, por la propiedad reproductiva de la
distribución normal que se estableció en el teorema 7.11, concluimos que P ^ 1 - P ^ 2 está
distribuido de forma aproximadamente normal con media: μ ^ P 1− ^P2=P 1−P 2
p1q1 p2q2
^2 =
2
Y varianza: σ ^
P 1− P
+
n1 n2

Por lo tanto, podemos asegurar que: p(−z ∝/ 2< z< z ∝ /2) = 1 - ∝

Donde: z=¿^¿ ¿

y zα/2 es un valor por arriba del cual encontramos un área de α/2 debajo de la curva normal
estándar. Al sustituir para Z escribimos:

P¿

Intervalo de confianza para p1 – p2 de una muestra grande

Si pˆ1 y pˆ2 son las proporciones de éxitos en muestras aleatorias de tamaños n1 y n2,
respectivamente, qˆ1 = 1 - pˆ1 y qˆ2 = 1 - pˆ2, un intervalo de confianza aproximado del 100(1 – α)
% para la diferencia de dos parámetros binomiales p1 – p2 es dado por:

¿^¿

Donde Zα/2 es el valor z que deja un área de α/2 a la derecha.


Ejemplo:
Problema: Se considera hacer un cierto cambio en el proceso de fabricación de partes
componentes. Para determinar si el cambio en el proceso da como resultado una mejora, se toman
muestras de partes fabricadas con el proceso nuevo y con el actual. Si se encuentra que 75 de 1500
artículos manufacturados con el proceso actual están defectuosos y 80 de 2000 manufacturados
con el proceso nuevo también lo están, calcule un intervalo de confianza del 90% para la diferencia
verdadera en la proporción de partes defectuosas entre el proceso actual y el nuevo.

Respuesta: Suponga que p1 y p2 son las proporciones verdaderas de partes defectuosas para los
procesos actual y nuevo, respectivamente. En consecuencia, pˆ1 = 75/1500 = 0.05 y pˆ2 = 80/2000
= 0.04, y la estimación puntual de p1 – p2 es: ^ ^1=0.05−0.04=0.01
P 1− P

Z0.05 = 1.645. al sustituir en la fórmula: 1.645


√ 0.05∗0.95 0.04∗0.96
1500
+
2000
=0.0117

Encontramos que el intervalo de confianza del 90% es – 0.0017 < p1 – p2 < 0.0217. Como el
intervalo contiene el valor 0, no hay razón para creer que el nuevo proceso, comparado con el
actual, disminuye en forma significativa la proporción de artículos defectuosos.

 Libro - Estadística. Serie Schaum- 4ta edición, Murray R. Spiegel y Larry J. Stephens. Páginas
249,250 y 251 para Prueba Z para la diferencia entre 2 proporciones.
file:///C:/Users/Usuario/Downloads/Estad%C3%ADstica.%20Serie%20Schaum-%204ta
%20edici%C3%B3n%20-%20Murray%20R.%20Spiegel.pdf%20(1)%20(2).pdf
 Libro - Probabilidad y estadística para ingeniería y ciencias, novena edición, Ronald E.
Walpole, Raymond H. Myers y Sharon L. Myers. Paginas 300 y 301 para la diferencia entre
2 proporciones.
file:///C:/Users/Usuario/Downloads/8va-probabilidad-y-estadistica-para-ingenier-
walpole_8.pdf

También podría gustarte