S13.s2 - Teoría y Práctica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

16 PRUEBAS DE CHI-CUADRADO

LOGRO DE LA SESIÓN

Al finalizar la sesión de aprendizaje el estudiante aplica la distribución Chi-cuadrado en las pruebas de


bondad de ajuste y pruebas de independencia.

Las pruebas que consisten en obtener conclusiones directamente de las observaciones muestrales, sin requerir
supuestos acerca del tipo de distribución de la población de la que proviene, se denominan pruebas no paramé-
tricas y son empleados con datos medidos en escala nominal u ordinal. Se utiliza la distribución Chi-cuadrado
para contrastar este tipo de pruebas.

16.1 Prueba de bondad de ajuste

Esta prueba consiste en determinar si una muestra aleatoria procede de una población con una determinada
distribución de probabilidad (puede referirse a la distribución Uniforme, a la Binomial, a la Poisson o a la Normal,
etc)

1. Hipótesis: Plantear las siguientes hipótesis:


H0 : La distribución de frecuencias de la muestra concuerda con la distribución teórica propuesta.(No hay
diferencias entre valores observados y esperados)
H1 : La distribución de frecuencias de la muestra no concuerda con la distribución teórica propuesta. (Si
hay diferencias entre valores observados y esperados)

2. Nivel de significación: Seleccionar un nivel de significación α.

3. Estadística de prueba:
n (O − e )2
i i
χ2c = ∼ χ2(k−1)
X
i =1 ei

Donde:
k : Número de categorías.
O i : Frecuencias observadas.
e i : Frecuencias esperadas.

4. Región crítica:

UTP Sede Arequipa 1 Guia 17


PRUEBAS DE CHI-CUADRADO

5. Cálculo de la estadística de prueba: Calcular el valor de χ2c .

6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

16.2 Prueba de independencia

La prueba de independencia consiste en determinar si existe alguna relación entre dos variables cualitativas,
cuyos resultados son presentados en tablas de contingencia. Una tabla de contingencia de r filas y c columnas,
contiene en cada entrada o celda la frecuencia observada de la muestra que corresponde a dos variables clasifi-
cadas por categorías.

Variable B
Categorías B1 B2 ··· Bc Totales
A1 O 11 O 12 ··· O 1c O 1.
A2 O 21 O 22 ··· O 2c O 2.
Variable A .. .. .. .. ..
..
. . . . . .
Ar Or 1 Or 2 ··· Or c O r.
Totales O .1 O .2 ··· O .c n

Los pasos a seguir para una prueba de independencia son los siguientes:

1. Hipótesis: Plantear las siguientes hipótesis:

H0 : Existe independencia entre dos variables cualitativas


H1 : No existe independencia entre dos variables cualitativas.

2. Nivel de significación: Seleccionar un nivel de significación α.

3. Estadística de prueba:
r (O − e )2
c X
ij ij
χ2c = ∼ χ2(r −1)(c−1)
X
j =1 i =1 ei j

Donde:
O i j : Frecuencias observadas.
e i j : Frecuencias esperadas.

(Total de fila)(Total de columna)


ei j =
Gran total
Las frecuencias observadas y esperadas son obtenidas de la siguiente tabla de contingencia:

UTP Sede Arequipa 2 Guia 17


E STADÍSTICA I NFERENCIAL

Variable B
Categorías B1 B2 ··· Bc Totales
A1 O 11 (e 11 ) O 12 (e 12 ) ··· O 1c (e 1c ) O 1.
A2 O 21 (e 21 ) O 22 (e 22 ) ··· O 2c (e 2c ) O 2.
Variable A .. .. .. .. ..
..
. . . . . .
Ar O r 1 (e r 1 ) O r 2 (e r 2 ) ··· O r c (e r c ) O r.
Totales O .1 O .2 ··· O .c n

4. Región crítica:

5. Cálculo de la estadística de prueba: Calcular el valor de z c .

6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

Ejemplo 16.1

Se supone que un generador de números aleatorios produce los dígitos de 0 al 9 con probabilidad igual. Se
generó una muestra de 200 dígitos, con la siguiente frecuencia generada para cada uno de los dígitos.
Dígito 0 1 2 3 4 5 6 7 8 9
Frecuencia 21 17 20 18 25 16 28 19 22 14

¿Estos datos evidencian que el generador de números aleatorios no está funcionando adecuadamente? Ex-
plique.

UTP Sede Arequipa 3 Guia 17


PRUEBAS DE CHI-CUADRADO

Ejemplo 16.2

Una agencia de publicidad desea saber si el género de los consumidores es independiente de sus preferen-
cias de cuatro marcas de café. La respuesta determinará si se debe diseñar diferentes anuncios dirigidos
a los hombres y otros diferentes para las mujeres. Los resultados obtenidos de la encuesta realizada a 139
personas fue:

Marca A Marca B Marca C Marca D Total


Hombre 18 25 15 12
Mujer 32 15 10 12
Total

¿Cuál será la decisión que tomará la agencia?, realice la prueba con un nivel de significancia del 5 %.

UTP Sede Arequipa 4 Guia 17


E STADÍSTICA I NFERENCIAL

EJERCICIOS ADICIONALES

1. Se lanza 180 veces un dado obteniéndose los siguientes resultados:


Resultado Frecuencia
1 28
2 36
3 36
4 30
5 27
6 23

A un nivel de significación del 1 %, ¿es posible concluir que el dado no esta cargado?

2. En un hospital, el número de nacimientos observados para cada mes de cierto a no, fueron los siguientes:

Ene Feb Mar Abr May Jun Jul Ago Sept Oct Nov Dic
95 105 95 105 90 95 105 110 105 100 95 100

A un nivel de significación del 1 %, ¿existe alguna razón para creer que el número de nacimientos no se
encuentra distribuido en forma uniforme durante todos los meses de año?

3. En un experimento para estudiar la dependencia de la hipertensión de los hábitos de fumar, se tomaron los
siguientes datos de 180 individuos:

No fumadores Fumadores moderados Fumadores empedernidos Total


Con hipertensión 21 36 30
Sin hipertensión 48 26 19
Total

Pruebe la hipótesis de que la presencia o ausencia de hipertensión es independiente de los hábitos de fumar.
Utilice un nivel de significancia de 0.05.

4. A una muestra de empleados en una planta química grande se le pidió indicar una preferencia por uno de
tres planes de pensión. Los resultados aparecen en la siguiente tabla. ¿Existe una relación entre el plan de
pensión seleccionado y la clasificación del trabajo de los empleados?

Clase de trabajo Plan A Plan B Plan C


Supervisor 10 13 29
De oficina 19 80 19
Obrero 81 57 22

UTP Sede Arequipa 5 Guia 17


PRUEBAS DE CHI-CUADRADO

TAREA DOMICILIARIA

1. Bubba’s Fish and Pasta es una cadena de restaurantes ubicados a lo largo de la costa del Golfo de Florida.
Bubba, el propietario, desea añadir filete a su menú. Antes de hacerlo, decide contratar a Magnolia
Research, para que lleve a cabo una encuesta entre personas adultas para saber cuál es su platillo favorito
cuando comen fuera de casa. Magnolia seleccionó una muestra de 120 adultos y les pidió que indicaran
su comida favorita cuando salen a cenar. Los resultados se reportan en la siguiente tabla. ¿Es razonable
concluir que no hay preferencia entre los cuatro platillos? Use un nivel de significancia del 5 %.

Plato favorito Frecuencia


Pollo 32
Pescado 24
Carne 35
Pasta 29
Total 120

2. Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado de estrés
de los trabajadores. Para lo cual se elige una muestra aleatoria de 300 trabajadores y se clasifican en la tabla
siguiente:

Grado de estrés
Tipo de trabajo I II III
De oficina 42 24 30
Terreno 54 78 28

Probar la hipótesis de que el tipo de trabajo afecta el grado de estrés del trabajador con un nivel de signifi-
cación de 5 %.

UTP Sede Arequipa 6 Guia 17

También podría gustarte