Prueba Chicuadrado 2018
Prueba Chicuadrado 2018
Prueba Chicuadrado 2018
PRUEBA CHICUADRADO 𝝌𝟐
Las pruebas Chi cuadrado consisten en sacar conclusiones directamente de las observaciones muestrales,
sin formular los supuestos a cerca del tipo de distribución de la población de la que proviene. La prueba
Chi cuadrado nos permite realizar las siguientes pruebas:
Pruebas de bondad de ajuste (para una variable).
Prueba de independencia de dos variables estadísticas (para dos variables)
Prueba de homogeneidad de muestras (para dos variables)
Tablas de contingencia:
La tabla de contingencia es una tabla de doble entrada, donde en cada casilla figurará el número de casos
o individuos que poseen un nivel de uno de los factores o características analizadas y otro nivel del otro
factor analizado.
Por ejemplo: podemos saber si el género de una persona se relaciona con el hábito de fumar de una
persona.
GENERO
FUMA VARÓN MUJER TOTAL
SI O11 O12 O1.
NO O21 O22 O2.
TOTAL O.1 O.2 𝑛
Donde:
𝑂𝑖𝑗 = número de observaciones que tienen el atributo i y j
𝑂𝑖∙ = número de observaciones que tienen el atributo i
𝑂∙𝑗 = número de observaciones que tienen el atributo j
La tabla de contingencia se define por el número de atributos o variables que se analizan conjuntamente
y el número de modalidades o niveles de los mismos.
El ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos (Hábito de fumar y
género) y cada uno de ellos tiene dos niveles.
1. Formulación de hipótesis
𝐻0 : Las variables son independientes es decir no hay asociación (relación) entre las variables
consideradas
𝐻1 : Las variables son dependientes es decir hay asociación (relación) entre las variables
consideradas
3. Conclusión
Si el valor obtenido en la prueba Chi - cuadrado ( P ) > ( 𝛼 % nivel de significación) se acepta
la hipótesis nula.
Si el valor obtenido en la prueba Chi - cuadrado ( P ) < ( 𝛼 % nivel de significación) se rechaza
la hipótesis nula.
EJEMPLO 1
Determinar si el género de una persona se relaciona con el hábito de fumar, utilice un nivel de
confianza del 95%
Hábito de Género
Total
fumar Varón Mujer
Si 65 58 123
No 43 67 110
- Fuma
- Genero
- Frecuencia
3. En VISTA DE DATOS: para ingresar los datos, se construye como una matriz
Género
Fuma Total
Varón Mujer
Si 𝐹𝑟𝑒𝑐(11) = 65 𝐹𝑟𝑒𝑐(12) = 58 123
No 𝐹𝑟𝑒𝑐(21) = 43 𝐹𝑟𝑒𝑐(22) = 67 110
Seleccionamos con doble clic la tabla cruzada y se activa una nueva barra, en ella
seleccionamos Lista dinámica → Transponer filas y columnas
Copiamos las dos tablas a una hoja de Excel o directamente al Word solo que el SPSS da los
resultados con comas y para generar la figura correspondiente en Excel no lo reconocerá
como número.
La tabla queda
Género
Varón Mujer Total
Recuento % del total Recuento % del total Recuento % del total
Fuma Si 65 27.9% 58 24.9% 123 52.8%
No 43 18.5% 67 28.8% 110 47.2%
Total 108 46.4% 125 53.6% 233 100.0%
Para la presentación final de la tabla se debe considera el FORMATO APA además se debe
agregar filas debajo en el cual se pondrá el valor del estadístico de la prueba Chi - cuadrado
y el valor p (Significación), asimismo el coeficiente de correlación de Spearman el cual se
obtendrá:
Analizar → correlacionar → Bivariadas → seleccionamos las dos variables →
correlación de Spearman
EJEMPLO 1
Determinar si el género de una persona se relaciona con el hábito de fumar, utilice un nivel de
confianza del 95%
Formulación de hipótesis
H0 : El género de una persona no se relaciona con el hábito de fumar
H1 : El género de una persona se relaciona con el hábito de fumar
Tabla 1
Género y hábito de fumar
Género
Total
Varón Mujer
f % f % f %
100%
80%
Si
60%
28.8% No
40% 27.9%
24.9%
18.5%
20%
0%
Varón Mujer
Interpretación:
Al 95% de confianza mediante la prueba Chi – cuadrado, se puede afirmar que el género de una
persona se relaciona con el hábito de fumar con 𝒑 = 𝟎. 𝟎𝟑𝟔 < 𝟎. 𝟎𝟓, donde el nivel de asociación
mediante la correlación de Spearman es 0.138.
EJEMPLO 2
500 artículos se escogieron al azar del total de artículos producidos estos se clasificaron según
su calidad: 1, 2 y 3 y según su línea de producción: 1, 2 y 3, como se indica en la tabla siguiente
Línea de producción
Calidad del producto
Línea 1 Línea 2 Línea 3
C1 40 90 70
C2 50 60 60
C3 60 50 20
A un nivel de confianza del 95% ¿Puede inferir que la calidad del producto es independiente de
la línea de producción?
Formulación de hipótesis
𝐻0 : La calidad del producto es independiente de la linea de produccion.
𝐻1 : La calidad del producto depende de la línea de producción.
EJEMPLO 3
Se realizó un estudio a los alumnos ingresante a la universidad para ver a que le dan mayor
prioridad de entre tres posibilidades tener buenas notas destacar en deportes o ser popular entre
los compañeros.
Prioridad
Género
Deportes Notas Popular
Mujer 17 101 75
Varón 51 95 38
A un nivel de confianza del 95% ¿Puede inferir que la prioridad de los ingresantes es
independiente del género?
EJEMPLO 4
La siguiente tabla muestra la relación entre el desempeño de estudiantes en matemáticas y
estadística. Pruebe la hipótesis de que el desempeño en estadística es independiente del
desempeño en matemáticas.
Matemática
Estadística
Calificaciones Calificaciones Calificaciones
altas medias Bajas
Calificaciones altas 56 71 12
Calificaciones bajas 14 42 85
TRABAJO
Sin alivio 10 20 15
Cierto alivio 30 20 20
Alivio total 10 30 25
Puede Ud. Inferir al 95% de confianza que los tres remedios para la alergia son igualmente
efectivos.
Plan de Seguro
Tipo de labor
A B C
Estudiante 40 70 20
Servicios 20 40 10
Se quiere probar si hay relación entre el plan de seguro que seleccionaron y el tipo de
labor que desempeñan con un nivel de significancia del 5%.
Varones 55 45
Mujeres 40 60
Con esta información se puede concluir, al nivel de significancia del 5% ¿Qué el tiempo
utilizado para ver televisión es independiente del sexo?
Ingresos
Opinión
Bajo Medio Alto
En contra 60 60 80
¿Hay relación entre la opinión de los votantes y su nivel de ingresos? Use el nivel de
significancia del 5%
5. Un investigador realizo un estudio para determinar si el tamaño de familia depende del nivel de
educación del padre. La muestra se clasifico de acuerdo al nivel de educación y al número de
hijos, en la siguiente tabla:
0-1 2 3 4 >=5
Primaria 20 18 12 14 30
Secundaria 50 25 18 16 24
Superior 12 6 4 8 12
¿Se puede inferir que el tamaño de familia es independiente del nivel de educación del
padre? Use un nivel de significancia del 5%.