Mcnemar Merged

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 89

Prueba de McNemar para datos

apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica conteos de frecuencias que resultan de
datos apareados.

Utiliza la prueba de McNemar para datos apareados.

Emplea la distribución chi cuadrada para la prueba de


hipótesis.
Definición
Prueba de Utiliza conteos de frecuencias de datos apareados
McNemar nominales de dos categorías, para probar la 𝑯𝟎 , las
frecuencias 𝒃 y 𝒄 ocurren en la misma proporción.

Los pares discordantes de resultados provienen de


pares de categorías en las que ambas categorías son
diferentes.
Modelo de tabla
Requisitos

Los datos muestrales se eligieron al azar.

Los datos muestrales consisten en datos apareados o conteos de frecuencias.

Los datos tienen un nivel de medición nominal y cada observación se puede clasificar
de dos maneras.

Las frecuencias son tales que 𝑏 + 𝑐 ≥ 10.


Estadístico de prueba

2
𝑏−𝑐 −1
𝜒2 = La región crítica se localiza
𝑏+𝑐 únicamente en la cola derecha.

Los valores críticos se encuentran en


la tabla A-4, utilizando: 𝐠𝐥 = 𝟏.
Casos de estudio
Comparación de TEP TC con IRM. En el artículo “Whole-Body Dual-Modality PET TC and Whole
Body MRI for Tumor Staging in Oncology” (Antoch et al., Journal of the American Medical
Association, vol. 290, núm. 24), los autores citan la importancia de identificar con exactitud la
etapa de un tumor, ya que esto es crucial para determinar la terapia adecuada. El artículo analiza
un estudio que compara la exactitud de la tomografía por emisión de positrones (TEP) y la
tomografía computarizada (TC) con la imagen por resonancia magnética (IRM). Utilice los datos
de la tabla sobre 50 tumores analizados con ambas tecnologías. Al parecer, ¿Hay una diferencia
en la exactitud? ¿Alguna de las tecnologías parece ser mejor?

TEP/TC
Correcto Incorrecto
Correcto 36 1
IRM
Incorrecto 11 2
Casos de estudio
Prueba de un tratamiento. En el artículo “Eradication of Small Intestinal Bacterial Overgrowth
Reduces Symptoms of Irritable Bowel Syndrome” (Pimentel, Chow, Lin, American Journal of
Gastroenterology, vol. 95, núm. 12), los autores analizan si el tratamiento antibiótico del
crecimiento excesivo de bacterias reduce las molestias intestinales. Se utilizó una prueba de
McNemar para analizar los resultados de los sujetos con erradicación del crecimiento bacterial
excesivo. Utilice los datos de la siguiente tabla. Al parecer, ¿el tratamiento es efectivo para el
dolor abdominal?

¿Dolor abdominal antes del


tratamiento?
Sí No
¿Dolor abdominal Sí 11 1
después del
tratamiento? No 14 3
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Prueba de rango con signo de
Wilcoxon para datos apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Aplica la prueba de rangos con signo de Wilcoxon
para datos apareados.

Calcula el estadístico de prueba para la prueba de


rangos con signo de Wilcoxon.

Compara la prueba del signo con la prueba de rangos


con signo de Wilcoxon.
Definición

Es una prueba no paramétrica que utiliza rangos ordenados


de datos muestrales que consisten en datos apareados.

𝑯𝟎 : Los datos apareados tienen diferencias que provienen de una


población con una mediana igual a cero.

𝑯𝟏 : Los datos apareados tienen diferencias que provienen de una


población con una mediana diferente de cero.
Requisitos

Los datos consisten en datos


apareados que se seleccionaron
aleatoriamente.

La población de las diferencias


tiene una distribución
aproximadamente simétrica.
Notación

𝑇 = 𝑙𝑎 𝑚á𝑠 𝑝𝑒𝑞𝑢𝑒ñ𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒𝑠 𝑠𝑢𝑚𝑎𝑠:

1. La suma de los rangos positivos de las diferencias 𝑑 que no sean cero.

2. El valor absoluto de la suma de los rangos negativos de las diferencias 𝑑 que no


sean cero.
Estadístico de prueba

𝑛 ≤ 30 •𝑇

𝑛 𝑛+1
𝑇− 4
𝑛 > 30 •𝑧=
𝑛 𝑛+1 2𝑛+1
24
Caso de estudio
¿El tipo de semilla afecta el crecimiento del maíz? En 1908 William Gosset público al
artículo “The Probable Error of a Mean”, bajo el seudónimo de “Student” (Biometrika,
vol. 6, núm. 1). Él incluyó los datos de la tabla continua para dos tipos diferentes de
semillas de maíz (normales y secadas en horno), que se utilizaron en parcelas de tierra
adyacentes. Los valores corresponden a las cosechas de cabezas de maíz (o mazorcas) en
libras por acre. Utilice la prueba de rangos con signos de Wilcoxon, con un nivel de
significancia de 0.05 para probar la aseveración que no hay diferencia entre las cosechas
de las semillas normales y de las semillas secadas al horno.

Normales 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas al
2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
horno
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Prueba del signo
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje

Aplica el procedimiento de la prueba del signo.

Convierte valores de datos en signos positivos y


negativos.

Identifica las ventajas y desventajas de la prueba del


signo.
Definición

La prueba del signo utiliza


signos positivos y negativos
para probar diferentes
aseveraciones:

Aseveraciones que implican Aseveraciones acerca de la


Aseveraciones que implican
datos muestrales mediana de una sola
datos nominales.
apareados. población.
Requisitos

No existe el requisito de que los


Los datos muestrales se datos muestrales provengan de
seleccionaron aleatoriamente. una población con una
distribución particular.

Notación:
𝑥 = número de veces que ocurre el signo 𝒎𝒆𝒏𝒐𝒔 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒕𝒆.
𝑛 = número total de signos positivos y negativos combinados.
Estadístico de prueba
𝒏 ≤ 𝟐𝟓

𝑥(el número de veces que ocurre el signo menos frecuente)

𝒏 > 𝟐𝟓

𝑛
𝑥 + 0,5 − 2
𝑧=
𝑛
2
Aseveraciones que implican datos apareados
Restamos cada valor de la
segunda variable del valor
correspondiente de la
primera variable.

Registramos sólo el signo


de la diferencia
encontrada en el paso 1.
Excluimos los empates.
Casos de estudio
Prueba de semillas de maíz. En 1908 William Gosset público al artículo “The
Probable Error of a Mean”, bajo el seudónimo de “Student” (Biometrika, vol. 6,
núm. 1). Él incluyó la lista que parece abajo, acerca de las cosechas de dos tipos
diferentes de semillas (normales y secadas en horno), que se utilizaron en
parcelas de tierra adyacentes. Los valores listados son las cosechas de paja en cwt
por acre, donde cwt representa 100 libras. Utilice un nivel de significancia de 0,05
y pruebe la aseveración de que no hay diferencia entre las cosechas de los dos
tipos de semillas. ¿Parece que alguna de las semillas es mejor?

Normales 19,25 22,75 23 23 22,5 19,75 24,5 15,5 18 14,25 17

Secadas al
25 24 24 28 22,5 19,5 22,25 16 17,25 15,75 17,25
horno
Aseveraciones que implican datos nominales

Podemos probar
La naturaleza de los datos aseveraciones acerca de
nominales limita los la proporción poblacional
cálculos posibles. p correspondiente.

Podemos identificar la
proporción de datos
muestrales que
pertenecen a una
categoría en particular.
Casos de estudio
Selección del género. El Genetics and IVF Institute realizó un ensayo clínico de
sus métodos de selección del género. Para cuando se escribía este libro, los
resultados incluían a 325 bebés nacidos de padres que utilizaron el método
XSORT para aumentar la probabilidad de concebir una niña, y 295 de esos bebés
fueron niñas. Utilice la prueba del signo con un nivel de significancia de 0,05 y
pruebe la aseveración de que este método de selección del género no tiene
ningún efecto.
Aseveraciones acerca de la mediana de una
sola población
Temperaturas corporales. El conjunto de datos 2 del apéndice B incluye
temperaturas corporales medidas en adultos. Utilice las 106 temperaturas
listadas para las 12:00 a.m. del día 2 con la prueba del signo para probar la
aseveración de que la mediana es menor que 98,6°F. El conjunto de datos tiene
106 sujetos, 68 sujetos con temperaturas por debajo de 98,6°F; 23 sujetos con
temperaturas por arriba de 98,6°F y 15 sujetos con temperaturas iguales a 98,6°F.
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Tablas de contingencia:
Independencia y homogeneidad
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Identifica tablas de contingencia o tablas de
frecuencias de dos factores.

Realiza cálculos para encontrar frecuencias esperadas.

Emplea la distribución chi cuadrada para la prueba de


hipótesis.
Definición

Es una tabla en la que las


frecuencias corresponden Tabla de
a dos variables. contingencia

Una variable para


Tabla de frecuencias
renglones y otra
de dos factores.
para columnas.
Prueba de independencia

Pone a prueba la 𝐻0

No existe asociación entre la variable de renglón y la variable columna.

𝐻0 : Las variables de renglón y de columna son independientes.


Requisitos

Los datos muestrales son seleccionados al azar y se representan como conteos


de frecuencias en una tabla de dos factores.

𝐻0 : Las variables de renglón y columna son independientes.


𝐻1 : Las variables de renglón y columna son dependientes.

Para cada celda de la tabla de contingencia, la frecuencia esperada 𝐸 es al


menos de 5.
Estadístico de prueba para una prueba de
independencia

𝑂−𝐸 2 𝑔𝑙 = 𝑟 − 1 𝑐 − 1
2
𝜒 =෍
𝐸 Dónde 𝒓 es el número de
renglones y 𝒄 el número de
columnas.

La región crítica se localiza sólo


en la cola derecha.
Frecuencia esperada para una tabla de
contingencia

𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒓𝒆𝒏𝒈𝒍ó𝒏 𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒄𝒐𝒍𝒖𝒎𝒏𝒂


𝑬=
𝒈𝒓𝒂𝒏 𝒕𝒐𝒕𝒂𝒍
Prueba de homogeneidad

Probamos la aseveración:

De que poblaciones diferentes tienen las


mismas proporciones de algunas
características.
Casos de estudio
No fumar. La tabla adjunta resume éxitos y fracasos de sujetos que utilizaron
diferentes métodos para tratar de dejar de fumar. Cinco meses después de
comenzar el tratamiento, se determinó si los sujetos fumaban o no fumaban; los
datos están basados en resultados de los Centros para el Control y Prevención de
Enfermedades. Utilice un nivel de significancia de 0,05 para probar la aseveración
de que el éxito es independiente del método utilizado. Si alguien quiere dejar de
fumar, ¿La elección del método provoca una diferencia?

Goma de mascar
Parche de nicotina
de nicotina
Fuman 191 263
No fuman 59 57
Casos de estudio
¿La vacuna es efectiva? En un artículo de USA Today, sobre una vacuna
experimental para niños, se publicó la siguiente aseveración: “En una prueba con
1602 niños, sólo 14 (el 1%) de los 1070 que recibieron la vacuna desarrollaron
gripe, comparados con 95 (el 18%) de los 532 que recibieron placebo”. Los datos
se incluyen en la siguiente tabla. Utilice un nivel de significancia de 0,05 para
hacer una prueba de independencia entre la variable de tratamiento (vacuna o
placebo) y la variable que representa la gripe (desarrolló gripe, no desarrolló
gripe). ¿Parece que la vacuna es efectiva?

Sí No
Tratamiento con vacuna 14 1056
Placebo 95 437
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Inferencia acerca de dos medias
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje

Prueba hipótesis acerca de parámetros poblacionales.

Identifica las pruebas para la igualdad de varianzas.

Distingue las pruebas con muestras independientes y


muestras dependientes.
Definiciones

Muestras Muestras
independientes dependientes

Si los valores muestrales (Consisten en datos


obtenidos de una apareados)si los
población no están miembros de una muestra
relacionados o apareados se pueden usar para
con los valores muestrales determinar los miembros
de otra población. de otra muestra.
Casos de estudio
❖Tratamiento del colesterol: Se trata un grupo de sujetos con el fármaco reductor del colesterol
Lipitor, mientras que a un segundo grupo separado de sujetos se les da un placebo.

❖Eficacia de una dieta: Se prueba la eficacia de una dieta utilizando los pesos de los sujetos
medidos antes y después de someterse a la dieta.
Muestras independientes
Derly D. Ortiz Romero, M.Sc.
Comparación de la variación en dos
muestras
Derly D. Ortiz Romero, M.Sc.
Prueba 𝑭 para comparar varianzas

Requisitos

Las dos poblaciones están


Las dos poblaciones son
distribuidas
independientes.
normalmente.
Propiedades de la distribución 𝑭

La distribución 𝐹 no es simétrica.

Los valores de la distribución 𝐹 no pueden ser negativos.

La forma de distribución exacta depende de los diferentes grados


de libertad.
Estadístico de prueba para pruebas de
hipótesis con dos varianzas

𝑠12
𝐹= 2
𝑠2

Donde:
𝑠12 > 𝑠22
Estadístico de prueba para pruebas de
hipótesis con dos varianzas

Valores críticos

𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟 = 𝑛1 − 1

𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑙 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟 = 𝑛2 − 1


Casos de estudio
❖Demanda química de oxígeno. Se comparo un método propuesto para la
determinación de la demanda química de oxígeno en aguas residuales con
otro método patrón (sales de mercurio). Los siguientes resultados fueron
obtenidos para una muestra de aguas residuales:
Desviación estándar
Media 𝐦𝐠 𝐦𝐋−𝟏
𝐦𝐠 𝐦𝐋−𝟏
Método patrón 72 3,31
Método propuesto 72 1,51

❖Para cada método se realizaron ocho determinaciones. ¿Es la precisión del


método propuesto significativamente más grande que la del método
estándar?.
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Inferencias acerca de dos medias
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje

Identifica las pruebas para la igualdad de varianzas.

Prueba hipótesis acerca de dos medias poblacionales.

Valora los elementos de la inferencia estadística y su


importancia en los diseños experimentales.
Comparación de dos medias
suponiendo varianzas iguales
Derly D. Ortiz Romero, M.Sc.
Requisitos

Se desconocen las dos desviaciones estándar poblacionales, pero se supone que son
iguales, 𝜎1 = 𝜎2 .

Las dos muestras son independientes.

Ambas muestras son aleatorias simples.

Las dos muestras provienen de poblaciones que tienen distribuciones normales.


Estadístico de prueba de hipótesis para dos medias:
𝟐 𝟐
𝝈𝟏 = 𝝈𝟐

𝑥ҧ1 − 𝑥ҧ2
𝑡= 𝑛1 − 1 𝑠12 + 𝑛2 − 1 𝑠22
𝑠𝑝2 𝑠𝑝2 𝑠𝑝2 =
𝑛1 − 1 + 𝑛2 − 1
𝑛1 + 𝑛2

𝑔𝑙 = 𝑛1 + 𝑛2 − 2
Comparación de dos medias
suponiendo varianzas desiguales
Derly D. Ortiz Romero, M.Sc.
Requisitos

𝜎1 y 𝜎2 se Las dos muestras


desconocen y no se provienen de
Las dos muestras son Ambas muestras son
hace una suposición poblaciones que
independientes. aleatorias simples.
de igualdad entre 𝜎12 tienen distribuciones
y 𝜎22 . normales.
Estadístico de prueba de hipótesis para dos medias:
𝟐 𝟐
𝝈𝟏 ≠ 𝝈𝟐

𝑥ҧ1 − 𝑥ҧ2 𝐴+𝐵 2


𝑡= 𝑔𝑙 =
𝑠12 𝑠22 𝐴2 𝐵2
+ 𝑛1 − 1 + 𝑛2 − 1
𝑛1 𝑛2

𝑠12 𝑠22
𝐴= 𝑦 𝐵=
𝑛1 𝑛2
Casos de estudio
❖Determinación de estaño. En una serie de experimentos para la
determinación de estaño en productos alimenticios, las muestras fueron
llevadas a ebullición con HCl a reflujo para diferentes tiempos, Los
resultados fueron:(Analytical Methods Committee, 1983. Analyst 108:109)

Tiempo
Estaño encontrado 𝐦𝐠 𝐤𝐠 −𝟏
𝐦𝐢𝐧
30 55 57 59 56 56 59
75 57 55 58 59 59 59

❖¿Es significativamente diferente la cantidad media de estaño encontrada


para los dos tiempos de ebullición?
Casos de estudio
❖Artritis reumatoide. Los datos de la siguiente tabla proporcionan la
concentración de tiol mM en el lisado sanguíneo de dos grupos de voluntarios,
siendo el primer grupo “normal” y el segundo sufriendo artritis
reumatoide.(Banford, J.C., Brown, D.H., McNeil, C.J., Smith, W.E., Hazelton, R.A.
and SturrocK, R.D. 1983. Analyst 107:195)

Normal 1,84 1,92 1,94 1,92 1,85 1,91 2,07


Reumatoide 2,81 4,06 3,62 3,27 3,27 3,76

❖La hipótesis nula adoptada es que la concentración media de tiol es la misma


para los dos grupos.
Inferencias a partir de datos
apareados
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Distingue las pruebas con muestras independientes y
muestras apareadas.

Estudia métodos para probar aseveraciones acerca de


la diferencia media de datos apareados.

Valora la importancia de trabajar con datos


muestrales apareados.
Muestras dependientes
Derly D. Ortiz Romero, M.Sc.
Requisitos

Los datos muestrales consisten en datos


apareados.

Las muestras son aleatorias simples.

Los pares de valores se toman de una población


con una distribución aproximadamente normal.
Estadístico de prueba para datos apareados

𝑑ҧ
𝑡= 𝑛
𝑠𝑑

𝑔𝑙 = 𝑛 − 1
Casos de estudio
❖Prueba de semillas de maíz. En 1908 William Gosset publicó el artículo “The Probable Error of a
Mean” bajo el seudónimo de “Student” (Biometrika, vol. 6, núm. 1). El artículo incluyó los datos
listados abajo para dos tipos diferentes de semillas de maíz (comunes y secadas al horno) que se
utilizaron en parcelas adyacentes. Los valores listados son las cosechas de cabezas de maíz o
mazorcas en libras por acre.
a) Utilice un nivel de significancia de 0,05 para poner a prueba la aseveración de que no existe
diferencia entre las cosechas de los dos tipos de semillas.
b)¿Parece que algún tipo de semilla es mejor?

Comunes 1903 1935 1910 2496 2108 1961 2060 1444 1612 1316 1511

Secadas al
2009 1915 2011 2463 2180 1925 2122 1482 1542 1443 1535
horno
Casos de estudio
❖Determinación de antimonio. Se comparó un nuevo método espectroscópico de absorción
atómica de llama para determinar antimonio en la atmósfera con el método colorimétrico
recomendado. Para muestras de atmósfera urbana, se obtuvieron los siguientes resultados:
Antimonio encontrado 𝐦𝐠/𝐦𝟑
Muestra N°
Método nuevo Método estándar
1 22,2 25,0
2 19,2 19,5
3 15,7 16,6
4 20,4 21,3
5 19,6 20,7
6 15,7 16,8
❖¿Difieren significativamente los resultados obtenidos por los dos métodos?
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Estadística no paramétrica
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje
Aplica métodos no paramétricos a una amplia
variedad de situaciones.

Compara las pruebas paramétricas y no paramétricas,


evaluando su eficiencia.

Valora las ventajas y desventajas de los métodos no


paramétricos.
Definiciones

Pruebas Pruebas no
paramétricas paramétricas
Tienen requisitos No requieren que las
acerca de la muestras provengan
naturaleza o forma de de poblaciones con
las poblaciones distribuciones
implicadas. normales.

Suelen llamarse
pruebas de
distribución libre.
Ventajas de los métodos no paramétricos

Los métodos no paramétricos no requieren de poblaciones


distribuidas normalmente.

Los métodos no paramétricos a menudo pueden aplicarse a


datos categóricos.

Por lo regular, implican cálculos más sencillos que los métodos


paramétricos correspondientes y, por lo tanto, son más fáciles de
comprender y aplicar.
Desventajas de los métodos no paramétricos

Los métodos no paramétricos tienden a desperdiciar


información porque los datos numéricos exactos
suelen reducirse a una forma cualitativa.

Las pruebas no paramétricas no son tan eficientes


como las pruebas paramétricas, de manera que con
una prueba no paramétrica generalmente
necesitamos evidencia más fuerte para rechazar una
hipótesis nula.
Métodos paramétricos versus métodos no
paramétricos
Rangos

Un rango es un número Al primer elemento se le


Los datos están ordenados asignado a un elemento asigna un rango de 1, al
cuando se acomodan de muestral individual de segundo elemento se le
acuerdo con algún criterio. acuerdo con su lugar en la asigna un rango de 2 y así
lista ordenada. sucesivamente.
Ejemplo

Manejo de rangos empatados: Si ocurre un empate en los


rangos, el procedimiento habitual es calcular la media de los
rangos implicados y luego asignar este rango medio a cada uno
de los elementos empatados.

Los números 4, 5, 5, 5, 10, 11, 12 y 12 tienen rangos dados de 1, 3,


3, 3, 5, 6, 7,5; y 7,5; respectivamente. Realice un manejo apropiado
de rangos empatados.
Referencias
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.
Experimentos multinomiales:
Bondad de ajuste
Derly D. Ortiz Romero, M.Sc.
Competencias de aprendizaje

Identifica experimentos multinomiales.

Realiza cálculos para encontrar frecuencias esperadas.

Emplea la distribución chi cuadrada para la prueba de


hipótesis.
Experimento multinomial

Todos los resultados


de cada ensayo Las probabilidades
para las diferentes
El número de ensayos Los ensayos son deben clasificarse
categorías permanecen
es fijo. independientes. exactamente en una constantes en cada
de varias categorías ensayo.
diferentes.
Prueba de bondad de ajuste

Se utiliza para probar la hipótesis de que una


distribución de frecuencias se ajusta a (o coincide con)
alguna distribución aseverada.

𝒌 número de 𝒏 número
𝑶 frecuencia 𝑬 frecuencia
categorías total de
observada esperada
diferentes ensayos
Cálculo de frecuencias esperadas

Si todas las 𝐸 son Si las 𝐸 no son


iguales todas iguales

𝑛
𝐸= 𝐸 = 𝑛𝑝
𝑘
Requisitos

Los datos se seleccionan al azar.

Los datos muestrales consisten en conteos de frecuencias para


cada una de las diferentes categorías.

Para cada categoría 𝐸 es al menos de 5.


Estadístico de prueba para pruebas de bondad
de ajuste

2
𝑂−𝐸
𝜒2 =෍ 𝑔𝑙 = 𝑘 − 1
𝐸
Dónde 𝑘 es el número de categorías.

Las pruebas de hipótesis por bondad de ajuste


siempre son de cola derecha.
Casos de estudio
Roturas en el material de vidrio. A continuación se muestra el número de roturas
en el material de vidrio de cuatro trabajadores de un laboratorio de microbiología
a lo largo de un periodo de tiempo. ¿Hay alguna evidencia de que los
trabajadores difieran en su habilidad?

Número de roturas 24 17 11 9
Casos de estudio
Experimento de color de ojos. Un investigador desarrolló un modelo teórico para
predecir el color de los ojos. Después de examinar una muestra aleatoria de
padres, predice el color de ojos de su primer hijo. La siguiente tabla lista el color
de ojos de descendientes. Con base en su teoría, el investigador predijo que el
87% de los descendientes tendrían ojos cafés, que el 8% tendría ojos azules y que
el 5% tendría ojos verdes. Utilice un nivel de significancia de 0,05 para probar la
aseveración de que las frecuencias reales corresponden a la distribución que
predijo.

Ojos cafés Ojos azules Ojos verdes


Frecuencia 132 17 0
Casos de estudio
Experimento de genética. Con base en los genotipos de los padres, se espera que sus
descendientes tengan genotipos distribuidos de tal forma que el 25% tenga genotipos denotados
por AA, que el 50% tenga genotipos denotados por Aa, y que el 25% tenga genotipos denotados
por aa. Cuando se seleccionan 145 descendientes, se descubre que 20 de ellos tienen genotipos
AA, 90 tienen genotipos Aa y 35 tienen genotipos aa. Ponga a prueba la aseveración de que las
frecuencias observadas de los genotipos de los descendientes coinciden con la distribución
esperada del 25% para AA, 50% para Aa y 25% para aa. Utilice un nivel de significancia de 0,05.
Referencias
Miller, J. N., & Miller, J. C. (2010). Statistics and Chemometrics for
Analytical Chemistry (Sixth ed.). London: Pearson.
Triola, M. F. (2019). Estadística (Decimosegunda ed.). México: Pearson.

También podría gustarte