Chi Cuadrado

11.
FUNCIONES DE DISTRIBUCIN ESPECIALES

DISTRIBUCIN CHI2 CUADRADO DE PEARSON
Si (X1,X2,...,Xn) son n variables aleatorias normales independientes de media 0 y
varianza 1, la variable definida como
Yn X12 Xn2 i1 Xi2

n
se dice que tiene una distribucin CHI con n grados de libertad. Su funcin de
densidad es
1
f (x)
x ( n 2) / 2 e x / 2
x0
n n
2
2
siendo (P) X P 1e x dx la funcin gamma de Euler, con P>0. La funcin de

0
distribucin viene dada por

x
F( x ) P( X x ) f ( x )dx
0
La media de esta distribucin es E(X)=n y su varianza V(X)=2n. Esta distribucin es

bsica en un determinado nmero de pruebas no paramtricas.
Si consideramos una variable aleatoria Z~N(0,1), la variable aleatoria X=Z2 se
distribuye segn una ley de probabilidad distribucin CHI con un grado de libertad
Si tenemos n variable aleatoria independientes Zi~N(0,1), la suma de sus cuadrados
respectivos es una distribucin CHI con n grados de libertad,
n
Z i N(0,1) Z i2 2n
i 1
La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n

Ejemplo, El espesor de un semiconductor se controla mediante la variacin estndar
no mayor a =0.60 mm. Para mantener controlado el proceso se toman muestras
aleatoriamente de tamao de 20 unidades, y se considera que el sistema est fuera de
control cuando la probabilidad de que 2 tome valor mayor o igual al valor de la
muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?
Solucin. Existe fuera de control si (n 1)s 2 / 2 con n=20 y =0.60, excede

02.01,19 36.191
(n 1)s 2 19 * 0.84 2
Entonces,
37.24
2
0.60 2
Por tanto, el sistema est fuera de control
La funcin de distribucin CHI tienen importantes variaciones de acuerdo con los
grados de libertad y del tamao muestral (menor tamao muestral y mayor tamao
muestral respectivamente),
En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada

X i N( i , i ) , se tiene
Xi i
i
i 1
n
2n
La distribucin Chi muestra su importancia cuando queremos determinar la

variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central
siguiendo un mecanismo normal.
Teorema (Cochran). Sean X1,,Xn con distribucin N(,), la variable aleatoria
independiente, entonces
n
X
i 1

N ,
X X
2n 1
y i

i 1
n
La funcin Chi-cuadrado es igual a la funcin normal elevada al cuadrado. Esto es, el

producto de dos distribuciones de Gauss es una distribucin de Chi-cuadrado. Si de
una poblacin normal, o aproximadamente normal, se extraen muestras aleatorias e
independientes, y se le calcula el estadgrafo 2 usando el valor muestral de la
varianza y el poblacional con:
(n 1)s 2
2
2
Esta funcin matemtica est caracterizada por el valor del nmero de grados de
libertad =n-1 (donde n es el tamao muestral). Al igual que la t-Student, el valor
total del rea bajo la curva es igual a la unidad, pero la diferencia principal es que esta
no es simtrica respecto al origen, sino que se extiende desde 0 hasta + porque no
puede ser negativa.
A medida que los grados de libertad aumentan, la curva cambia de forma y sus
valores se han tabulado en el anexo de tablas estadsticas, donde se muestran los
valores del rea bajo la curva, para los principales valores de 2, a la derecha de ste.
O sea, se muestra la zona de rechazo para diferentes niveles de significacin y de
grados de libertad, lo cuales varan entre 1 y 100. Ms all, conviene usar
directamente la funcin de Gauss.
Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el
nivel de significacin, parecida a la de Gauss. El problema de calcular los valores
crticos, para un nivel de confianza dado, se resuelve de dos maneras: usando
computadoras para resolver los clculos, y la otra ms comn, usando tablas
resumidas, en forma anloga a la vista para el modelo de t-Student. La distribucin de
2 se usa principalmente para analizar dispersiones. Se compara la dispersin
muestral expresada a travs de sus cuadrados medios contra la dispersin poblacional

cuantificada a travs de la varianza (2).
Existen otros criterios, como el de Thonks, que usa un error relativo admisible
mximo, y se calcula como un cuarto del rango de los valores normales de referencia,
dividido por el valor medio de dicho intervalo (referido a la magnitud clnica en
cuestin y expresado en porcentajes). Tambin se emplea a este modelo para realizar
la llamada prueba de chi-cuadrado en las comparaciones de frecuencias observadas
contra las frecuencias esperadas, con datos de recuento. Ms adelante se desarrolla
mejor este tema, lo mismo que su so para testear la independencia de dos o ms
factores en una Tabla de Contingencia.
En la industria farmacutica se la usa para analizar la dispersin de los componentes
de los productos terminados. Todo remedio fabricado debe cumplir estrictas normas
de calidad, generalmente referidas al contenido en peso de sus principales
componentes. Se usan dos lmites: el superior e inferior, dentro de los cuales se los
debe mantener controlados. Este rango de valores define la dispersin mxima
admisible y lo ideal es que la dispersin de los productos terminados sea bastante
inferior a dicho rango. Ese control de la dispersin es muy similar al explicado ms
arriba, para los bioqumicos.
Ejemplo. Un bioqumico sospecha que su micro-centrfuga no mantiene constante su
velocidad mientras trabaja, lo cual le da una variabilidad indeseada en sus
determinaciones. Para controlarla, consigue un tacmetro regulado y mide cada
minuto la velocidad durante 10 minutos. Los resultados fueron: una velocidad
promedio en las 10 mediciones de 3098 rpm con una desviacin de 100,4 rpm.
Testear para un error relativo mximo del 2% o menos, si la centrfuga es estable.
La desviacin estndar es max=2%*3098=62 rpm, luego,

H0: max62 rpm
H1: max62 rpm
(n 1)s 2 (10 1) *100.4 2
23.6
2
62 2
De la Tabla de valores crticos surge: 20,99;9=21,666 y 20,991;9=27,877. Por lo tanto, el

bioqumico ha encontrado una muy fuerte evidencia que la velocidad del equipo
oscila en forma indeseada, tal como sospechaba. Y deber ajustarlo si desea disminuir
la variabilidad de sus mediciones. Los resultados fueron muy significativos 2 = 23,6
Ejemplo. Un farmacutico Jefe del Dpto. Control de Calidad en una industria
alimenticia, descubre que en su proceso de produccin el contenido de ciclamato en
su lnea de mermeladas dietticas vara en forma indeseada. Sospechando que se trata
de una falla en el dosificador, decide tomar 10 muestras seguidas del mismo.
Encuentra un promedio de 20 gramos con una desviacin de 8 gramos. Si en su
protocolo de fabricacin la variacin mxima permitida es del 3%, determinar si el
dosificador debe ser corregido.
El desviacin estndar aceptable es: mx = 3% de 20 g = 6 g. Luego:
H0:mx
H1:mx > 6 g.: el dosificador debe ser cambiado
(n 1)s 2 (10 1) * 8 2

16
2
62
De la Tabla de valores crticos surge: 20,95;9=16,9. Por lo tanto, el farmacutico no ha

encontrado evidencia que respalde sus sospechas. Sin embargo, el valor hallado es
muy cercano al crtico, por lo que le convendra hacer ms pruebas.
2
En estadstica, la distribucin Chi-cuadrado, tambin denominada Chi-cuadrado de

Pearson, es una distribucin de probabilidad continua con un parmetro k que
representa los grados de libertad de la variable aleatoria:
X Z12 Z 22 Z 2k
donde Zi son variables de distribucin normal, N(0,1) o de media cero y varianza uno.
Se suele usar la denominada prueba Chi-cuadrado como test de independencia y
como test de bondad de ajuste. La funcin de densidad Chi-cuadrado es
(1 / 2) k / 2 k / 21 x / 2
f k (x)
x
e
x0
(k / 2)
es la funcin gamma. La funcin de distribucin es
Fk ( x )
(k / 2, x / 2)
(k / 2)
donde (k,z) es la funcin gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribucin Chicuadrada son
E[X] = k
V[X] = 2k
La distribucin Chi-cuadrado tiene muchas aplicaciones en inferencia estadstica, por
ejemplo en el test Chi-cuadrado y en la estimacin de varianzas. Tambin est
involucrada en el problema de estimar la media de una poblacin normalmente
distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a
travs de su papel en la distribucin t-Student, y participa en todos los problemas de
anlisis de varianza, por su papel en la distribucin F-Snedecor, que es la distribucin
del cociente de dos variables aleatorias de distribucin Chi-cuadrado e
independientes.
Relacin con otras distribuciones. La Chi cuadrado es una distribucin binomial
inversa cuyo coeficiente de variabilidad es 10.1, esta tiene un intervalo de confianza
de 2.3 grados en la escala de desviaciones estndar. Posee una distribucin de Poisson
elevada la cual asciende a 56.5 m Eq en los tres primeros cuartiles de la recta. Para
k=2 la distribucin es una distribucin exponencial.
La prueba de Chi-cuadrado es una prueba no paramtrica que mide la discrepancia
entre una distribucin observada y otra terica (bondad de ajuste), indicando en qu
medida las diferencias existentes entre ambas, de haberlas, se deben al azar. Tambin
se utiliza para probar la independencia de dos muestras entre s, mediante la
presentacin de los datos en tablas de contingencia. La frmula que da el estadstico
es la siguiente:
Valor Observado Valor Terico 2
2
Valor Terico
Los grados de libertad nos vienen dados por: gl= (r-1)(k-1). Donde r es el nmero de
filas y k el de columnas.
Criterio de decisin: Se acepta H0 cuando 2 2 ,n 1 . En caso contrario se rechaza.
Donde representa el valor proporcionado por las tablas, segn el nivel de
significacin elegido. Cuanto ms se aproxima a cero el valor de Chi-cuadrado, ms
ajustadas estn ambas distribuciones.
CORRECCIN DE YATES
La correccin de Yates se aplica a la prueba Chi-cuadrado cuando la frecuencia de las
observaciones en alguna de las celdas es menor de 10. La Chi-cuadrado corregida:
Valor Observado Valor Terico 0.52
2

Valor Terico
En general, se aplica la correccin de Yates o tambin correccin por continuidad
cuando aproximamos una variable discreta a una distribucin continua. La correccin
consiste en aadir y substraer 0,5 a la variable en cuestin. Por ejemplo, obtener 3
caras al lanzar una moneda es una medida discreta (nominal) que se ajusta a la
distribucin binomial. Mientras que si la aproximramos a la distribucin normal, su
valor oscilar entre 2,5 y 3,5.
DISTRIBUCIN F SNEDECOR O F-FISHER
Si U y V son dos variables aleatorias independientes que tienen distribucin Chi
Cuadrada con n1 y n2 grados de libertad, respectivamente, entonces, la variable
aleatoria
U n1
tiene funcin de distribucin F-Snedecor
F
V n2
(n 1 n 2 ) / 2n 1 / n 2 1
f ( n1 2 ) / 2
n 1 / 2n 2 / 2
1 n1f / n 2 ( n1 n 2 ) / 2
Que es la llamada funcin de distribucin F-Snedecor o F-Fisher con n1 y n2 grados
de libertad
n /2
h (f )
Ejemplo, Un valor de f con 6 y 10 grados de libertad para un rea de 0.95 a la

derecha es,
f0.95,6,10=1/(f0.05,10,6)=1/4.06=0.246
Si de dos poblaciones normales, o aproximadamente normales, se extraen dos
muestras aleatorias e independientes, y a cada una se le calcula su respectiva
2
varianza, el cociente de ambos valores F s12 s 2 (con F>1, esto es, siempre se coloca
el ms grande como numerador) tendr una distribucin de Fisher, cuyos valores
crticos fueron obtenidos por W. Snedecor en una tabla que se caracteriza por tener
dos grados de libertad: el correspondiente al numerador 1=n1-1 y el del denominador
2=n2-1. Programas de computacin permiten calcular los valores crticos respectivos
En las Tablas se presenta una hoja para cada nivel de confianza, se eligen los ms
apropiados como: 95% ; 97,5% ; 99% ; 99,5% y 99,9%. Como siempre, el rea total
bajo la curva es la unidad y se extiende desde 0 a + . La forma es muy parecida a la
Chi-cuadrado. se muestran tres casos, con diferentes grados de libertad, y se marca el
valor de F=2,5 con una ,lnea punteada vertical.
El principal uso de esta funcin es el Anlisis de Varianza, que se ver ms adelante,
y es para cuando se necesita comparar ms de dos medias mustrales a la vez. En
estos casos la idea es detectar si el efecto de uno o ms tratamientos afecta a las
muestras testeadas. En cambio, cuando se tiene el caso de dos muestras, la idea es
testear si hay homocedasticidad en las dos poblaciones en estudio. Una vez verificado
este supuesto, se puede avanzar ms verificando si hay diferencia entre las medias
mustrales, y as verificar si ambas muestras tienen igual media y varianza, porque
eso significa que en realidad provienen de la misma poblacin normal. Eso probara
que no hay efecto de un tratamiento si se lo compara con un placebo, o que dos
tcnicas de laboratorio son equivalentes.
Si el experimento no verifica esto, entonces se deber elegir el caso que presente
menor varianza, para tener menor variabilidad en las mediciones. En Gentica se
puede verificar si una generacin de cras es ms variable en un carcter que la de sus
padres. En Sistemtica se puede testear si dos poblaciones locales tienen la misma
variabilidad. En Bioqumica y Farmacia el uso ms frecuente es comparar el error
casual de mediciones de laboratorio, al introducir algn efecto o cambiar el mtodo
de medicin. En el caso de testear si dos tcnicas de laboratorio tienen igual
dispersin, o bien, para elegir aquella con mayor precisin, conviene pensar el
problema como la incidencia de un factor en estudio en lugar de dos tcnicas
totalmente diferentes entre s. Por ejemplo, se trata de una misma prctica, pero se
usan dos espectrofotmetros diferentes, y se trata de determinar si la modificacin de
la varianza se debe al uso de un aparato diferente. El factor ac sera: tipo de
espectros.
Tambin se puede estudiar la incidencia del factor humano, realizando las mismas
mediciones a dos personas diferentes. De esa forma se puede imaginar que las dos
muestras provienen de diferentes poblaciones, o que el efecto del factor analizado no
es despreciable cuando se rechaza la hiptesis nula. En la figura se muestra el caso de
dos poblaciones. En el caso (a) ambas poblaciones tienen la misma media, pero por
efecto del error casual sus varianzas son diferentes. Si esta diferencia es significativa,
resulta evidenciada por el Modelo de Fisher que permite la comparacin de ambas.
En el caso (b) hay un error sistemtico que desplaza la media, pero sus varianzas
permanecen iguales. Es lo mismo que sumar una constante a todos los valores; ocurre
un desplazamiento hacia la derecha. t-Student se usa para detectar esto cuando se
hace el test de comparacin de dos medias independientes. Como se ver ms
adelante, se puede construir todo un bagaje de mtodos para efectuar un Control de
Calidad interno en un laboratorio de medicin clnica. Por ahora, basta decir que se
puede controlar la exactitud con los modelos de t-Student y la precisin con los de
Chi-cuadrado y Fisher.
Con esto se pueden comenzar a controlar y calibrar los sistemas de medicin. Las
limitaciones de todo esto son dos: la primera es que se puede estudiar el efecto del
factor analizado en solo dos muestras y no en ms de dos. La segunda es que si la
calidad se entiende como exactitud y precisin, solo se pueden emplear estos modelos
para magnitudes de tipo cuantitativas como las de la Qumica Clnica, pero no en
magnitudes cualitativas como las usuales en Microbiologa, Bacteriologa, Micologa,
etc. En magnitudes cuantitativas, por calidad se entiende precisin y exactitud, en
lugar de la capacidad de una prueba clnica para diagnosticar. Sin embargo, a pesar de
estas limitaciones sigue siendo una herramienta sencilla y poderosa de control.
Para poder aplicar este modelo se deben tener en cuenta los requisitos siguientes:
- Las muestras fueron extradas de una poblacin normal o aproximadamente
normal.
- La seleccin de las muestras se hizo en forma aleatoria.
- Las muestras son independientes entre s.
Ejemplo, El jefe de un laboratorio se encuentra con una tcnica de medicin fuera del
control estadstico. Para investigar las causas decide investigar si el factor humano
tiene incidencia, y toma una muestra de suero cualquiera la divide en 20 alcuotas.
Luego elige 10 de ellas al azar y se las entrega al laboratorista 1 para que haga las
determinaciones; las restantes las encomienda al laboratorista 2 para que las mida.
Los resultados obtenidos son: s12=2,4 es la varianza obtenida por el laborista, 1 y
s22=0,8 para el otro. Decidir si hay diferencia en dispersin entre ambos.
H0: 12 22
H1: 12 22
El estadgrafo es
12 2.4
F 2
3.0
2 0.8
Como se trata de un ensayo de dos colas, para un nivel del 95% de confianza, se
busca en las tablas para: 1=2=n1-1=9 grados de libertad, mientras que = 0,025
para el lmite inferior y = 0,975 para el superior. Estos valores son F0,975;(9,9) = 4,03.
Luego, para calcular el valor no tabulado = 0,025 se aprovecha una propiedad que
tiene la funcin F usando la inversa: F0,025;(9,9) =1/F0,975; (9,9) =1/4,03 = 0,248 Como
el valor hallado F=3 cae dentro de la zona de aceptacin, no hay evidencia
significativa como para decir que el factor humano tiene incidencia en la dispersin
de las mediciones.
La distribucin F de Snedecor aparece en los contrastes asociados a comparaciones
entre las varianzas de dos poblaciones normales. Si (X 1,X2,...,Xm) y (Z1,Z2,...,Zn) son
m+n variables aleatorias normales independientes de media =0 y varianza 2, la
variable
1 n 2
i1 X i
m
Yn
1 n 2
Zi
n i1
10
tiene una distribucin Fm,n-Snedecor de m y n grados de libertad. Su funcin de

densidad es
m/2
m n m

2 n
f (x)
m n

2 2
mx
x ( m 2 ) / 2 1
( m 2 ) / 2
con x > 0, siendo (P) X P 1e x dx la funcin gamma de Euler con P>0.

0
Finalmente, la funcin de distribucin viene dada por

x
F( x ) P(X x ) f ( t )dt
0
y sus momentos por la media y la varianza son

n
2n 2 (m n 2)
E ( X)
y
V( X)
n2
m(n 2) 2 (n 4)
Definindole de otra manera, sean X 2n
independientes, entonces,
mX
F
Fn ,m
n Y
y Y 2m variables aleatorias
sigue una distribucin de probabilidad F-Snedecor, con (n,m) grados de libertad.

Obsrvese que Fn,mFm,n
Es claro que la distribucin F-Snedecor no es simtrica, pues slo tienen densidad de

probabilidad distinta de cero, y adems F Fn ,m entonces F 1 Fm,n
11
DISTRIBUCIN t-STUDENT
Si (X,X1,X2,...,Xn) son n+1 variables aleatorias normales independientes de media 0 y
varianza 2, la variable
X
Yn
1 n 2
Xi
n i 1
tiene una distribucin t-Student con n grados de libertad. Su funcin de densidad es
n 1
n 1
2
2
1
x
2
f (x)
x0
n
n
n

2
siendo (P) X P 1e x dx la funcin gamma de Euler con P>0. La media de la

0
distribucin t-Student es E(X)=0 y su varianza V(X)=n/(n-2), la cual no existe para

grados de libertad menores que 2.
Esta distribucin aparece en algunos contrastes del anlisis normal.
La distribucin t-Student se construye como un cociente entre una normal Z~N(0,1) y
la raz de una Chi 2n independientes. De modo preciso, llamamos distribucin tStudent con n grados de libertad, tn a la de una variable aleatoria T,
X
Z
T
t n y adems, T
tn
2
1 2
n
1 Xi i
n
n
n i 1 i
12
Para calcular
n 1
( n 1) / 2
2 x2
P(T t ) f ( t )dt
dx
1 n
n
2
t
Sea un estadgrafo t calculado para la media con la relacin

x
t
n
0,375
n=120
n=2
n=11
0,125
-3,50
+3,50
Ejemplo, En 16 recorridos de prueba de una hora cada uno, el consumo de gasolina

de un motor es de 16.4 gal, con una desviacin estndar de 2.1 gal. Demuestre que la
afirmacin que el consumo promedio de gasolina de este motor es 12.0 gal/hora
Solucin, Sustituyendo n=16, =12.0, x =16.4 y s=2.1 en la formula de t-Student, se
tiene
x 16.4 12.0
t
8.38
s n
2.1 16
Para el cual en las tablas, para =5% y 15 gl es insignificante, y por tanto se puede
concluir que el consumo de 12 gal/h es real
Ejemplo, Encuentre los valores de la funcin para:
a. 14 gl, =97.5%t0.975=-t2.5%=-2.145
b. P(-t0.025<T<t0.05)=0.925
Si de una poblacin normal, o aproximadamente normal, se extraen muestras
aleatorias e independientes y a cada una se le calcula dicho estadgrafo usando los
13
valores mustrales de la media y el desviacin estndar, entonces se obtiene una

distribucin muestral t. Esta funcin matemtica tiene un parmetro que la define en
forma unvoca: el nmero de grados de libertad =n-1 (donde n es el tamao
muestral). El concepto matemtico de est relacionado con la cantidad de
observaciones independientes que se hagan y se calcula con el tamao muestral n,
menos la cantidad k de parmetros poblacionales que deban ser estimados a travs de
ellas. O sea: =n.k. Si se observa la ecuacin superior, se ve que el nico parmetro
poblacional que figura es , por lo tanto k=1 y as resulta =n.1. Cuando el tamao
muestral es mayor que 30 la distribucin de t-Student se aproxima mucho a la de
Gauss, en el lmite ambas son iguales.
Es decir que la funcin t-Student tiende asintticamente a la funcin de Gauss. Para
cada grado de libertad hay una tabla de valores que pueden obtenerse variando el
nivel de significacin, parecida a la de Gauss. La distribucin de t-Student, al igual
que la de Gauss, es simtrica respecto al origen de coordenadas y se extiende desde
hasta + . Pero a diferencia de la normal, puede adoptar diferentes formas
dependiendo del nmero de grados de libertad. Por ejemplo, la que tiene un solo
grado de libertad (n=2 y =1), se desva marcadamente de la normal, como se puede
ver en la figura anterior. Luego, a medida que los grados van aumentando, se acerca
cada vez ms, hasta igualarla en el infinito.
Los intervalos de confianza para esta distribucin se arman en forma anloga a la
vista para el caso de Gauss. Con la nica diferencia en cmo se calcula el valor crtico
t; en lugar de z.
( e t , * e )
La teora de decisiones se usa en forma anloga, empleando los intervalos de
confianza visto ms arriba. Pero para poder aplicar este modelo se deben tener en
cuenta los requisitos siguientes:
- Las muestras fueron extradas de una poblacin normal o aproximadamente
normal.
- La seleccin de las muestras se hizo en forma aleatoria.
- Las muestras son independientes entre s.
Si alguno de ellos no se cumple, las conclusiones que se obtengan no son vlidas. Los
supuestos se pueden resumir as: para poder usar t-Student, se deben tener muestras
normales, aleatorias e independientes. Notar que el error estndar de estimacin es e.
- t-Student para medias muestrales. En este caso e =.x luego: e= y e2=s2/n .
Por lo tanto el valor de comparacin se calcula,
x
t
s n
14
Ejemplo. Se desea saber si un instrumento de medicin cualquiera est calibrado,

desde el punto de vista de la exactitud. Para ello se consigue un valor patrn y se lo
mide 10 veces (por ejemplo: una pesa patrn para una balanza, un suero control para
un mtodo clnico, etc.). Suponiendo que el resultado de estas mediciones arroja una
media de 52,9 y una desviacin de 3, usando un patrn de valor 50, se debe
determinar si el instrumento est calibrado y la estimacin de su error sistemtico, si
es que se prueba su existencia (no se usan unidades para generalizar este ejemplo).
Ho :
H1 :
Se trata de un ensayo de dos colas donde hay

1=9 grados de libertad. De la
Tabla t-Student se obtienen los valores crticos para el 95% de t 0,05
99% de t 0,01
0,001
establecer las zonas de aceptacin y rechazo:
52.9 50.0 3
t
3 10
Dibujando las zonas con los valores crticos, el valor de t cae en la de rechazo para el
95% y no alcanza para las otras. La conclusin es que se ha probado la existencia de
un error sistemtico con una confianza del 95%.
Ejemplo. Se midi colesterol total a 11 pacientes varones adultos escogidos al azar
los resultados obtenidos arrojan una media de 235 mg/dl y un desviacin estndar de
35 mg/dl. Ensayar la hiptesis de que se mantienen por debajo del valor lmite de
referencia de 220 mg/dl
15
.
Ho: 220 mg/dl
H1: 220 ,g/dl
El valor t-Student para una sola cola es,
235 220 1.42
t
35 11
Valor no significativo pues t 0.05,10=1.81, entonces cae dentro del intervalo del 95%
Para el caso de una cola, el valor de tablas para el 95% debe ser el que est en la
Tabla t-Student para el 90% en dos colas. La idea es que el 10% en dos colas
significa el 5% en cada una, por la simetra de la curva de t-Student. Luego, para
La
conclusin es que no puede rechazar la hiptesis nula, por lo que debe considerarse
un colesterol total admisible desde el punto de vista clnico, por estar por debajo del
lmite de referencia.
- t-Student para proporciones. En este caso e=P y p== luego con se puede
obtener el valor del estadgrafo de comparacin con la relacin,
P
t
1 n
Ejemplo. Un analgsico de plaza, afirma en su propaganda que alivia el dolor en el
90% de los casos antes de la primera hora luego de su ingesta. Para validar esa
informacin, se hace un experimento en 20 individuos con cefalea. Se observa que
fue efectivo en 15 de ellos.
16
Ho: 0.9
H1: 0.9
El valor t-Student para una sola cola es, siendo P el porcentaje de xitos
P=15/20=0.75 y la media de =0.90 con desviacin 0.9 * 0.1 / 20 0.067
0.75 0.90 2.24
t
0.067
Valor es significativo pues t 0.999,19=-3.579 o t0.99,19=-2.539 o t0.95,19=-1.729, entonces
cae fuera del intervalo del 95%. De todas formas la evidencia no alcanza para
rechazar la hiptesis a los niveles del 99% y 99,9%. Se la rechaza al nivel de 95%
nicamente. Si bien no es tan terminante, se puede afirmar que la aseveracin es falsa
con un 95% de confianza.
-
t-Student para dos muestras independientes. El modelo de t-Student tambin

se puede usar cuando se desean comparar dos muestras entre s, para detectar si
hay diferencia significativa entre ellas, debido a algn factor analizado. En primer
lugar se analizar el caso de dos muestras independientes como: aplicar dos tipos
de remedios a dos grupos de pacientes escogidos al azar, o las mediciones
repetidas de una misma magnitud, etc. El otro caso, cuando las muestras no son
independientes sino apareadas, se ver en el prximo tema. Una vez ms, los
supuestos para poder aplicar este modelo se resumen en: para poder comparar con
t-Student, las dos muestras deben ser normales, aleatorias e independientes.
Se sacan muestras aleatorias e independientes, de dos poblaciones normales. La idea

es averiguar si ambas muestras provienen de la misma poblacin o de poblaciones
diferentes. Con eso se puede ver si el efecto de los tratamientos aplicados a las
muestras es apreciable, en cuyo caso las muestras parecern provenir de diferentes
poblaciones. Se usa en los casos donde se compara el efecto de una droga aplicada a
un grupo de pacientes, contra otro grupo al cual se le suministra un placebo. Tambin
para comparar dos tcnicas clnicas y detectar si hay diferencias, por ejemplo: dos
17
marcas comerciales de plaza, dos instrumentos de medicin, dos individuos, dos

tcnicas diferentes (la nueva contra la vieja), dos protocolos, etc. Con estas
comparaciones se pueden realizar muchos controles internos en el laboratorio para
hacer calibraciones, medir eficacia, etc. Hay una limitacin: solo se pueden comparar
dos muestras entre s a la vez y nada ms. Para el caso de tener ms de dos muestras,
se recurre a los modelos de Anova.
- Comparacin de medias. Para estos casos, el valor de t-Student para validaciones
de medias se calcula con:
x x 2 1 2
t 1
s12 s 22
n1 n 2
El cual se contrasta con t ; donde =n1+n2-2 grados de libertad. Hay casos
particulares cuando: las muestras son de igual tamao y/o las muestras son
homocedsticas (tienen igual varianza). En ambos casos se simplifican las frmulas
de clculo.
Ejemplo. Se aplica un medicamento a 15 pacientes que padecen cierta enfermedad,
escogidos al azar, y un placebo a 20 pacientes. En el primer grupo, la desaparicin del
estado febril se observa a las 19 horas de tratamiento en promedio (con una
desviacin de 2 h.). En el grupo control, la mejora se observa en promedio las 25
horas con un desviacin de 3 horas. Decidir si el medicamento modifica el tiempo de
curacin.
Ho: 1=2
H1: 12
El valor t-Student para dos colas para 33 gl, siendo
25 19 0 7.06
t
9
4
20 15
18
Valor cae fuera del intervalo, como el valor hallado de t es mucho ms grande que el
valor crtico de tablas para 33 grados de libertad: t ;=t0,999;33=3,44 (ensayo de dos
colas y un 99,9% de confianza), por tanto se obtuvieron resultados altamente
significativos como para rechazar la hiptesis nula. Se tiene una prueba cientfica del
efecto del medicamento.
Ejemplo. Se desea verificar si hay diferencia en las mediciones a travs de dos
mtodos clnicos diferentes. Se toma una muestra de suero lo suficientemente grande
como para obtener 10 alcuotas. Se distribuyen al azar 5 alcuotas para cada mtodo.
Efectuadas las mediciones, con el primero se tuvo una media de 85 mg/dl con un
desviacin de 8 mg/dl. Mientras que con el segundo se tuvo una media de 83 mg/dl
con un desviacin de 6 mg/dl.
Ho: 1=2
H1: 12
El valor t-Student para dos colas para 33 gl, siendo
85 83 0 0.44
t
64 36
5
5
Por tanto, no se puede rechazar H0, pues hay diferencia entre ambos mtodos
- Comparacin de proporciones. Para estos casos, el valor de t-Student para
validaciones de proporciones se calcula la misma frmula, pero reemplazando los
valores esperados con
(1 1 ) 2 (1 2 )
12 (1 2 )
122 1
n1
n2
Entonces, el valor de comparacin del modelo t-Student para este caso es,
19
(p1 p 2 ) (1 2 )
1 (1 1 ) 2 (1 2 )
n1
n2
Contrastando con el valor de tablas dado por t ;; con = n1+n2-2 grados de libertad.
Ejemplo. Se escogen al azar dos grupos formados por 20 individuos cada uno, entre
los que padecen cierta alergia. Se administra una droga curativa al primer grupo y se
observa una mejora en 15 de los casos. Al segundo grupo se le administra un placebo
y mejoran 13 de ellos. Ensayar la hiptesis que la droga sirve para curar ese tipo de
alergia. Se emplean las hiptesis siguientes:
H0 : 1-2 = 0 las diferencias observadas se deben al azar
H1: 1-2 0 la droga produce efecto.
Si se supone que ambas muestras fueron extradas de la misma poblacin, y por lo
tanto no hay diferencias entre las muestras observadas (H 0) 1-2 = 0, eso significa que
el porcentaje de curados en dicha poblacin ser =1=2 y habr que estimarlo con
los datos mustrales, calculando la proporcin ponderada con:
p=( total de curados en las muestras / total muestral ) = (15+13) / 40 = 0,7
Entonces, sacando factor comn en la frmula de la varianza, esta resulta: 2() =
(1.) [2 / n] =(0,7 . 0,3) (2/20) = 0,021
Y es () = 0,145; de los datos del problema surgen P 1 =15/20 = 0,75 y P2 = 13/20 =
0, 65
t = ( 0,75 0,65 ) / (0,021)1/2= 0,69 < t 0,95 ; 38=2,02. 1-2 = 0 cae dentro de 95%.
Un resultado no significativo. Las diferencias observadas no se deben a la droga sino
al azar.
- Test de equivalencia biolgica. Hay ocasiones donde la Ho no busca establecer si
hay o no diferencia entre dos muestras, como las del ejemplo anterior, sino que se
trata de establecer si un mtodo clnico o tratamiento nuevo es lo suficientemente
bueno como para reemplaza al que se vena usando hasta entonces, el mtodo
viejo. Las ventajas de este nuevo mtodo pueden ser: un costo menor, ms rpido,
menos daino o peligroso para el paciente, etc. La cuestin bsica aqu es ver si,
en promedio, la diferencia entre ambos es menor que un cierto valor lmite para la
magnitud estudiada. Es decir que tal diferencia no implique una inferioridad del
nuevo mtodo, desde un punto de vista clnico.
20
Para estos casos la Ho: La diferencia entre ambos promedios es mayor o igual al valor
aceptable y la alternativa es H1 : Esta diferencia de medias es menor al valor crtico;
en cuyo caso ambos mtodos pueden ser considerados clnicamente equivalentes. La
idea es que, si se rechaza la H o se puede usar el mtodo nuevo en lugar del viejo y
aprovechar las ventajas que este posee. Pero la decisin se basa ms en
consideraciones mdicas que estadsticas. Entonces, si se trata de magnitudes
continuas, se puede usar el test de t-Student para comparar la diferencia de las dos
medias contra el valor crtico o mximo aceptable desde el punto de vista clnico.
El planteo se hace as: H o : V N = . > . Donde V es el valor poblacional que se
obtiene con el mtodo viejo y N con el mtodo nuevo, . es la diferencia real entre
ambos mtodos y es la diferencia mxima admisible entre ambos mtodos. De esta
manera, cuando Ho pueda rechazarse se tendr evidencia suficiente como para
efectuar el reemplazo, esto es cuando H1 : V N = . < .
Se trata de un ensayo de una sola cola. Pero cuando se trate de ver si en valor
absoluto la diferencia entre ambos mtodos no supere a un cierto valor , porque aqu
no interesa tanto que sea menor, sino que tambin interesa que no sea mayor
(dependiendo de la magnitud clnica analizada); entonces la Ho ser : VN= y el
ensayo ser de dos colas. Anlogo al visto en el punto anterior. Para ilustrar este
procedimiento se usar un ejemplo tomado de la obra de Armitage
Ejemplo. Sea el ndice cardaco CI (respuesta cardiaca normalizada para la superficie
del cuerpo) el cual se mide con un procedimiento invasivo como es el colocar un
catter en el corazn del paciente llamado Termo-dilucin (el mtodo viejo) y la
unidad de medicin son litros por minuto tomado por m2 de superficie del cuerpo
humano. Se ha propuesto una nueva manera de medir esa magnitud con una tcnica
no invasiva, llamada el mtodo de la Bioimpedancia, en la cual se le adosa un
instrumento al cuerpo de paciente en forma externa, y mide en forma elctrica el
valor del CI usando una escala adecuada (el mtodo nuevo). El criterio clnico de
aceptacin es: el nuevo mtodo se considerar equivalente al viejo cuando, en
promedio, el valor obtenido difiera en un 20% respecto al promedio aceptado de 2,75
l / min. / m2 para el mtodo del catter. Esto significa que el 20% de tal valor es =
0,55. Luego el planteo se hace as:
Ho : .V N . = ... > = 0,55 o lo que es lo mismo (V N ) = = 0,55
H1 : .V N . = ... < = 0,55 cuyo equivalente es (V N ) = 0,55
21
Se toma una muestra de N=96 individuos a los cuales se le aplica el mtodo nuevo,
los valores encontrados fueron un promedio de 2,68 l / min. / m2, y un desviacin
estndar de 0,26 l / min. / m2 luego ser,
x 2.68 2.75 2.642
t
0.26
n
96
Como se observa t=-2.642 es mayor que t 0.99,95=-2.62, lo que indica que hay evidencia
significativa como para rechazar a H0
La conclusin final es que se puede usar el mtodo nuevo en lugar del viejo, con una
gran ventaja para el paciente, pues ahora ya no tendr que ser cateterizado para
efectuarle su medicin del ndice cardaco. A este procedimiento estadstico
aparecido en los ltimos aos en Medicina se lo conoce tambin con el nombre de
test de equivalencias mdicas o biolgicas.
- t-Student para dos muestras apareadas. El modelo de t-Student se puede usar
para el caso especial de muestras apareadas, esto es, cuando se le efectan dos
tratamientos a la misma muestra; por ejemplo, del tipo antes despus donde al
mismo individuo se lo mide dos veces para ver el efecto del tratamiento realizado,
o el caso de mtodo nuevo contra el mtodo viejo, donde al mismo grupo de
pacientes se le hacen dos mediciones a cada uno, la del mtodo de rutina habitual y
una extra con el nuevo mtodo a probar para decidirse entre ambos. La idea bsica
es como sigue: se sacan n muestras aleatorias e independientes de una poblacin
normal. A cada muestra se le aplican dos tratamientos A y B diferentes y lo que
interesa detectar es si producen algn efecto apreciable.
Este caso es muy diferente al anterior si bien las muestras son independientes entre s,
los tratamientos no lo son, porque a un mismo individuo se le aplican ambos
22
tratamientos. Entonces, la misma persona aparecer dos veces en los resultados: uno
en el grupo A y el otro en el grupo B.
El truco para resolver este problema de la independencia es trabajar con la diferencia
de los resultados de cada par de mediciones efectuadas: d=x A-xB. Luego se tendrn n
diferencias d1;d2;d3...dn, que son independientes entre s, puesto que cada valor di
corresponde a un solo individuo. Luego, se le aplica el modelo t-Student para una
sola muestra, ensayando la hiptesis de que no hay diferencias entre ambos grupos. O
sea, efectuando
d O
t
n
Las hiptesis Inicial y alterna implica un efecto diferente para cada grupo, H 0:d=0
H1:d0. Si se prueba que el valor esperado del promedio de las diferencias es
diferente de cero, entonces el tratamiento aplicado produce un efecto demostrable.
Para aclarar estas ideas se presenta el siguiente caso:
Ejemplo. Se escogen 5 pacientes al azar, del grupo que concurre diariamente al
Laboratorio de Anlisis Clnicos a efectuarse una determinacin de Uremia. Las
muestras extradas se miden con el procedimiento habitual y adems con una nueva
tcnica clnica que se desea probar. Ver si hay diferencia entre ambas tcnicas. Los
resultados expresados en g/l fueron:
Paciente
Vieja
Nueva
Diferencia
1
0.38
0.33
0.05
2
0.54
0.45
0.09
3
0.22
0.15
0.07
4
0.11
0.09
0.02
5
0.23
0.22
0.01
Promedio y desviacin estndar, respectivamente: 0.048 y 0.033

Con los valores de las diferencias se calculan d 0.048
0.048
t
3.25
0.033 5
y 0.033 , luego
Que obviamente es mayor que t 0.95,4=2.776, entonces O cae por fuera del intervalo, y
entonces se tienen evidencia significativa de que hay diferencia entre ambas tcnicas
TABLAS
En el Anexo de incluyen las tablas de las funciones Normal, Chi Cuadrado, t-Student
y F-Snedecor
23

Chi Cuadrado

Cargado por

Copyright:

Formatos disponibles

Chi Cuadrado

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Chi Cuadrado

Cargado por

Copyright:

Formatos disponibles

11.

FUNCIONES DE DISTRIBUCIN ESPECIALES

Yn X12 Xn2 i1 Xi2

siendo (P) X P 1e x dx la funcin gamma de Euler, con P>0. La funcin de

distribucin viene dada por

La media de esta distribucin es E(X)=n y su varianza V(X)=2n. Esta distribucin es

La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n

Solucin. Existe fuera de control si (n 1)s 2 / 2 con n=20 y =0.60, excede

En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada

La distribucin Chi muestra su importancia cuando queremos determinar la

La funcin Chi-cuadrado es igual a la funcin normal elevada al cuadrado. Esto es, el

muestral expresada a travs de sus cuadrados medios contra la dispersin poblacional

La desviacin estndar es max=2%*3098=62 rpm, luego,

(n 1)s 2 (10 1) *100.4 2

De la Tabla de valores crticos surge: 20,99;9=21,666 y 20,991;9=27,877. Por lo tanto, el

De la Tabla de valores crticos surge: 20,95;9=16,9. Por lo tanto, el farmacutico no ha

En estadstica, la distribucin Chi-cuadrado, tambin denominada Chi-cuadrado de

donde (k,z) es la funcin gamma incompleta.

Ejemplo, Un valor de f con 6 y 10 grados de libertad para un rea de 0.95 a la

tiene una distribucin Fm,n-Snedecor de m y n grados de libertad. Su funcin de

con x > 0, siendo (P) X P 1e x dx la funcin gamma de Euler con P>0.

Finalmente, la funcin de distribucin viene dada por

y sus momentos por la media y la varianza son

sigue una distribucin de probabilidad F-Snedecor, con (n,m) grados de libertad.

Es claro que la distribucin F-Snedecor no es simtrica, pues slo tienen densidad de

siendo (P) X P 1e x dx la funcin gamma de Euler con P>0. La media de la

distribucin t-Student es E(X)=0 y su varianza V(X)=n/(n-2), la cual no existe para

Sea un estadgrafo t calculado para la media con la relacin

Ejemplo, En 16 recorridos de prueba de una hora cada uno, el consumo de gasolina

valores mustrales de la media y el desviacin estndar, entonces se obtiene una

Ejemplo. Se desea saber si un instrumento de medicin cualquiera est calibrado,

Se trata de un ensayo de dos colas donde hay

t-Student para dos muestras independientes. El modelo de t-Student tambin

Se sacan muestras aleatorias e independientes, de dos poblaciones normales. La idea

marcas comerciales de plaza, dos instrumentos de medicin, dos individuos, dos

Promedio y desviacin estndar, respectivamente: 0.048 y 0.033

También podría gustarte