Estadistica No Parametrica
Estadistica No Parametrica
Estadistica No Parametrica
TEMA:
MAESTRISTAS:
Freddy TARAZONA SANCHEZ.
Martha GALINDO QUISPE.
2014
1
A Dios
permitirnos
cada
mejores.
por
ser
da
INDICE
ndice General.
Introduccin
5
5
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
7
8
9
10
12
13
13
14
14
15
16
17
17
18
19
21
22
23
24
24
INTRODUCCIN
Durante mucho tiempo los estadsticos han preferido las tcnicas paramtricas o han
optado por diversas transformaciones a fin de poder aplicarlas, dejando como recurso
final a las pruebas no paramtricas cuando no se ha podido encontrar evidencia
estadstica de que la poblacin sigue una distribucin normal. Por otro lado Hollander M.,
Wolfe D. (1973) recalcan la falta de robustez de las pruebas paramtricas frente al
supuesto de normalidad en la mayora de los casos. Indican adems que los supuestos de
donde se parte para el desarrollo terico de dichas tcnicas son fuertes, es decir difciles
de suponer sin pruebas de hiptesis apropiadas, mientras que las pruebas no
paramtricas permiten soluciones elegantes donde los supuestos son ms sencillos de
cumplir que los propuestos por las tcnicas paramtricas.
CAPITULO I
LA ESTADSTICA NO PARAMTRICA
de la
1.2.2.
Prueba de Pearson
Prueba de la mediana
Prueba de Kruskal-Wallis
Prueba de Anderson-Darling
Prueba de Friedman
Prueba de Cochran
Prueba de Kendall
Prueba de Kolmogrov-Smirnov
Prueba de Siegel-Tukey
Prueba binomial
Prueba de Kuiper
Tablas de contingencia
Prueba de Wald-Wolfowitz
CAPITULO II
HERRAMIENTAS DE LA ESTADSTICA NO
PARAMTRICA
2.1. Prueba X2 de Pearson:1
La prueba X2 de Pearson es considerada como una prueba no paramtrica que
mide la discrepancia entre una distribucin observada y otra terica (bondad de
ajuste), indicando en qu medida las diferencias existentes entre ambas, de
haberlas, se deben al azar en el contraste de hiptesis. Tambin se utiliza para
probar la independencia de dos variables entre s, mediante la presentacin de los
datos en tablas de contingencia.
2.1.1. Bondad de ajuste:
Permite comprobar si la distribucin emprica de una variable cualitativa se
ajusta a una distribucin terica.
Es una extensin del contraste sobre una proporcin para el caso de que la
variable tenga ms de dos categoras.
La frmula que da el estadstico es la siguiente:
I
observadai teoricai
i 1
teoricai
X
2
2 I 1k
La zona crtica:
X2
Se rechaza Ho si
X 2 2 I 1k
ei observadoi teoricoi
o el error tipificado: Z ei
observadoi teoricoi
teoricoi
https://www.uam.es/personal_pdi/psicologia/cadalso/Docencia/ADII/Materiales/esquema_tema_6.pdf
X 2 2 I 1 J 1
H0 : P 0,5
Donde P es la proporcin de observaciones no nulas en la poblacin que
son positivas.
Desviacin tpica: nP 1 P
S*
S * Pn
P n
T min T ,T
9
Donde:
E T T
Var T T2
n n 1
4
n n 1 2n 1
24
T T
10
U n1n2
n1 n1 1
R1
2
E U U
Var U 2U
n1n2
2
n1n2 n1 n2 1
12
Cuando las muestras son de gran tamao (ambas son como mnimo de 10),
la distribucin normal es una buena aproximacin de la distribucin de la
variable aleatoria:
U U
U U
Re chazar H 0 si
Re chazar H 0 si
11
U U
rs 1
6 di2
i 1
2
n n 1
Donde las di son las diferencias entre los puestos de los miembros de los
distintos pares. Los siguientes contrastes de la hiptesis nula Ho de que no existe
ninguna relacin en la poblacin tienen un nivel de significacin .
Para contrastar la hiptesis nula de que no existe ninguna relacin frente a la
hiptesis alternativa de que existe una relacin positiva, la regia de decisin es:
Re chazar H 0 si rs rs ,
Para contrastar la hiptesis nula de que no existe ninguna relacin frente a la
hiptesis alternativa de que existe una relacin negativa, la regia de decisin es:
Re chazar H 0 si rs rs ,
12
13
n n 1 j 1 n j
14
a d .
n
ninguna relacin entre los dos mtodos de clasificacin o evaluacin o entre los
observadores, o entre las dos escalas de evaluacin, podra haber algn grado de
coincidencia por mero azar. Si empleramos una moneda para clasificar una
poblacin asignndole una situacin segn salga cara o cruz, y volvemos a
evaluarlo mediante el lanzamiento de otra moneda, lo ms probable es que haya
aproximadamente un 50% de coincidencias. Si se quiere eliminar ese sesgo, hay
que eliminar de alguna forma la concordancia esperada por azar.
Si denominamos Co a la proporcin de la concordancia observada (en tanto por
uno), y Ca, a la proporcin de concordancia que se esperara por mero azar, K
sera igual a:
Co Ca
1 Ca
http://www.samiuc.es/index.php/estadisticas-con-variables-binarias/medidas-de-concordancia/kappade-cohen.html
15
http://www.estadisticafi.unam.mx/point/11.pdf
16
X r2
12
Rc 2 3H K 1
HK K 1
Donde:
Rc
2 NC N D
N N 1
1 1
http://www.let.rug.nl/nerbonne/teach/rema-stats-meth-seminar/presentations/Vonk-Cochrans-Q2011-June-7.pdf
17
2 NC N D
N N 1 TX N N 1 TY
4 N 10
9 N N 1
3 N N 1
4 N 10
D sup F n xi F0 xi
1i n
Donde:
http://www2.ulpgc.es/hege/almacen/download/5/5015/Complemento_3_Prueba_de_Bondad_de_Ajust
e_de_Kolmogorov_Smirnov.pdf
18
Si D D Aceptar H0
Si D D Re chazar H0
Donde D se elige de tal manera que:
P Re chazar H 0 / H 0 es cierta
P D D / los datos siguen la distribucin M
Siendo el nivel de significacin del contraste.
2.15. Prueba de Siegel-Tukey:7
El procedimiento de Mann-Whitney fue adaptado por S. Siegel y J. Tukey puede
adaptarse para contrastar si dos muestras independientes han sido extradas de
poblaciones con igual varianza, frente a la hiptesis alternativa de que han sido
extradas de poblaciones con varianzas diferentes. Para ello, una vez ordenados
todos los elementos de ambas muestras, combinados, se asignan rangos
comenzando desde el menor y el mayor, hacia el centro: al menor valor se le
asocia el rango 1; al valor ms elevado y al que le precede se asignan los rangos 2
y 3 ; al segundo y tercer valores ms bajos se asignan los rangos 4 y 5, y as
sucesivamente. Si el nmero total de observaciones en ambas muestras es par,
una de ellas se quedar sin rango. Las expresiones anteriores se utilizan para
7
https://www.ucm.es/data/cont/docs/518-2013-11-13-noparam.pdf
19
Rm
n n 1 n1n2 n 1
N m
;
2
2
20
CONCLUSIONES
21
GLOSARIO
CONCEPTOS BSICOS
Poblacin: Todo el conjunto de elementos, finito o infinito, que tiene una o
varias
una
muestra (media, moda, mediana, varianza...). Todos ellos permiten describir en forma
simplificada al conjunto de datos obtenidos en la muestra.
X , M = media
S, DT = desviacin tpica
En definitiva, lo que en la investigacin interesa es describir las poblaciones.
Pero debido a que suelen ser muy grandes y su conocimiento es costoso, la
Estadstica Inferencial se encarga de estimar los parmetros a partir de los
correspondientes estadsticos.
Tabular: Es clasificar la informacin de forma resumida mediante una tabla.
Tabla: Conjunto de clases o modalidades
22
SIMBOLOGA
Media poblacional
Mediana poblacional
x~
Mediana muestral
Varianza poblacional
H0
Hiptesis Nula
H1
Hiptesis Alterna
ij
0, 1
T+, T-
23
Estadsticos de Wilcoxon
U1, U2
Estadsticos de Mann-Whitney
W1, W2
Estadsticos de Ansari-Bradley
BIBLIOGRAFIA
Introduccin a la estadstica descriptiva - Esther Chiner
"Tcnicas Estadsticas Paramtricas y No Paramtricas Equivalentes: Resultados
Comparativos por Simulacin- Muman Andrs Rojas Dvila-Escuela Superior
Politcnica del Litoral-Ecuador.2003.
WEB GRAFIA
http://www.iuma.ulpgc.es/~nunez/mastertecnologiastelecomunicacion/RecursosGenerale
s/TesisEstadisticaParametricayNoPara "Tcnicas Estadsticas Paramtricas y No
Paramtricas Equivalentes: Resultados Comparativos Por Simulacin"
http://scientific-european-federation-osteopaths.org/es/prueba-estadisticasLas pruebas
estadsticas
http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico#Principales_par.C3.A
1metros parmetros
https://www.ucm.es/data/cont/docs/518-2013-11-13-noparam.pdf
http://www2.ulpgc.es/hege/almacen/download/5/5015/Complemento_3_Prueba_de_Bond
ad_de_Ajuste_de_Kolmogorov_Smirnov.pdf
http://www.let.rug.nl/nerbonne/teach/rema-stats-meth-seminar/presentations/VonkCochrans-Q-2011-June-7.pdf
http://www.estadisticafi.unam.mx/point/11.pdf
http://www.samiuc.es/index.php/estadisticas-con-variables-binarias/medidas-deconcordancia/kappa-de-cohen.html
https://www.uam.es/personal_pdi/psicologia/cadalso/Docencia/ADII/Materiales/esquema_t
ema_6.pdf
24