Coceptos
Coceptos
Coceptos
región sierra
Proyecto: investigación
Lugar: solosuchiapas,Chiapas
Fecha: 26/11/2021
4.1 Bondad de ajuste.
La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un conjunto
de observaciones. Las medidas de bondad en general resumen la discrepancia entre los
valores observados y los valores esperados en el modelo de estudio. Tales medidas se
pueden emplear en el contraste de hipótesis, e.g. el test de normalidad de los residuos,
comprobar si dos muestras se obtienen a partir de dos distribuciones idénticas (ver test de
Kolmogorov-Smirnov), o si las frecuencias siguen una distribución específica (ver ji
cuadrada).
or bondad del ajuste hay que entender el grado de acoplamiento que existe entre los datos
originales y los valores teóricos que se obtienen de la regresión. Obviamente cuanto mejor
sea el ajuste, más útil será la regresión a la pretensión de obtener los valores de la
variable regresando a partir de la información sobre la variable regresará .
Obtener indicadores de esta bondad de ajuste es fundamental a la hora de optar por una
regresión de un determinado tipo u otro.
Puesto que la media de los residuos se anula, el primer indicador de la bondad del ajuste
(no puede ser el error medio) será el error cuadrático medio, o varianza del residuo,
o varianza residual:
(Es importante caer en la cuenta de que la suma de las frecuencias observadas debe de
ser igual a la suma de las frecuencias teóricas).
Para este cálculo, tenemos que basarnos en la fórmula: (total filas x total columnas) / total
Como dijimos antes, la suma de las frecuencias observables debía de ser igual a la suma
de las frecuencias esperadas. En este caso podemos decir, que dicho pronóstico se
cumple:
Paso 3: Calcular los grados de libertad. En este caso, como son dos los criterios de
clasificación, el grado de libertad se calcularía así:
Paso 4: Calcular el valor de chi cuadrado (usando para ello la fórmula escrita al principio de
esta entrada)
Deportista 38 9 47
No deportista 31 22 53
69 31 100
Con a=0,05, ¿existe alguna razón para creer que el número de empleados que asisten al
consultorio médico, no se encuentra distribuido de forma equitativa durante los días de la
semana?
Solución
Una distribución uniforme lleva consigo que la probabilidad sería la misma para cada día
de la semana. Por tanto pi=0,2 para i = 1, 2, 3, 4, 5.
La hipótesis nula H0: pi=0,2 para i = 1, 2, 3, 4, 5. Dado que n=200, la frecuencia esperada
para cada día de la semana es 200*0,2=40. Luego, el valor del estadístico es:
El estadístico sigue una chi-cuadrada con k-1 grado de libertad, con k=5. Luego
Ejemplo
después de una elección reciente entre dos candidatos, una encuesta de salida registró el
sexo y el voto de 100 electores seleccionados de manera aleatoria y los datos se tabularon
de la siguiente manera:
Candidato A Candidato B Todos
Hombre 28 20 48
Mujer 39 13 52
Todos 67 33 100
Esta tabla de contingencia cuenta las respuestas según sexo y voto. El conteo en la
intersección de la fila i y la columna j se denota como nij, y representa el número de
observaciones que muestra esa combinación de niveles. Por ejemplo, n1,2 muestra el
número de encuestados masculinos que votaron por el Candidato B.
La tabla también incluye los totales marginales para cada nivel de las variables. Los totales
marginales para las filas muestran que 52 de los encuestados fueron mujeres. Los totales
marginales para las columnas muestran que 67 encuestados votaron por el Candidato A.
Además, el total general muestra que el tamaño de la muestra es 100.
Las tablas de contingencia también pueden revelar asociaciones entre las dos variables.
Utilice una prueba de chi-cuadrada o una prueba exacta de Fisher para determinar si los
conteos observados difieren significativamente de los conteos esperados bajo la hipótesis
nula de que no existe asociación.
4.2 Pruebas no paramétricas.
Las pruebas no paramétricas, también conocidas como pruebas de distribución libre, son
las que se basan en determinadas hipótesis, pero lo datos observados no tienen una
organización normal. Generalmente, las pruebas no paramétricas contienen resultados
estadísticos que provienen de su ordenación, lo que las vuelve más fáciles de comprender.
Las pruebas no paramétricas tienen algunas limitaciones, entre ellas se encuentra que no
son lo suficientemente fuertes cuando se cumple una hipótesis normal. Esto puede provocar
que no sea rechazada, aunque sea falsa. Otra de sus limitaciones es que necesitan que la
hipótesis se cambie cuando la prueba no corresponde a la pregunta del procedimiento si la
muestra no es proporcional.
Ejemplo
Máquina A 16 15 15 14 16
Máquina B 18 19 19 20 19 19
Máquina C 19 20 18 20 19
Las escalas de medición son procesos de comparación cuantitativa, en los que se asignan
símbolos o números, positivos y/o negativos, a las características de un elemento para
determinar cuántas veces ese patrón está contenido en el total del conjunto.
En investigación de mercados, facilitan el análisis estadístico de los datos y la posterior
comprensión de los resultados para resolver el problema planteado.
Un elemento u objeto puede ser cualquier cosa, porque todo es susceptible a ser
medido. Los elementos están formados por características o propiedades que se infieren a
partir de la medición de indicadores. Los indicadores o reactivos determinan el
comportamiento del objeto. El comportamiento se describe en variables o constructos.
Ejemplo
Se usa para una prueba de n para indicar la preferencia por las marcas,
Caso de pruebas pequeñas: Siempre n sera menor igual a 20, Valor p menos igual a alfa la
Hipotesis se rechaza.
Caso de muestras grandes: La Ho : p= 0,50 , n es mayor a 20.
Son las alternativas no parametricas al método de las muestras por pares , en la situación
de las muestras por pares, cada unidad experimental genera dos observaciones.
3. PRUEBA DE MANN-WHITNEY-WILCOXON
Es una prueba de un método no parametrico que se usa para determinar si hay diferencia
entre dos poblaciones. La hipótesis en las pruebas de este método son las siguientes:
Esta prueba se usa para probar si las poblaciones son identicas para k mayor igual a 3
poblaciones se expresa como:
Ho Todas las poblaciones son idénticas
Ha: No todas las poblaciones son idénticas
Esta prueba es acerca de la correlación por rangos poblacional "Ps", ya que se debe probar
la hipótesis siguiente:
Ho: Ps = 0
Ha: Ps diferencia 0
4.2.3 Prueba de Kolmogorov – Smirnov.
Ejemplo
Ejemplo
El estadístico de Ryan-Joiner mide qué tan bien se ajustan los datos a una distribución
normal, calculando la correlación entre los datos y las puntuaciones normales de los datos.
Según Hanke & Wichern (2014) la prueba de Ryan Joiner proporciona un coeficiente que
indica exactamente la correlación entre los datos y las puntuaciones normales de los datos.
Una vez que el coeficiente de correlación se acerca a 1, los datos se encuentran dentro de
la gráfica de probabilidad normal; caso contrario, esto es, cuando el valor critico adecuado
es menor, se rechaza la hipótesis nula de normalidad. Cabe recalcar que para rechazar la
hipótesis nula de normalidad se calcula, primero, la medida de la correlación entre los
residuos y sus respectivas puntuaciones normales y, luego, se utiliza dicha correlación
como estadística de prueba. La prueba de Ryan-Joiner -similar a la prueba de Shapiro-Wilk-
se basa en la regresión y correlación. Esta prueba resulta mucha más adecuada para
muestras superiores a 30 observaciones. El coeficiente de correlación se calcula de
acuerdo con la ecuación 4.
Ejemplo
(4)
Donde:
observaciones ordenadas
varianza de la muestra
Tenemos:
H0:X∼N(μ,σ2)H0:X∼N(μ,σ2)
H1:X≁N(μ,σ2)H1:X≁N(μ,σ2).
Ahora el test Shapiro-Wilks intenta rechazar la hipótesis nula a nuestro nivel de
significancia. Para realizar el test usamos la función shapiro.test en R:
Ejemplo
Cola 1 : H H H H H H M M M M M M
Cola 2 : H M H M H M H M H M H M
La pregunta que se hace es, ¿llegaron cada una de las personas de forma independiente
a la cola, o vinieron en grupos? La respuesta para un observador avispado parece obvia,
en el primer caso da la impresión de que se trata de dos grupos, uno de cada sexo, mientras
que en el segundo todo parece indicar que aparecen varias parejas.