Clase 3
Clase 3
Clase 3
Unidad 2
QUIMIOMETRÍA
ESTADÍSTICA INFERENCIAL
Etapas de una investigación estadística
Gandhi
Recordando….
Términos importantes
Conjunto completo
tamaño muestral
Es el subconjunto de estudio:
Tipo de muestreo Muestra - Se define el mínimo
tamaño muestral y
- El diseño muestral
(procedimiento de
selección)
σ desviación típica
S
u
J
AREA = 1
e
(Es el 100%)
t
o
s
propiedad
La distribución normal se denota como N(μ, σ)
Es simétrica y tiene una asíntota horizontal
Para que sirve la distribución gaussiana?
2
𝑥
1 −
μ= 0 y σ =1, la ecuación es 𝑓 𝑥 = 𝑒 2
√2𝜋
y su representación será:
N(μ, σ)
𝑥2
1 − 2
μ= 0 y σ =1, la ecuación es 𝑓 𝑥 = 𝑒
√2𝜋
Si la pregunta es qué porcentaje de la población está por debajo
de 1:
𝑿−𝝁 𝟐𝟒𝟑−𝟐𝟓𝟎
Se estandariza la curva: =𝒛 z inferior = : = -1,4
σ √25
𝟐𝟔𝟐−𝟐𝟓𝟎
z superior = : = 2,4
√25
Intervalos de confianza
Prueba de hipótesis
Intervalos de confianza (IC)
Con ayuda de la estadística se puede establecer un intervalo
que rodea a la media, , determinada experimentalmente
dentro del cual se espera que se encuentre la media
poblacional µ, con un cierto grado de probabilidad
𝑧∗𝜎
IC para µ = ±
𝑁
3.4 Distribución de las mediciones y los resultados
Un resultado numérico
carece de relevancia
para los usuarios de los
datos, a menos que
estos sepan algo sobre
su calidad. Por lo tanto,
siempre es esencial
El intervalo de confianza para la media de la población es: indicar la mejor
estimación de la
confiabilidad de sus
Siendo σx, la desviación datos. Una de las
𝑧∗𝜎 estándar del valor medio mejores formas de
µ= ± (error estándar de la media): indicar la confiabilidad
𝑛 𝜎
σx = es proporcionar el
𝑛
intervalo de confianza a
un nivel de 90 o 95%.
0,95 1,96
0,99 2,57
Características
¿Cuándo se
utiliza?
Recordar que…
El número práctico de réplicas útiles se alcanza cuando la
desviación estándar de los errores es comparable con la
magnitud de los errores determinados o sistemáticos, dado que
los errores sistemáticos no se pueden evitar por repetición.
Observe que…
Inferencia
estadística
Permite saber
Estimación de Prueba de si dos o más
parámetros hipótesis grupos son
iguales o
distintos
Estimación
puntual
Estimación por
intervalos de
confianza Nivel de significación (α). Nivel de
confianza para retener la Ho. Es
Nivel de confianza: Valor de la
decir, la probabilidad de que el
confianza que permite aceptar
rechazo de Ho sea incorrecto.
que los datos obtenidos en la
muestra describen 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎
correctamente a la población. (α) = 1 - .
Expresado en porcentaje. 100
t- Student (sus escenarios)
Prueba t de
student
La diferencia
entre las dos Distribución
variables normal de las
Supuestos: relacionadas muestras y
tienen una Supuestos: muestras son
distribución completamente
normal independientes
3.5 Análisis estadístico de los datos
Comprobación de la significación
El proceso por el cual se determina la probabilidad de que exista una diferencia
significativa entre dos muestras se llama comprobación de la significación o
comprobación de la hipótesis.
1. Definir Ho y Ha
2. Especificar el grado significación
3. Calcular los valores crítico y de prueba (definir zonas
de aceptación y rechazo)
4. Decisión y conclusión
Temas en datos y resultados
BUSCAR :
Aceptar Ho cuando
realmente es verdadera
Decisiones correctas
Rechazar Ho cuando
realmente es falsa
Las conclusiones a las que se llega
provienen de una muestra, existe
la probabilidad de equivocarnos.
Rechazar Ho cuando
realmente es verdadera
Decisiones Incorrectas
Aceptar Ho cuando
realmente es falsa
Temas en datos y resultados
Paso 4. Conclusión
Valores de F, para significancia de 95%
Tabla F
https://www.lock5stat.com/StatKey/
3.7 Métodos estadísticos para distribuciones normales
3.7.3 Comparación de dos medias
Se utiliza la prueba t, la cual evalúa las diferencias entre las medias.
La prueba t, indica si hay diferencia significativa entre dos métodos
con base en sus desviaciones estándar. Revisamos tres casos.
La prueba t, es un test
estadístico utilizado
para comparar dos
valores medios con el
fin de saber si su
diferencia es demasiado
grande para poder ser
explicada por un error
aleatorio.
3.7 Métodos estadísticos para distribuciones normales
│𝜇 − 𝑋𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜│ ∗ 𝑛
= 𝑡 𝑒𝑥𝑝
𝑠
Siendo s, desviación estándar
n, número de mediciones
μ, valor verdadero
Es un estadístico utilizado para comparar dos valores
medios con el fin de saber si su diferencia es
demasiado grande para poder ser explicada por un
error aleatorio.
Recordar que t es:
3.7 Métodos estadísticos par distribuciones normales
3.7.3 Comparación de dos medias de dos muestras con datos no
emparejados. Caso 2
Sus intervalos de confianza son:
donde nA y nB, son los datos para cada ensayo. Y sA y sB, son
desviaciones para ensayos A y B, respectivamente.
La Ho, es que sus valores promedios son iguales y la alternativa que no
lo son.
Homosedasticidad
3.7 Métodos estadísticos para distribuciones normales
Ec. W
Los grupos de datos apareados se usan siempre que la variación a investigar sea
menor que las demás fuentes potenciales de variación, y se calcula la diferencia, di,
entre los valores emparejados en cada muestra y luego se calcula la desviación
estándar de las diferencias y se compara con un valor crítico t(α,ν). La Ho es que las
diferencias es cero y la alternativa que es diferente de cero.
3.7 Métodos estadísticos para distribuciones normales
Rechazo de datos
Valores atípicos
Un valor atípico es una observación extrañamente grande o
pequeña. Pueden conducir a interpretaciones equivocadas o
engañosas, generalmente estos datos causan efectos
desproporcionados en los resultados estadísticos (media).
Q- test
Prueba
Grubbs
Criterio de
Peirce
Desviación
estándar
Criterio de
Chauvenet
Rechazo de datos
Selectividad: La selectividad es el grado en que el método puede medir al analito de interés en las matrices de
las muestras que se analizan sin interferencia de la matriz (incluyendo otros analitos).
Linealidad: verifica que la respuesta sea linealmente proporcional a la concentración del analito en el intervalo
de concentración de las soluciones de muestra.
Intervalo: es el intervalo de concentración dentro del cual se obtienen exactitudes y precisiones aceptables.
Consistencia: Se refiere a la precisión de un laboratorio durante muchos días, lo cual puede incluir múltiples
analistas, múltiples instrumentos, diferentes fuentes de reactivos, diferentes columnas cromatográficas, etc.