Estadistica Curso Ing. Alimentos Analisis Sensorial
Estadistica Curso Ing. Alimentos Analisis Sensorial
Estadistica Curso Ing. Alimentos Analisis Sensorial
• HIPOTESIS NULA
• HIPOTESIS ALTERNATIVA
• PRUEBA ESTADISTICA
• REGION DE RECHAZO
4
La Hipótesis Nula, denotada como H0 siempre
especifica un solo valor del parámetro de la
población si la hipótesis es simple o un conjunto de
valores si es compuesta (es lo que queremos
desacreditar)
5
Test de Hipótesis
ERROR TIPO Ii
NO RECHAZAMOS HO DECISIÓN CORRECTA P(ERROR TIPO I) = β
7
Test de Hipótesis
9
Test de Hipótesis
HIPOTESIS QUE SE PLANTEAN EN FORMA GENERAL:
HIPOTESIS UNILATERALES
H 0 : 0
A) RECHAZO H 0 SI Z obs Z critico
H1 : 0
H 0 : 0
B) RECHAZO H 0 SI Z obs Z critico
H1 : 0
HIPOTESIS BILATERAL
H 0 : 0
C ) RECHAZO H 0 SI Z obs Z critico
H1 : 0
Z obs Estadístic o de prueba en la cual nos basamos para tomar una decisión
ˆ 0
donde : Z obs y Z criticovalor de tabla
ˆ
10
Test de Hipótesis
CASO A:
11
Test de Hipótesis
GRAFICAMENTE:
CASO B:
12
Test de Hipótesis
CASO C:
13
Test de Hipótesis
14
Test de Hipótesis
PASOS A SEGUIR EN UN TEST DE HIPOTESIS
1 - DEFINIR LA HIPOTESIS
2 - ESTABLECER EL ESTADISTICO DE PRUEBA
3 – DEFINIR EL NIVEL DE SIGNIFICACIÓN DE
PRUEBA
4 - CALCULAR EL ESTADISTICO DE PRUEBA
5 – DECIDIR SI SE RECHAZA O NO HO
6 – CONCLUIR EN TERMINOS DEL CONTEXTO
DEL PROBLEMA.
15
DEFINICIÓN DEL P-VALOR
25
SnapSt at: Comp aración d e D os M uest ras
DIET A A
DIET A A DIET A B
Re cuent o 10 10 4
Promedio 25,8 21,9
De sviación Est ándar 1,54919 2,02485
Co eficiente de Variación 6,00463% 9,24587%
M ínimo 24 18 2
M áximo 28 25
Rango 4 7
Sesgo Est andarizado 0,532407 -0,559823
0
4
17 19 21 23 25 27 29
DIET A B
18 20 22 24 26 28
1 99,9 Variables
porcentaje
DIET A A
99 DIET A B
0,8
95
80
0,6
50
0,4
20
5
0,2
1
0 0,1
18 20 22 24 26 28 18 20 22 24 26 28
26
ACTIVIDAD 6: Supongamos que se desea
comparar el efecto de dos dietas. Es decir queremos
saber si el cambio de peso (kg. adelgazados) de
distintas personas obesas, que han seguido o bien
la dieta 1 o bien la dieta 2, depende de la dieta
seguida por cada uno.
DIETA 1: 19 28 17 15 16 2 27 18 15 10 10 2 12 13
19 9 29 35 38
DIETA 2: 23 23 5 14 22 20 4 12 18 33 19
27
SnapStat: Comp aración d e D os Muestras
1
Datos/Variable: PESO
DIET A=1 DIET A=2 3
Re cuento 19 11
Promedio 17,5789 17,5455
De sviación Estándar 9,98508 8,43046 2
Co eficiente de Variación 56,8013% 48,0493%
Mínimo 2 4
Máximo 38 33 1
Rango 36 29
Sesgo Estandarizado 0,876181 -0,152679 0
3
0 10 20 30 40
2
0 10 20 30 40
PESO
1 99,9 DIET A
1
99 2
0,8 95
80
0,6
50
0,4
20
5
0,2
1
0 0,1
0 10 20 30 40 0 10 20 30 40
28
PESO PESO
Análisis de la varianza de un factor
• Supongamos que tenemos K poblaciones y queremos
comparar un determinado parámetro en cada una de
ellas. Dicho parámetro se modelará, para cada una de las
poblaciones, como una variable aleatoria. Llamaremos a
las correspondientes medias poblacionales para cada
población.
• De cada población extraemos una muestra aleatoria de
tamaño , respectivamente. Denominaremos al valor de
la observación j-ésima en la población i-ésima. Así, y .
La hipótesis nula que deseamos contrastar es la de
igualdad de medias poblacionales, es decir,
H 0 : 1 2 3 4 5
H1 : i j de que alguna de las medias sea distinta
29
TABLA DE ANALISIS DE VARIANZA
Entre
Tratamientos K-1 CMG CMG
SCG
CMD
Error
(Dentro de N-K CMD
Tratamientos) SCD
Total N-1
SCT
30
Con:
Estadístico de prueba 31
Supuestos del ANOVA
• Observaciones Independientes.
• Distribución Normal.
• Varianzas Homogéneas.
32
Independencia de las Observaciones
33
Normalidad
34
Homogeneidad de varianzas
35
36
ANALISIS DE VARIANZA
Un Ejemplo: En una determinada fábrica de galletas se desea saber
si las harinas de sus cuatro proveedores producen la misma
viscosidad en la masa. Para ello, produce durante un día 16 masas,
4 de cada tipo de harina, y mide su viscosidad (m2/s). Los
resultados obtenidos son:
37
EN STATGRAPHICS SERA:
COMPARAR ANALISIS VARIANZA ANOVA
SIMPLE
EN VARIABE DEPENDIENTE PONEMOS VISCOCIDAD
EN FACTOR PONEMOS PROVEEDOR
LUEGO HCEMOS CLIC EN:
RESUMEN ESTADISTICO
TABLA ANOVA
TABLA MEDIAS
PRUEBA MULTIPLES RANGOS
VERIFICACION VARIANZA
GRAFICO MEDIAS
GRAFICO CAJA Y BIGITES
GRAFICA DE RESIDUOS
38
39
40
Tabla de Medias para viscosidad por proveedor con intervalos de confianza del
95,0%
Error Est.
proveedor Casos Media (s agrupada) Límite Inferior Límite Superior
A 4 91,75 1,69097 88,1893 95,3107
B 4 81,25 1,69097 77,6893 84,8107
C 4 94,5 1,69097 90,9393 98,0607
D 4 95,25 1,69097 91,6893 98,8107
Total 16 90,6875
41
TABLA DEL ANOVA
Tabla ANOVA para viscosidad por proveedor
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Entre grupos 502,188 3 167,396 14,64 0,0003
Intra grupos 137,25 12 11,4375
Total (Corr.) 639,438 15
Como el p-valor = 0,003 es menor al 5% concluimos que hay diferencia entre los proveedores al 5%,
lo que no sabemos es quien con quien
42
COMPARACIONES MULTIPLES O
TEST APOSTERIORI
• TEST DE TUKEY
• TEST DE SCHEFFÉ
• TEST DE DUNCAN SI SE COMPARA CON UN
CONTROL
• TEST DE DUNNETT
• TEST DE NEWMAN-KEULS
• TEST DE BONFERRONI
• TEST LSD
44
METODO DE TUCKEY
45
COMPROBACIÓN DE LA IDONEIDAD
DEL MODELO
Verificación de Varianza
Prueba Valor-P
Levene's 1,01578 0,419763
46
LOS RESIDUOS SON INDEPENDIENTES Y CON VARIANZA CONSTANTE
47
• PARA VERIFRICAR EL SUPUESTO DE
NORMALIDAD HACEMOS:
GRAFICOS GRÁFICOS EXPLORATORIOS
GRAFICO DE PROBABILIDAD NORMAL
EN DATOS PONGO VISCOCIDAD
Resumen Estadístico para viscocidad
Recuento 16
Promedio 90,6875
Mediana 92,0
Desviación Estándar 6,5291
Coeficiente de Variación 7,19956%
Mínimo 79,0
Máximo 99,0
Rango 20,0
Sesgo Estandarizado -0,994632
Curtosis Estandarizada -0,629979
48
Gráfico de Probabilidad Normal
con 95% límites
99,9
n:16
99 Media:90,6875
Sigma:6,5291
95
W:0,913784
P:0,1339
80
porcentaje
50
20
5
1
0,1
79 83 87 91 95 99
viscocidad
49
Otro ejemplo:
Tres grupos de seis cerdos de guinea fueron
inyectados, respectivamente con 0,5 mg, 1,0 mg y
1,5 mg de un nuevo tranquilizante y las siguientes
cifras son los tiempos en minutos que tardaron en
dormirse
0,5 mg: 21, 23, 19, 24, 25, 23
1,0 mg: 19, 21, 20, 18, 22, 20
1,5 mg: 15, 10, 13, 14, 11, 15
¿Hay diferencia entre las dosis aplicadas al 5% de
significación? Verifique los supuestos de
normalidad del modelo planteado.
50
GRAFICOS
GRAFICO DE MEDIAS
26
23
TIEMPO
20
17
14
11
0,5 1,0 1,5
TRATAMIENTO
51
Gráfico de Cajas y Bigotes
25
22
TIEMPO
19
16
13
10
0,5 1,0 1,5
TRATAMIENTO
52
TABLA DEL ANOVA
Tabla ANOVA para TIEMPO según TRATAMIENTO
Análisis de la Varianza
------------------------------------------------------------------------------
Fuente Sumas de cuad. Gl Cuadrado Medio Cociente-F P-Valor
------------------------------------------------------------------------------
Entre grupos 291,0 2 145,5 39,32 0,0000
Intra grupos 55,5 15 3,7
------------------------------------------------------------------------------
Total (Corr.) 346,5 17
53
CONTRASTES MULTIPLES
Contraste Múltiple de Rango para TIEMPO según TRATAMIENTO
--------------------------------------------------------------------------------
Método: 95,0 porcentaje HSD de Tukey
TRATAMIENTO Frec. Media Grupos homogéneos
--------------------------------------------------------------------------------
1,5 6 13,0 X
1,0 6 20,0 X
0,5 6 22,5 X
--------------------------------------------------------------------------------
Contraste Diferencias +/- Límites
--------------------------------------------------------------------------------
0,5 - 1,0 2,5 2,89688
0,5 - 1,5 *9,5 2,89688
1,0 - 1,5 *7,0 2,89688
--------------------------------------------------------------------------------
* indica una diferencia significativa.
54
VERIFICACION DE LOS SUPUESTOS
DE NORMALIDAD DE LOS RESIDUOS
2,5
residuo
0,5
-1,5
-3,5
0,5 1,0 1,5
TRATAMIENTO
NORMALIDAD
99,9
n:18
99 Media:18,5
Sigma:4,51468
95
W:0,943473
P:0,3319
80
porcentaje
50
20
5
1
0,1
10 13 16 19 22 25
TIEMPO
56
• TEST DE FRIEDMANN PARA K MUESTRAS DEPENDIENTES
Hipótesis:
• H0: No existen diferencias entre los grupos.
57
• Para resolver el contraste de hipótesis anterior,
Friedman propuso un estadístico que se distribuye
como una Chi-cuadrado con K - 1 grados de
libertad, siendo K el número de variables
relacionadas; se calcula mediante la siguiente
expresión
58
Estadístico de Prueba
En la expresión anterior:
63
PRUEBA CHI CUADRADO
• JAMON
Es la pierna trasera del cerdo, recortada en forma
especial con o sin hueso, fraccionada, curada en
seco o con salmuera, cocida o cruda,
condimentada o no, ahumada o no forjada o no en
molde rígido o flexible en forma tradicional.
64
Especificaciones organolépticas:
65
MUESTRAS
•A: CAPISTRANO
•B: ZWAN
•C: KIR
66
OBJETIVO:
• Identificar si hay diferencias entre las muestras de
jamón Kir, Capistrano y Zwan (Prueba A no A).
68
CUESTIONARIO
69
MUESTRAS
70
520 Y R
936
580
71
• EN STATGRAPHICS SERIA:
DESCRIBIR DATOS CATEGORICOS TABULACION
CRUZADA
EN FILA PONGO CATEGORIA Y EN COLUMNA PONGO
JAMON (TAMBIEN PUEDE SER AL REVES)
ELEGIMOS:
TABLA DE FRECUENCIAS
PRUEBA DE INDEPENDENCIA
DIAGRAMA DE BARRA
• HACEMOS CLIC EN EL TERCER ICONO DE LA
SEGUNDA FILA RECORRIDA DE IZQUIERDA A DERECHA
QUE ESTA DEBAJO DEL MENU PRINCIPAL Y ELEGIMOS
PRUEBA DE INDEPENDENCIA
72
Tabla de Frecuencias para CATEGORIA por JAMON
A B C Total por Fila
DIFERENTE 11 19 15 45
13,58% 23,46% 18,52% 55,56%
IGUAL 16 8 12 36
19,75% 9,88% 14,81% 44,44%
Total por Columna 27 27 27 81
33,33% 33,33% 33,33% 100,00%
Contenido de las celdas:
Frecuencia Observada
Porcentaje de la Tabla
Pruebas de Independencia
Prueba Estadístico Gl Valor-P
Chi-Cuadrada 4,800 2 0,0907
73