Taller de Varianza PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

µ

por: 2), también se puede analizar conLa


capítulo comparación
el ANOVA y se obtienedeelvarianzas
mismo valortiene
del interés en sí misma, con indep
valor-p que con la prueba T. Es fácil comprobar que el estadístico t0 de la prueba T
las
: µ1medias, =puesto µ=que éstas sonµdeterminantes en cualquier proceso o
µ
cribir como
elevado al cuadrado es H igual H H=0µ:F20µ=(3.7)
al 0estadístico 1µ µde
30=2 …la 3µ
= prueba
=k … =Fµ= µANOVA.
del k =: Por 1
último, es importante resaltar que En
H el µ1 = µsupone
:general
0 ANOVA 2 se= µconsidera
=…
3que la = µ k que
variable µ respuesta
= de a menorsevarianza,(4.2)
implica potencialmente
(4.2)
H H : µiH≠Aµ:j µpara i ≠ µ algún ≠ j i≠ j :
j parai algún (4.2)interesa ver si
distribuye normal, con varianzaAconstante
dad.
H : Por
µ ≠ ejemplo,
µ
(los A
tratamientos
para en
algún eli ≠caso
tienen j DEdeAMÉRICA
varianza las centrifugadoras
similar) i
algu
H : m – m = 0FUNDACIÓNA i UNIVERSIDAD
j
y que las mediciones son independientes entre sí. Estos supuestos deben verificarse
0 x y
tiene mayor error (variabilidad) (2.13) en sus mediciones. El planteamiento de
para estar más seguros de las conclusiones obtenidas.
xpresar
que también
que también
se puede secomo
seexpresar puedecomo
puede expresar
TALLER DE COMPARACIÓN
reescribir como: DE MEDIAS, VARIANZAS Y ANÁLISIS DE VARIANZA com
HA : mse
que también x – puede
my π 0expresar como
Asignatura: Diseño de experimentos.
Análisis del ejemplo 3.2 (comparación de cuatro tipos de cuero). La interro-
τ
τ
Docente: David Leonardo H 0H τ 1de
= 0τla2:comparación
:Sotelo.
H τ=1τ=3 τ=2… 3τ
= τ=entre
=k …
=los τ k = 0tipos de :
0= cuatro
gante que en
se planteó en el como
problema τ = τ = τ = …
0
= τ = σ 2 1
toman dos muestras
Valor aleatorias,
el segundo Hen
corte:0 :
10el %
1
ejemplo 2
de
3
las máqui-
τeli H
k 0 H : x
= 1 (4.3) (4.3)
, de tamaño cuero fue: ¿existen diferenciasHentre
nx la del proceso X, y de H
A
H
:tamaño
:
desgaste
τ ≠ n0τyi para
≠ A0 :para ≠ algún
la 0 para
promedio
del i algún
de
proceso
algún A
i Y;i
los diferentes tipos de0
σ: 2
y
(4.3) i
cuero? La respuesta a estaHipótesis pregunta Aespara
Nombre:_____________________________________ el resultado
i dos medias: de contrastar las hipótesis:
comparación de dos
Código:_______________ tratamientos
mendable que nx = ny = n, pero también puede trabajarse con nx π
estas En cualquiera
SiEn cualquiera
de estas dehipótesis
estas hipótesis
la afirmación la normal a yprobar
afirmación hipóa probar
es que esσ 2
la queres
omarse iguales. cada proceso
Nombre:_____________________________________
En cualquiera de Hestas
sigue una distribución
0 : mA =hipótesis
mB = mC = mlaD =afirmación m probar esH que
a Código:_______________ A : la
x
≠puesta
1la respuesta
2 respuesta
s entre
ada elellos,
media el estadístico
cualpoblacional
media
sigue poblacional de prueba
lograda
una distribución lograda
conTcon adecuado
cada con
decada Studentcada para
tratamiento probar
tratamiento
con nxes+es nla
la –hi-
misma
es la misma
2 grados parade loslibertad,
(3.8)para σ
k tratamientos
los
y dondek cad
tratamientos
media poblacional lograda con tratamiento yla misma para los k tratamientos
ad de mediasySque,2
pyesque,
está
un que,dado
Ecuaciones:
por
yrespuesta
lo porpor,
tanto,
estimador lodecada
tanto,la respuesta
A cada
: mi π respuesta
varianza j media
mmuestral i ies
mmedia π igual i es a igual
j msuponiendola media a la global
media poblacional,
global poblacional,
mediacomún, que dichas varianzas
H para algún
por lo tanto, cada respuesta m i es igual a la media global poblacional,
va, . De manera
mdesconocidas m. De manera alternativa,
sean iguales,alternativa, esyes para
posible
se enfatizar
es
calcula comoque
posible
afirmar quelatodos
afirmar prueba
quelos seefectos
todos basa
posi losen delatratamiento
efectos distribución
de tratamiento del estadístico,
De manera
m. Comparación alternativa,
de mediases posible afirmar que todos los efectos de tratamiento
Comparación de varianzas
spuesta sobre lasobre
Envariablela variable
la tabla 3.5desede respuesta
muestra de respuesta sonson
el análisis nulos,
deson 2porque
nulos,
varianza paraporque
cuando cuando
el elefecto
este2 ejemplo. Como i t= =
el telefecto mSim–t2 i–m=m=mso 0,– m = 0,
sobre la variable X − Y respuesta ( n − nulos,
1 ) S + porque
( n − 1 ) cuando
S efecto
y se rechaza H0 y se i xi
=i 0,
a =lamedia
valor-p = 0.0000 es menor que la significancia x prefijada
x y = 0.05,
a esaF0igual
e entonces entonces
entonces necesariamente
t0 la necesariamente
=necesariamente la respuesta 2
=la respuesta
laS prespuesta me respue
diadia
me del
medel dia
tratamiento
del tratamiento
(2.14)
tratamiento eses igualigual la a la glo-
media
2
media
glo- glo-
bal bal (m i = 1 1 n + n − 2 S
(balm=).(mmi).=Spm). + x y y
m i nx n y muestrales de los datos de cada proceso.
con S2x y S2y las varianzas el cual, bajo el supuesto de que H0 es verdad, sigue una distribución F
n Análisis z Análisis
Se
Análisis
Análisis
Tabla 3.4 de
rechaza
Tabla devarianza
dede H de
0 sia
varianza
varianza
ANOVA |varianza
tpara >elgrados
0|(ANOVA) a/2, donde
tDCA. para taun
de libertad /2 es soloel enpunto
factor /2 de la completamente
a(diseño
el numerador cola
y nyderecha
– 1 grados de allade libertad en el deno
azar):
distribución T de Student concalcularnx + ny –GL el2se gradosdel
valor de estadístico
libertad. Cuando de la Valor-p
prueba hipótesis
sedos al- que F0 = 1.11. Com
obtiene
4.2 La hipótesis
La La
FV hipótesis
hipótesis dada dadapor dada
por (4.2SCpor o
(4.2 o 4.3)(4.2
o 4.3) se
o se 4.3)
prueba
prueba prueba
concon 4.3)
unCM con
análisis
un un análisis
análisis dede Fvarianza
0 de varianza
varianza concon con
dos cri- dos cri-
cri- s
ternativa es de la forma kHAY 2: bución mYx 2 > my, Fseno rechaza
es dos H
simétrica,
0 : m x = m si
eldevalor-p
y t 0 > t
está , y si
dado es de
por la else
GRADOS DE LIBERTAD ( áreadebajogl la) curva
porque terios teriosde
terios
clasificación, = ∑porque
deSCclasificación, porque− porque
••se controlan –se 1 controlan
se< kcontrolan dos fuentes
SC dos
TRAT fuentes
= fuentes
CM
de variación:
TRATde variación:
variación:
a
P ( Fel>elFfactor el de
0 )factor de
factor
HAde: mclasificación,
Tratamientos i•
CMTRAT
forma < m , se rechaza ni de si
N 1.11, t –t
más . En el laforma
área equivalente, se rechaza H si el
sebajo
k − 1 la curva CM E a la izquierda 0 de 1/1.11 = gl.0.9.
TRAT i =1
0 -delSCT: # datos – 1 = 2 Median
de tratatratamientos
trata
mientos yx elyfactor
mientos el
y
yfactor
elde factor
bloque.
bloque.
de de
bloque. bloque.
EnEn la atabla
la En tabla 4.2 tabla
4.2 muestra
se4.2 se
muestra muestra
el aspecto
el el
aspecto aspecto
del ANOVA del
ANOVA ANOVA
valor-p < a para la pareja de hipótesis te estadístico de interés. 12/10/07 10:05:51
se obtiene valor-p = 0.85. Por lo tanto,
parapara diseño
Error para
diseño DBCA.
diseño SCDBCA.
DBCA. = SC − SC N – k Statgraphics
CM E =
SCE - SCF: # tratamientos – 1 = gl. uti
E T TRAT
N−k 2 2
arios LosLos cálculos
Los
cálculoscálculos
necesarios
necesarios necesarios0.05,
pueden pueden lapueden
decisión
ser manuales,
ser ser es
manuales, no
manuales,
pero rechazar
pued
pero pero H
siempre
siempre siempre
es :más
0 es smás x -=es s y, yglpráctico
práctico
más
SCR:
práctico seha-
ha- concluye
– gl . ha- que, estad
stadístico, Ejemplo
cerlos con
cerlos 2.5
un software
con un software estadístico,
2 SCT SCF
Yij2estadístico,
− •• porque N – 1 porque
además además
proporciona proporciona
muchas muchas
otrasotrasopciones
otras opciones
Y
cerlos
Total con un SCsoftware estadístico,
T = ∑ i = 1 ∑ j = 1 Diseño
k n i
porque además proporciona muchas
al azarde la pintura látex 105
opciones
Comparación de dos centrifugadoras. N de bloques completos La calidad depende,
les gráficas gráficas
gráficas y tabulares y tabulares
y tabulares útiles útiles (noútiles(no
(no sólo (no
sólo el sólo
ANOVA).
el el ANOVA).
ANOVA). Utilizando
UtilizandoUtilizando
la lanotación la notación
notación dedepuntos
sól de puntos
puntos
entreAnálisis
otras cosas, del
defórmulas
varianza
tamaño de la partícula.
2 En general, Para los medir
puntos esta característica
porcentuales de cola se utilizan
izquierda y cola derecha de la distri
a al inicio del capítulo 3, las más (ANOVA)
prácticas parapara calcular unlastratamiento
sumas de y un bloque (diseño de bloques
dos centrifugadoras, y se sospecha
drados son: completos aleatorizados):
que éstasF1reportan
plen la igualdad:
Diseño de bloques completos – a, n1 – 1, n2 mediciones
al azar – 1
= 1/Fa, n2 – 1,distintas
n1 – 1. Es decir,
105
para uno la es el inverso del otro, in
un Tabla Tabla 4.2
Tabla ANOVA
4.2 4.2
ANOVA
misma pintura. Se decide hacerdiseño
ANOVA
para para un para
diseño
un un
diseño
grados endiseño
un de bloques
en en
bloques
libertadque
estudio bloques
completos
completos
del permita completos
numerador al azar.
al azar.al azar.
y del denominador.
comparar las medias Si éstos
y lasson iguales simplemente e e
varianzas reportadas bpor k los dos equipos; para losumas
cual, de de un mismo lote de pintura
utierrez-03.indd 69 12/10/07 10:08:21
ta al inicio
e delFuente
Fuente capítulo
deFuente3, lasde
de fórmulas
Suma Suma de más
de
Suma prácticas
Yde2
Grado para
Grado de calcular
de
Grado de lasCuadrado
Cuadrado Cuadrado F F F G Valor-p
Valor-p Valor-p r a
SCT = ∑ ∑ Yij − 2 ••
0 0 0
o
drados son: se tomaron
variabilidad
variabilidad
s 13
variabilidadlecturas
cuadrados
cuadrados j = 1 con
cuadrados
i = 1 cada N centrifugadora.
libertad
libertad libertad medio Los resultados
mediomedio son los siguientes: libe
k
Yi•2 Y••2 GRADOS DE
SCTRAT = b ∑k − Y2 (4.4) CM
CM CM LIBERTAD (gl )
∑ ∑SC
i =1 b −N F = TRAT
0 =0 =
TRAT
Tratamientos
Centrifugadora
Tratamientos
TratamientosxSC
SC 4 714
SC
=TRAT TRAT
TGutierrez-02.inddYij2TRAT43 k – k1– 14 k696
4•• 601 – 1 CM4CM 896
TRAT
4 F905
CMTRAT
TRAT F40 870
CM
TRAT
P(F >>
4 987
P(F F0F ) 0) > F0)
P(F k
N CM CM
j =b1 i = 1 2
Y• j Y••3 962
2 E E E - SCT: 16 – 1 = 15 gl.
SC B =5∑ 144 k
Y 2−
Y 2 4 066 4 561 4 626 4 924
SCTRAT –j==1∑ k i• − N•• - SCF: 4 – 1 = 3 gl.
X = 4 684.00; =(4.4) 124
SA2CM CMCM
= BF B = CM BP(F
732.00
F
=
Bloques
Bloques Bloques SCBSCi =B1 SCBN b –b1– 1 b – 1 CM
A b B CM F
B 0
0
CMCM 0E
P(F
> >
F F) 0) > F0)
0P(F b
4 295 42 271 4 326 4
B
530 4 618 4 779
CM E
4 752 - SCB: 4 – 1 = 3 gl.
Centrifugadora y b 2
Y• j Y••
E

SC B = ∑ −
del error se Error - SCR: 15 – 3 – 3 = 9 gl.
Errorobtiene por sustracción
Error SC4jSCcomo:
= 1 E k SC (k
744
E E
N3 – (k1)(b
764– 1)(b
(k –3–1)(b
– 1) 1) – 1)CM
797 4 CM
401E CM
E
4 339
(k E
4 700 – 1

Total X –B = 4 408.92;
N – 1N – 1 SB2 = 112 020.00
Total Total SC E = SCTTSC
SC SC SCT– SCN
T TRAT B – 1 N
a del error se obtiene por sustracción como:
Para comparar las medias se plantea la hipótesis de igualdad de medias con la
mplo 4.1 SCE = SCT – SCTRAT – SCB
alternativa bilateral, puesto que no hay ninguna conjetura del experimentador acerca
el ejemplo 3.1, donde se planteó la comparación de cuatro métodos de ensamble,
de cuál centrifugadora puede reportar valores mayores. Luego, el planteamiento es:
ra se va a controlar activamente en el experimento a los operadores que realizarán
12/10/07 10:09:32
emplo
nsamble,4.1
lo que da lugar al siguiente diseño en bloques completos al azar. 12/10/07 10:09:32
12/10/07 10:09:32
CAPÍTULO 4 Diseños de bloques
Análisis de varianza (ANOVA) para un tratamiento y un bloque (diseño de bloques
completos
Tabla aleatorizados):
4.5 ANOVA para el diseño de cuadro latino.

Fuente de Suma de Grados de Cuadrado F0 Valor-p


variabilidad cuadrados libertad medio
CM TRAT
Tratamientos SCTRAT k–1 CMTRAT F0 =
CM E
P(F > F0) GRADOS DE LIBERTAD ( gl )
SCtotales: # datos – 1 = gl.

– 1 = gl.
CM B
Renglones SCB1 k–1 CMB1 F0 = P(F SCtrat: # tratamientos
> F0)
CM E
SCbloque1: # de bloques – 1 = gl.
CM B2
SCbloque2: # de bloques – 1 = gl.
Columnas SCB2 k–1 CMB2 F0 = P(F > F0)
CM E SCerror: gl – gl - gl - gl
SCtot SCtrat SCbloq1 SCbloq2
Error SCE (k – 2)(k – 1) CME
Total SCT k2 – 1

I. Una planta de tratamiento de agua potable tiene como media 35,6 ppm en el parámetro
de dureza total con Yijl una
= µ +varianza
τ i + γ j + δde 1,5; establecido tras 6 meses de validación del
l + ε ijl
proceso de potabilización. El nuevo jefe del área considera que ese valor no es
verdadero y decide evaluar la variabilidad tomando nuevas muestras, 3 replicas diarias
donde Yijl es la observación del tratamiento i, en el nivel j del factor renglón y en el
por 7 días consecutivos; para un total de 21 datos. La media de las muestras es 36,1
nivel l del factor columna; eijl es el error atribuible a dicha observación. De acuerdo
ppm y su desviación estándar 9,7 ppm. Nivel de significancia: 95 %.
con este modelo, la variabilidad total presente en los datos se puede descomponer
como
1. Elabore hipótesis nula y alternativa (H0 y HA) para la media.
2. Calcule el estadístico de prueba para la comparación de la media.
3. Compare el estadístico SCT = SC deTRAT + SC Bcon
prueba 1 + SC + SCEde la tabla, e indique si aprueba H0. Utilice
elB 2valor
la tabla de distribución de T de Student.
y los Elabore
4. grados dehipótesis nula y alternativa
libertad correspondientes son (H0 y HA) para la varianza.
5. Calcule el estadístico de prueba para la comparación de la varianza.
6. Compare el kestadístico
2
− 1 = ( k − 1de) + (prueba
k − 1) + (con
k − 1el
) +valor dek −la1)tabla, e indique si aprueba H0. Utilice
( k − 2)(
la tabla de distribución Ji-cuadrado.
El ANOVA para el diseño en cuadro latino se muestra en la tabla 4.5. En él se
prueba la hipótesis sobre los efectos de tratamiento del factor renglón y del factor
II. El jefe del laboratorio de la planta de potabilización no confía en los resultados del
columna. Otra vez, la hipótesis fundamental es la de los tratamientos; las otras dos
proceso de muestreo, insiste en que el proceso entrega valores diferentes día a día;
proporcionan un adicional al objetivo inicial y permiten comprobar la relevancia de
por lo que decide evaluar los resultados tras dos semanas de análisis. Diariamente se
controlar toman
los factores de bloque.del proceso durante 5 días para la primer semana, de igual forma
3 muestras
para la segunda semana. Datos en partes por millón.
Ejemplo 4.2
Comparación de cuatro marcas de llantas. Una compañía de mensajería está
interesada en determinar cuál marca de llantas tiene mayor duración en términos del
desgaste. Para ello se planea un experimento en cuadro latino, en el que se comparan
las cuatro marcas de llantas sometiéndolas a una prueba de 32 000 kilómetros de
recorrido, utilizando cuatro diferentes tipos de auto y las cuatro posiciones posibles
de las llantas en el auto. Así, el factor de interés es el tipo de llanta o marca, y se
controlan dos factores de bloques: el tipo de carro y la posición de la llanta en el
carro. Estos factores de bloques se controlan ya que, por experiencia, se sabe que
el tipo de carro y la posición de la llanta tienen efecto en el desgaste de la misma.
La elección del cuadro latino a utilizar se hace antes de obtener los datos. Para
ello, a partir de un cuadro latino inicial se aleatorizan las columnas y los renglones;
DÍA
# MUESTRA 1 2 3 4 5
1 30,1 45,9 29,5 46,8 25,8
SEMANA 1 2 41,1 43,9 33,3 49,6 37,9
3 33,2 30,7 34,7 32,7 44,9
Media = 37,3 Varianza = 55,8

1 47,3 33,7 46,0 46,4 27,7
2 32,9 26,9 34,8 32,0 29,8
SEMANA 2
3 24,6 27,0 34,1 39,8 50,2
Media = 35,5 Varianza = 70,4
Usando un nivel de significancia del 95 %:

1. Elabore hipótesis nula y alternativa (H0 y HA) para las medias.


2. Calcule el estadístico de prueba para la comparación de las medias.
3. Compare el estadístico de prueba con el valor de la tabla, e indique si aprueba H0. Utilice
la tabla de distribución de T de Student.
4. Elabore hipótesis nula y alternativa (H0 y HA) para las varianzas.
5. Calcule el estadístico de prueba para la comparación de las varianza.
6. Compare el estadístico de prueba con el valor de la tabla, e indique si aprueba H0. Utilice
la tabla de distribución F.

III. Finalmente, el jefe del laboratorio de potabilización decide realizar un análisis de


varianza (ANOVA) usando nuevos datos colectados durante una semana, 4
valoraciones diarias durante 5 días. Datos en partes por millón.

DÍA
# MUESTRA 1 2 3 4 5
1 33,1 45,0 31,6 29,2 38,1
2 38,8 40,9 24,9 28,0 47,8
3 45,3 32,6 42,2 29,9 39,2
4 31,9 26,2 42,7 30,2 25,7
Usando un nivel de significancia del 95 %:

1. Elabore hipótesis nula y alternativa (H0 y HA) para el ANOVA.


2. Calcule los datos necesarios para obtener el valor F0.
3. Compare el estadístico de prueba con el valor de la tabla, e indique si aprueba H0.
Utilice la tabla de distribución F.
4. Llene la siguiente tabla de resumen de resultados:

Fuente de Suma de Grados de Cuadrados


F0
variabilidad cuadrados libertad medios



como variable de respuesta a la diferencia de temperatura que registran los méto-
dos para cada día en cada silo. Considerando esto, establezca el modelo estadístico,
haga el ANOVA correspondiente y obtenga conclusiones.

16. Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiem-
IV. Estudiopodelde efecto
reaccióndede cinco catalizadores
un proceso químico. Cada(A, loteB,deC, D, E)sólo
material sobre el tiempo
permite de reacción de
cinco corridas
un proceso
y cadaquímico. Cada
corrida requie lote de material
re aproximadamente solo permite
1.5 horas, por lo quecinco
sólo secorridas y cada corrida
pueden realizar
requiere aproximadamente
cinco 1,5 horas, por
corridas diarias. El experimentador lo correr
decide que solo
los exse puedencon
perimentos realizar
un diseñocinco
en corridas
diarias.cuadro
El experimentador
latino para controlardecide correr
activamente a loslos experimentos
lotes y días. Los datos con un diseño
obtenidos son: en cuadro
latino para controlar activamente a los lotes y días.
Día
1 2 3 4 5
Lote 1 A=8 B=7 D=1 C=7 E=3
2 C = 11 E=2 A=7 D=3 B=8
3 B=4 A=9 C = 10 E=1 D=5
4 D=6 C=8 E=6 B=6 A = 10
5 E=4 D= 2 B=3 A=8 C=8

1. Elabore hipótesis nula y alternativa (H0 y HA) para el factor tratamientos.


2. Calcule las sumas de cuadrados de todos los factores.
3. Calcule los cuadrados medios.
Gutierrez-04.indd 121
4. Calcule el estadístico de prueba F para cada fuente de variación.
5. Compare los valores F calculados con el F de tabla y realice conclusiones.
6. Llene la siguiente tabla de resumen de resultados:
FUENTE DE
SC GL CM F CALC F TABLA
VARIABILIDAD
Tratamientos
Analista
Día
Error
Total

También podría gustarte