Seis Sigma BB Analisis

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 688

Programa de certificación

de Black Belts ASQ

VI. Seis Sigma - Análisis

P. Reyes / Noviembre de 2007

1
Fase de Análisis
 Propósitos:
 Establecer hipótesis sobre las posibles Causas Raíz
 Refinar, rechazar, o confirmar la Causa Raíz
 Seleccionar las Causas Raíz más importantes:
 Las pocas Xs vitales

 Salidas:
 Causas raíz validadas
 Factores de variabilidad identificados

2
QFD
FASE DE ANÁLISIS
Diagrama de
relaciones
Diagrama
Causa Efecto Diagrama de
Ishikawa
Diagrama
de Árbol
Definición
Y=X1 + X2+. .Xn

CTQs = Ys Medición Y,
Operatividad X1, X2, Xn
X's
Causas
Análisis del Modo y Efecto de potenciales
Falla (AMEF)

Llenar columnas del FMEA


Pruebas Hasta sol. Propuesta y
de
hipótesis
comprobar causas con
Diagrama Pruebas de Hipótesis
de Flujo
del X's vitales
proceso No ¿Causa Si Causas raíz
Raíz? validadas

3
VI. Análisis
A. Medición y modelaje de relación entre
variables

B: Pruebas de hipótesis

C. Análisis del modo y efecto de falla (AMEF)

D. Métodos adicionales de análisis

4
A. Medición y modelaje de
relación entre variables

5
A. Medición y modelaje de relación
entre variables
1. Coeficiente de correlación

2. Regresión

3. Herramientas Multivariadas

4. Estudios Multivari

5. Análisis de datos por atributos

6
VI.A.1 Coeficiente de correlación

7
Definiciones
Correlación
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"

Regresión
Describe con más detalle la relación entre las variables.

Construye modelos de predicción a partir de información


experimental u otra fuente disponible.

Regresión lineal simple


Regresión lineal múltiple
Regresión no lineal cuadrática o cúbica

8
Correlación
Propósito:
Propósito: Estudiar
Estudiarla
laposible
posiblerelación
relación
entre
entredos
dosvariables.
variables.
Accidentes laborales

• • •



• Correlación
• •
• •

• • positiva,






posible
• • •
• • •

• •

Numero de órdenes urgentes

El 1er. paso es realizar una gráfica de la información.

9
Coeficiente de correlación (r )
 Mide la fuerza de la relación lineal entre las variables
X y Y en una muestra.

 El coeficiente de correlación muestral de Pearson rx,y


con valores entre -1 y +1 es:

10
Correlación de la información (R ) de las X y las Y
Correlación Positiva Correlación Negativa
25
Evidente 25
Evidente
20 20

15 15

10
Y

Y
10
5
5
0
0 5 10 15 20 25 Sin Correlación 0
0 5 10 15 20 25
X 25
R=1 20
X
R=-1
15

Correlación Y 10
Correlación
5

25
Positiva 0 Negativa
0 5 10 15 20 25 25
20

15
X
R=0 20

15
Y

10

Y
10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
R=>1 X
R=>-1

11
Coeficiente de correlación
 El coeficiente de correlación r asume el mismo signo
de la pendiente de la recta 1 siendo cero cuando
1 =0

 Un valor positivo de r implica que la pendiente de la


línea es ascendente hacia la derecha
 Un valor negativo de r implica que la pendiente de la
línea es descendente hacia la derecha
 Si r=0 no hay correlación lineal, aunque puede haber
correlación curvilínea

12
Coeficiente de correlación
Reglas empíricas

Coeficiente de correlación Relación


0.8 < r < 1.0 Fuerte, positiva
0.3 < r < 0.8 Débil, positiva
-0.3 < r < 0.3 No existe
-0.8 < r < -0.3 Débil, negativa
-1.0 < r < -0.8 Fuerte, negativa

13
Correlaciones (Pearson)
Tabla de Correlación mínima

n 95% 99% n 95% 99%


de confianza de confianza de confianza de confianza
3 1.00 1.00 15 0.51 0.64
4 0.95 0.99 16 0.50 0.61
5 0.88 0.96 17 0.48 0.61
6 0.81 0.92 18 0.47 0.59
7 0.75 0.87 19 0.46 0.58
8 0.71 0.83 20 0.44 0.56
9 0.67 0.80 22 0.42 0.54
10 0.63 0.76 24 0.40 0.52
11 0.60 0.73 26 0.39 0.50
12 0.58 0.71 28 0.37 0.48
13 0.53 0.68 30 0.36 0.46
14 0.53 0.66

Para un 95% de confianza, con una muestra de 10,


el coeficiente (r) debe ser al menos .63
14
Correlación
• La correlación puede usarse para información de
atributos, variables normales y variables no normales.

• La correlación puede usarse con un “predictor” o


más para una respuesta dada.

• La correlación es una prueba fácil y rápida para


eliminar factores que no influyen en la predicción, para
una respuesta dada.
15
Coeficiente de Correlación
Para determinar que tanto se acercan los datos
predichos por el modelo a los datos observados
aplicando el coeficiente de correlación de Pearson (ver
tabla anterior para identificar la significancia)
S(yeyo)
r=
S(yeye) S(yoyo)
y ) 2
S(yeye) = yei2 - ei r = Coeficiente de correlación
n
yo = Respuesta observada
y ) 2
S(yoyo) = yoi2 - oi ye = Respuesta esperada
n
yei)yoi)
S(yeyo) = yei yoi - 16
Coeficiente de Correlación ajustado
Otra forma para no consultar la tabla de coeficiente de
correlación de Pearson es la r ajustada

(n-1)
R2(Adj) = 1 – (1 – r2) (n-p)

Donde : Criterios en función a la R2(Adj)


R2(Adj) = Coeficiente de correlación ajustado
> 90% = Correlación Fuerte
r = Coeficiente de correlación de Pearson 80% - 90% = Buena correlación
n = Número de datos 60% - 80% = Correlación media
40% - 60% = Correlación débil
p = Núm. términos en el modelo
(Incluyendo la constante) < 40% = No existe correlación
17
Coeficiente de Determinación (R2)
 El coeficiente de determinación es la proporción de la
variación total explicada por la regresión, R2 se
encuentra en el rango de valores de 0 a 1.

18
Correlación vs causación
 Tener cuidado de no tener variables colineales, por
ejemplo peso de un coche y peso de las personas
que transporta, o que no la relación no tenga
sentido, como si lavo mi coche, llueve.

19
VI.A.2 Regresión

20
Análisis de Regresión
El
Elanálisis
análisisde
deregresión
regresión es esun
unmétodo
método
estandarizado
estandarizadopara
paralocalizar
localizarla
lacorrelación
correlaciónentre
entredos
dos
grupos
grupos de
dedatos,
datos, y,
y, quizá
quizámásmásimportante,
importante,crear
crear un
un
modelo
modelode depredicción.
predicción.

Puede
Puedeser
ser usado
usadopara
paraanalizar
analizar las
lasrelaciones
relacionesentre:
entre:
••Una
Unasola
sola“X”
“X”predictora
predictorayyuna
unasola
sola “Y”
“Y”

••Múltiples
Múltiplespredictores
predictores“X”
“X”yy una
unasola
sola“Y”
“Y”

••Varios
Variospredictores
predictores“X”
“X”entre
entresí

21
Supuestos de la regresión lineal
Los principales supuestos que se hacen en el análisis de regresión
lineal son los siguientes:
 La relación entre las variables Y y X es lineal, o al menos bien
aproximada por una línea recta.
y   0  1 X  
 El término de error  tiene media cero.

 El término de error  tiene varianza constante 2.

 Los errores no están correlacionados.

 Los errores están normalmente distribuidos.


22
Modelo de regresión lineal
 Se aume que para cualquier valor de X el valor observado de Y
varia en forma aleatoria y tiene una distribución de probabilidad
normal

 El modelo general es:


Y = Valor medio de Yi para Xi + error aleatorio

y   0  1 X  
23
Regresión Lineal Simple
La línea de regresión se calcula por el método de mínimos cuadrados.
Un residuo es la diferencia entre un punto de referencia en particular (xi,
yi) y el modelo de predicción ( y = a + bx ). El modelo se define de tal
manera que la suma de los cuadrados de los residuales es un mínimo. La
suma residual de los cuadrados es llamada con frecuencia la suma de los
cuadrados de los errores (SSE) acerca de la línea de regresión

yi y = b0 + b1x
ei
• • •
• •
• • a y b son
• • •
• • • • Estimados de




• 0 y 1

• • •
• • •

• •

xi
SSE = ei2 = yi - yi2
Gráfica de la Línea de Ajuste
Recta de regresión
Y=-.600.858+5738.89X
R2 = .895
600
Retención

500 Regresión
95% Intervalo
de confianza
95% Intervalo
400 de predicción

0.18 0.19 0.20


Altura del muelle
Interpretación de los Resultados

La ecuación de regresión (Y = -600.858 + 5738.89X) describe


la relación entre la variable predictora X y la respuesta de
predicción Y.
RR22(coef.
(coef.de
dedeterminación)
determinación)es eselelporcentaje
porcentajede
devariación
variación
explicado
explicadopor
porlalaecuación
ecuaciónde
deregresión
regresiónrespecto
respectoaalalavariación
variacióntotal
total
en
enelelmodelo
modelo

El intervalo de confianza es una banda con un 95% de


confianza de encontrar la Y media estimada para cada valor de
X [Líneas rojas]

El intervalo de predicción es el grado de certidumbre de la


difusión de la Y estimada para puntos individuales X. En general,
95% de los puntos individuales (provenientes de la población
sobre la que se basa la línea de regresión), se encontrarán dentro
de la banda [Líneas azules]

26
Interpretación de los Resultados

• Los valores “p” de la constante (intersección en Y) y las variables


de predicción, se leen igual que en la prueba de hipótesis.
Ho: El factor no es significativo en la predicción de la respuesta.
Ha: El factor es significativo en la predicción de la respuesta.

• s es el “error estándar de la predicción” = desviación estándar del


error con respecto a la línea de regresión.

• R2 (ajustada) es el porcentaje de variación explicado por la


regresión, ajustado por el número de términos en el modelo y por
el número de puntos de información.

• El valor “p” para la regresión se usa para ver si el modelo completo


de regresión es significativo.
Ho: El modelo no es significativo en la predicción de la respuesta.
Ha: El modelo es significativo en la predicción de la respuesta.
Errores residuales
 Los errores se denominan frecuentemente residuales.
Podemos observar en la gráfica de regresión los errores
indicados por segmentos verticales.

28
Errores residuales
^
Los residuos ei  Yi  Y i , i  1,2,3..., n pueden ser graficados para:

 Checar normalidad.
 Checar el efecto del tiempo si su orden es conocido en los
datos.
 Checar la constancia de la varianza y la posible necesidad de
transformar los datos en Y.
 Checar la curvatura de más alto orden que ajusta en las X’s.

A veces es preferible trabajar con residuos estandarizados o


estudentizados: e
ri  i
,
ei   1 (X  X ) 
di  ,....1  1,2,....., n
2
MSE 1    i 
MS E  n S XX 
29
Errores residuales
 Análisis de los errores o residuales
¿Qué tan normales ¿Residuales individuales -
son los residuales? tendencias; o separados?
Diagnóstico del Modelo de Residuales
Gráfica Normal de Residuales Tabla de Residuales
20 50 3.0SL=43.26
40
10 30
R es idu a l

R es idu a l
20
0 10
0 X=0.000

-10 -10
-20
-20 -30
-40 -3.0SL=-43.26
-50
-2 -1 0 1 2 0 5 10
Marcador Normal Número de Observación
Histograma - Histograma de Residuales Residuales vs. Ajustes

¿curva de 3 20
Fre cu e n cia

10
campana?
R es idu a l

2
0

¿Aleatorio
1 -10

Ignórese 0
-20

para grupos
-25 -20 -15 -10 -5 0 5 10 15 450 500
Ajuste
550 alrededor de
pequeños de cero, sin
Buscar
Buscarlas
lasinconsistencias
inconsistencias tendencias?
información
mayores
mayores
(<30)
30
Ejemplo
Considere el problema de predecir las ventas mensuales en
función del costo de publicidad. Calcular el coeficiente de
correlación, el de determinación y la recta.

MES Publicidad Ventas

1 1.2 101
2 0.8 92
3 1.0 110
4 1.3 120
5 0.7 90
6 0.8 82
7 1.0 93
8 0.6 75
9 0.9 91
10 1.1 105 31
Cálculo manual
Calcular columnas para Suma X, Suma Y, Xi2, XiYi y Yi2
Xi Yi
MES Publicidad Ventas Xi2 XiYi Yi2
1 1.2 101 1.44 121.2 10201
2 0.8 92 0.64 73.6 8464
3 1.0 110 1.00 110.0 12100
4 1.3 120 1.69 156 14400
5 0.7 90 0.49 63.0 8100
6 0.8 82 0.64 65.6 6724
7 1.0 93 1.00 93.0 8649
8 0.6 75 0.36 45.0 5625
9 0.9 91 0.81 81.9 8281
10 1.1 105 1.21 115.5 11025

SUMA 9.4 959 9.28 924.8 93,569


32
Método de mínimos cuadrados
Donde:
Yest = Valor predicho de para un valor particular de x.
b0 = Estimador puntual de .(ordenada al origen)
b1= Estimador puntual de (pendiente)
Para el cálculo de b0 y b1 se utilizamos las siguientes fórmulas:
SS xy
 x 2
b1 
SS x   x 
2 SS x
n

 y 2
b0  y  b1 x
SS y   y 
2

  x   y 
SS xy   xy 
n 33
Análisis de varianza en la regresión
Tabla de Análisis de Varianza .

Fuente df SS MS = SS/df Fc
Regresión 1 SSR  b1 S XY MS REG MSreg/s2

Residual n-2 SSE  SSYY  b1 S XY S2


__________________________________________________________.
Total corregido n-1 SYY

La desviación estándar S corresponde a la raíz cuadrada del valor de MSE


o cuadrado medio residual.
n n
SS E SYY  b1 S XY  n

2
 X Y
S   
2
 Y  n i i
S XY   X iYi 
i
n2 n2 SYY
n
  Yi 2   i 1 
i 1 i 1

n i 1 n
i 1

Los residuos son:


__ __ __ ^ __ ^
^ ^ ^

ei  Yi  Y i Yi  Y i  Yi  Y  (Y i  Y )  (Y i  Y ) 2   (Y i  Y ) 2   (Yi  Y i ) 2

34
1
t ( n  2,1   ).S
b1  2
__
 i )2
( X  X

Análisis de varianza en la regresión


Las conclusiones son como sigue:

El estadístico F se calcula como F = MSE REG / S2 y se compara con la F de


tablas con (1, n-2) grados de libertad y área en 100(1-)%, para determinar si
el parámetro 1 es significativo que es el caso de F calc. > Ftablas.

Intervalos de confianza para Beta 0 y Beta 1


1/ 2 1/ 2
 __ 2     
1 X    X i2  S 1   X i2
se(b0 )  MSE   
  b0  t ( n  2,1   )  S
  n  ( X i  X ) 2 
__
 n S XX
   2  __
2
 n  ( X i  X ) 

1
MSE S t ( n  2,1   ). S
se(b1 )   b1  2
S XX S XX __

( X i  X )2 35
1
t ( n  2,1   ).S
b1  2
__
 i )2
( X  X

Análisis de varianza en la regresión


El intervalo de confianza para la desviación estándar es:

( n  2) MSE ( n  2) MSE
  2

 2 / 2,n 2  12 / 2,n 2
Intervalos de confianza para la Y estimada promedio
 __

 1 (X0  X )
2
^

Y0  t a / 2 , n  2 MSE   
n S XX
 
Intervalo de predicción para un valor particular de Y estimado
 __
  __

 1 ( X  X )2   1 ( X  X )2 
Yˆ0  t / 2 ,n  2 MSE 1   0
 Y0  Yˆ0  t / 2,n 2 MSE 1   0
 n S XX   n S XX 
   

36
1
t ( n  2,1   ).S
b1  2
__
 i )2
( X  X

Análisis de varianza en la regresión


Prueba de Hipótesis para Beta 1:
Ho: 1 = 0 contra H1:1  0

b1
t0 
MSE
S XX

Si t 0  t / 2,n  2 el coeficiente Beta 1 es significativo

37
1
t ( n  2,1   ).S
b1  2
__
 i )2
( X  X

Análisis de varianza en la regresión


Coeficiente de correlación r:

S XY
r
S XX SYY

Coeficiente de determinación: r2
R2 mide la proporción de la variación total respecto a la media que
es explicada por la regresión. Se expresa en porcentaje.
^ __

R2 
( SS .de.la.regresión . por.b0 )

 (Y  Y ) 2

 1
SSE
__
( SSTotal .corregido. para.la.media ) SYY
 (Y i  Y )2
38
1
t ( n  2,1   ).S
b1  2
__
 i )2
( X  X

Análisis de varianza en la regresión


Prueba de hipótesis para el Coeficiente de correlación r:
H0:  = 0 contra H1:   0
r n2
t0 
1 r2

t 0  t / 2,n  2
Si se rechaza la hipótesis Ho, indicando que existe una
correlación significativa

39
Riesgos de la regresión
 Los modelos de regresión son válidos como ecuaciones de
interpolación sobre el rango de las variables utilizadas en el
modelo. No pueden ser válidas para extrapolación fuera de
este rango.

 Mientras que todos los puntos tienen igual peso en la


determinación de la recta, su pendiente está más influenciada
por los valores extremos de X.
1.
Y
*A

* *
* * * Sin A y B
* * * *

*B

X 40
Riesgos de la regresión
 Los outliers u observaciones aberrantes pueden distorsionar
seriamente el ajuste de mínimos cuadrados.

Y
*A *
* * *
**
* * *
** *
**
* * *
**
* *

 Si se encuentra que dos variables están relacionadas


fuertemente, no implica que la relación sea casual, se debe
investigar la relación causa – efecto entre ellas. Por ejemplo el
número de enfermos mentales vs. número de licencias
recibidas.
41
Cálculo manual (cont..)
Cálculo de la recta de regresión lineal:

Sxx = 9.28 - (9.4)^2/10 = 0.444

Sxy = 924.8 - (9.4)(959) / 10 = 23.34

Ymedia = 959 / 10 = 95.9 Xmedia = 9.4 / 10 = 0.94

b1 = Sxy / Sxx = 23.34 / 0.444 = 52.57

b0 = Ymedia - b1*Xmedia = 95.9 - (52.5676)(0.94) = 46.49

Yest. = 46.49 + 52.57* X


42
Ejemplo (cont..)
Cálculo de S2 estimador de 

S2 = SSE / (n - 2) = Syy - (Sxy)^2/Sxx

Syy = 93,569 - (959)^2 / 10 = 1600.9

SSE = Syy - b1*Sxy = 1600.9 - (52.567)(23.34) = 373.97

S2 = SSE / (n - 2) = 373.97 / 8 = 46.75

S = 6.84

El intervalo de confianza donde caerán el 95% de los puntos


es el rango de 1.96S = 13.41 o sea a  13.41 de la línea.

43
Ejemplo (cont..)
Inferencias respecto a la pendiente de la línea b1:

Se usa el estadístico t = b1 / (S / Sxx)

El término del denominador es el error estándar de la


pendiente.

Para probar la hipótesis nula Ho: 1 = 0

En este caso tc = 52.57 / (6.84 / 0.444) = 5.12

El valor crítico tcrit. para alfa/2 = 0.025 con (n-2) = 8 grados


de libertad es 2.306.

Como tc > tcrítico se rechaza la hipótesis de que b1 = 0


existiendo la regresión.
44
Ejemplo (cont..)

Estableciendo un 95% de confianza para la pendiente de


la recta b1.

Usando la fórmula b1  t0.025 (S / Sxx) se tiene:

52.57  2.306 * 6.84 /  0.444 = 52.57  23.67.

Por tanto una unidad de incremento en publicidad, hará que


el volumen de ventas se encuentre entre $28.9 a $76.2.

45
Ejemplo (cont..)

Cálculo del coeficiente de Correlación:


________
r = Sxy / (SxxSyy)
____________
r = 23.34 / 0.444*1600.9 = 0.88

Como r es positivo, la pendiente de la recta apunta hacia


arriba y a la derecha.

El coeficiente de determinación r^2 = 1 - SSE/Syy

r^2 = ( Syy - SSE ) / Syy = 0.774

46
Análisis de Regresión
1. Teclear los datos para Xi y Yi

2. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o ANALISIS


DE DATOS, CORRELATION o CORRELACIÓN

3. Dar INPUT RANGE (rango de datos), OUTPUT RANGE (para los


resultados) y obtener los resultados

Column 1 Column 2
Column 1 1 0.875442
Column 2 0.875442 1

El coeficiente de correlación r = 0.875442


47
Cálculo con Excel)
4. Llamar a TOOLS o HERRAMIENTAS, DATA ANALYSIS o
ANALISIS DE DATOS, REGRESION o REGRESIÓN

3. Dar INPUT RANGE Y (rango de datos Yi), INPUT RANGE X


(rango de datos Xi), CONFIDENCE INTERVAL 95%, OUTPUT
RANGE (para los resultados), RESIDUAL PLOTS o GRAFICAS DE
RESIDUALES y obtener una tabla de resultados como los que se
muestran en las páginas siguientes.

NOTAS:

a) La gráfica de probabilidad normal debe mostrar puntos


fácilmente aproximables por una línea recta, indicando normalidad.

B) La gráfica de residuos estandarizados se deben distribuir en


forma aleatoria alrededor de la línea media igual a cero. 48
Resultados de Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.875442 R Square 0.766398
Adjusted R Square0.737198 Standard Error 6.83715
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 1226.927 1226.927 26.24633 0.000904
Residual 8 373.973 46.74662
Total 9 1600.9
Confidence 95%
Coefficients Standard Error t Stat P-value Lower Upper

Intercept 46.48649 9.884566 4.702936 0.001536 23.69262 69.28035

X Variable1 52.56757 10.26086 5.123117 0.000904 28.90597 76.22916

La ecuación de la recta es Yest = 46.48649 + 52.56757 X


Como los valores p para los coeficientes son menores a 0.05,
ambos son significativos
Gráfica normal de Excel

Normal Probability Plot

140
120
100
80
Y

60
40
20
0
0 20 40 60 80 100
Sample Percentile

50
Gráfica de Residuos vs. X de Excel

X Variable 1 Residual Plot

20
Residuals

10
0
-10 0 0.5 1 1.5
X Variable 1

51
Ejercicio
Calcular la recta de predicción con sus bandas de confianza, la
correlación y la determinación para la respuesta de un Taxi,
los datos se muestran a continuación:

Distancia Tiempo
0.8 200
2.2 400
1.0 160
0.6 120
1.0 360
1.4 280
2.2 560
0.6 320
52
Relaciones no Lineales
¿Qué pasa si existe una relación causal, no lineal?
¿Cómo describiría
El siguiente es un conjunto de datos
experimentales codificados, sobre
esta relación?
resistencia a la compresión de una
aleación especial:

Resistencia a
Concentración la Compresión
x y
10.0 25.2 27.3 28.7
15.0 29.8 31.1 27.8
20.0 31.2 32.6 29.7
25.0 31.7 30.1 32.3
30.0 29.4 30.8 32.8

(ref. Walpole & Myers, 1985)

53
Resultados del Análisis de Regresión - Modelo Cuadrático

Y = 19.0333 + 1.00857X - 2.04E-02X**2


R2 = 0.614
Análisis de Variancia
FUENTE DF SS MS F p
Regresión 2 38.9371 19.4686 9.54490 3.31E-03
Error 12 24.4762 2.0397
Total 14 63.4133
FUENTE DF Seq SS F p
Lineal 1 28.0333 10.3005 6.84E-03
Cuadrática 1 10.9038 5.34584 3.93E-02
54
Regresión cuadrática
Obs X Y Fit SE Fit Residual St Resid
1 5.0 1.5820 1.3366 0.0519 0.2454 1.07
2 6.0 1.8220 1.5778 0.0473 0.2442 1.06
3 3.4 1.0570 0.9508 0.0703 0.1062 0.47
4 2.7 0.5000 0.7820 0.0806 -0.2820 -1.27
5 10.0 2.2360 2.5424 0.0875 -0.3064 -1.40
6 9.7 2.3860 2.4700 0.0828 -0.0840 -0.38
7 9.6 2.2940 2.4338 0.0804 -0.1398 -0.63
8 3.1 0.5580 0.8664 0.0753 -0.3084 -1.38
9 8.2 2.1660 2.0962 0.0609 0.0698 0.31
10 6.2 1.8660 1.6260 0.0472 0.2400 1.04
11 2.9 0.6530 0.8302 0.0776 -0.1772 -0.79
12 6.4 1.9300 1.6622 0.0474 0.2678 1.16
13 4.6 1.5620 1.2402 0.0555 0.3218 1.40
14 5.8 1.7370 1.5295 0.0476 0.2075 0.90
15 7.4 2.0880 1.9154 0.0530 0.1726 0.75
16 3.6 1.1370 0.9990 0.0675 0.1380 0.61
17 7.9 2.1790 2.0239 0.0574 0.1551 0.68
18 8.8 2.1120 2.2530 0.0694 -0.1410 -0.62
19 7.0 1.8000 1.8189 0.0500 -0.0189 -0.08
20 5.5 1.5010 1.4451 0.0490 0.0559 0.24
21 9.1 2.3030 2.3253 0.0737 -0.0223 -0.10
22 10.2 2.3100 2.5906 0.0907 -0.2806 -1.29
23 4.1 1.1940 1.1196 0.0611 0.0744 0.33
24 4.0 1.1440 1.0834 0.0629 0.0606 0.27
25 2.5 0.1230 0.7217 0.0845 -0.5987 -2.72R 55
Regresión cuadrática

Analysis of Variance
Source DF SS MS F P
Regression 1 8.9296 8.9296 160.26 0.000
Residual Error 23 1.2816 0.0557
Total 24 10.2112
56
Regresión cuadrática
Los residuos
No son normales
Se deben transformar
Las variables

57
Otros Patrones No Lineales
A veces es posible transformar una o ambas variables, para mostrar
mejor la relación entre ambas. La meta es identificar la relación
matemática entre las variables, para que con la variable transformada
se obtenga una línea más recta. Algunas transformaciones comunes
incluyen:

x’ = 1/x
x’ = Raíz cuadrada de (x)

Funciones trigonométricas: x’ = Seno


de x x’ = log x
Trasformación de funciones
Funciones linealizables y su forma lineal
correspondiente.
Figura 3.13 Función Transformación Forma lineal

a,b Y   0 X 1 Y '  log Y , X '  log X Y '  log  0  1 X '

c,d Y   0 e 1 X Y '  log Y Y '  ln  0   1 X


e,f Y   0   1 log X X '  log X Y '   0  1 X '
X 1 1
g,h Y Y' , X ' Y '   0  1 X '
 0 X  1 Y X

 Ejemplo: sea Y   0 e 1 X  se transforma como ln Y  ln  0  1 X  ln 

Y '   0 '  1 X   '

59
Transformación de variables del
ejemplo de regresión cuadrática
 Transformando la variable X’ = 1/X se tiene, utilizando Minitab
The regression equation is
Y = 2.98 - 6.93 1/X

Predictor Coef SE Coef T P


Constant 2.97886 0.04490 66.34 0.000
1/X -6.9345 0.2064 -33.59 0.000

S = 0.09417 R-Sq = 98.0% R-Sq(adj) = 97.9%

Obs 1/X Y Fit SE Fit Residual St Resid


1 0.200 1.5820 1.5920 0.0188 -0.0100 -0.11
2 0.167 1.8220 1.8231 0.0199 -0.0011 -0.01
3 0.294 1.0570 0.9393 0.0274 0.1177 1.31
4 0.370 0.5000 0.4105 0.0404 0.0895 1.05
5 0.100 2.2360 2.2854 0.0276 -0.0494 -0.55
6 0.103 2.3860 2.2640 0.0271 0.1220 1.35

60
Transformación de variables del
ejemplo de regresión cuadrática
 Transformando la variable X’ = 1/X se tiene, utilizando Minitab

61
Transformación de variables del
ejemplo de regresión cuadrática
 Los residuos ahora ya se muestran normales

62
Transformación para homoestacidad
de la varianza
 Algunas transformaciones para estabilizar la varianza
Relación de 2 a E(Y) Transformación
 2    constante ..............................Y '  Y
 2    E (Y ).................................Y '  Y Datos de Poisson

 2    E (Y )1  E (Y )................Y '  sin 1 Y Proporciones binomiales

 2     E (Y ) ..............................Y '  ln(Y )


2

 2     E (Y ) 3 ...........................Y '  Y 1 / 2

63
Transformación para homoestacidad
de la varianza
 Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
eléctrica utilizada (X) durante un cierto periodo de tiempo
Obs X Y Fit SE Fit Residual St Resid
1 679 0.790 1.649 0.351 -0.859 -0.61
2 292 0.440 0.308 0.490 0.132 0.10
3 1012 0.560 2.802 0.293 -2.242 -1.57
4 493 0.790 1.004 0.412 -0.214 -0.15
5 582 2.700 1.312 0.381 1.388 0.98
6 1156 3.640 3.301 0.297 0.339 0.24
7 997 4.730 2.750 0.294 1.980 1.38
8 2189 9.500 6.880 0.651 2.620 2.00R
9 1097 5.340 3.097 0.293 2.243 1.57
10 2078 6.850 6.495 0.600 0.355 0.27
11 1818 5.840 5.595 0.488 0.245 0.18
12 1700 5.210 5.186 0.441 0.024 0.02
13 747 3.250 1.884 0.333 1.366 0.96
14 2030 4.430 6.329 0.579 -1.899 -1.42
15 1643 3.160 4.988 0.420 -1.828 -1.31
16 414 0.500 0.730 0.441 -0.230 -0.17
17 354 0.170 0.523 0.465 -0.353 -0.25
18 1276 1.880 3.717 0.313 -1.837 -1.29
19 745 0.770 1.877 0.333 -1.107 -0.78
20 435 1.390 0.803 0.433 0.587 0.42
21 540 0.560 1.167 0.395 -0.607 -0.43
22 874 1.560 2.324 0.307 -0.764 -0.53
23 1543 5.280 4.642 0.384 0.638 0.45
24
25
1029
710
0.640
4.000
2.861
1.756
0.293
0.343
-2.221
2.244
-1.55
1.58 64
Transformación para homoestacidad
de la varianza
 Ejemplo: Se hizo un estudio entre la demanda (Y) y la energía
eléctrica utilizada (X) durante un cierto periodo de tiempo
The regression equation is
Y = - 0.704 + 0.00346 X
Predictor Coef SE Coef T P
Constant -0.7038 0.6170 -1.14 0.266
X 0.0034645 0.0005139 6.74 0.000
S = 1.462 R-Sq = 66.4% R-Sq(adj) = 64.9%
Analysis of Variance
Source DF SS MS F P
Regression 1 97.094 97.094 45.45 0.000
Residual Error 23 49.136 2.136
Total 24 146.231

65
Transformación para homoestacidad
de la varianza
 Se observa que la varianza se incrementa conforme aumenta X

66
Transformación para homoestacidad
de la varianza
 Se observa que la varianza se incrementa conforme aumenta X

67
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:
Obs X SQR-Y Fit SE Fit Residual St Resid
1 679 0.8888 1.1694 0.1092 -0.2805 -0.64
2 292 0.6633 0.7717 0.1524 -0.1084 -0.25
3 1012 0.7483 1.5115 0.0912 -0.7632 -1.71
4 493 0.8888 0.9783 0.1280 -0.0894 -0.21
5 582 1.6432 1.0697 0.1184 0.5735 1.31
6 1156 1.9079 1.6595 0.0922 0.2484 0.56
7 997 2.1749 1.4961 0.0914 0.6788 1.52
8 2189 3.0822 2.7208 0.2024 0.3614 0.89
9 1097 2.3108 1.5989 0.0911 0.7120 1.60
10 2078 2.6173 2.6068 0.1867 0.0105 0.03
11 1818 2.4166 2.3397 0.1518 0.0770 0.18
12 1700 2.2825 2.2184 0.1371 0.0641 0.15
13 747 1.8028 1.2392 0.1035 0.5635 1.27
14 2030 2.1048 2.5575 0.1800 -0.4527 -1.09
15 1643 1.7776 2.1598 0.1304 -0.3822 -0.88
16 414 0.7071 0.8971 0.1372 -0.1900 -0.44
17 354 0.4123 0.8354 0.1445 -0.4231 -0.98
18 1276 1.3711 1.7828 0.0974 -0.4116 -0.93
19 745 0.8775 1.2372 0.1037 -0.3597 -0.81
20 435 1.1790 0.9187 0.1347 0.2603 0.60
21 540 0.7483 1.0265 0.1228 -0.2782 -0.64
22 874 1.2490 1.3697 0.0955 -0.1207 -0.27
23 1543 2.2978 2.0571 0.1195 0.2407 0.55

68
24 1029 0.8000 1.5290 0.0910 -0.7290 -1.64
25 710 2.0000 1.2012 0.1065 0.7988 1.81
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:
Regression Analysis: SQR-Y versus X

The regression equation is


SQR-Y = 0.472 + 0.00103 X
Predictor Coef SE Coef T P
Constant 0.4717 0.1918 2.46 0.022
X 0.0010275 0.0001598 6.43 0.000
S = 0.4544 R-Sq = 64.3% R-Sq(adj) = 62.7%

69
Transformación para homoestacidad
de la varianza
 Transformando a X por su raíz cuadrada se tiene:

70
Regresión lineal múltiple

71
Regresión múltiple
 Cuando se usa más de una variable independiente para predecir
los valores de una variable dependiente, el proceso se llama
análisis de regresión múltiple, incluye el uso de ecuaciones
lineales.

Yu   0  1 X u1   2 X u 2  .......   k X uk   u

Se asume que los errores u tienen las características siguientes:


 Tienen media cero y varianza común 2.
 Son estadísticamente independientes.
 Están distribuidos en forma normal.

72
Regresión múltiple
Estimación de los parámetros del modelo
 Se trata de minimizar los errores cuadráticos en:

N
R (  0 , 1 ,...,  k )   (Yu   0  1 X u1   2 X u 2  .....   uk ) 2
u 1

El modelo de regresión múltiple en forma matricial es:


Y = X  +  = [1 : D]  + 
Y es un vector N x 1.
X es una matriz de orden N x (k + 1), donde la 1ª. columna es 1’s.
 es un vector de orden (k + 1) x 1.
 es un vector de orden N x 1.
D es la matriz de Xij con i = 1, 2, ..., N; j = 1, 2, ......, k

73
Regresión múltiple
Estimación de los parámetros del modelo:

b = (X’X)-1 X’Y
El vector de valores ajustados Yˆ  Xb se puede expresar como:

Yˆ  Xb  X ( X ' X ) 1 X ' Y  Hy

La varianza del modelo se estima como:


n
SSE   (Yi  Yˆ ) 2   ei2  e' e
i 1

SSE  (Y  Xb )' (Y  Xb)  Y ' Y  b' X ' Y  Y ' Xb  b' X ' Xb  Y ' Y  2b' X ' Y  b' X ' Xb
SSE
SSE  Y ' Y  b' X ' Y s 2  MSE 
Np 74
Tamaño de muestra
 Tomar 5 observaciones para cada una de las
variables independientes, si esta razón es menor de5
a 1, se tiene el riesgo de “sobreajustar” el modelo

 Un mejor nivel deseable es tomar 15 a 20


observaciones por cada variable independiente

75
Ejemplo de regresión múltiple
 Un embotellador está analizando las rutas de servicio de
máquinas dispensadoras, está interesado en predecir la
cantidad de tiempo requerida por el chofer para surtir las
máquinas en el local (Y).

 La actividad de servicio incluye llenar la máquina con refrescos


y un mantenimiento menor.

 Se tienen como variables el número de envases con que llena la


máquina (X1) y la distancia que tiene que caminar (X2).

76
X2-Dist X1-CAS Y-TENT Fit SE Fit Residual St Resid
Obs
16.68 7.0 16.680 21.708 1.040 -5.028 -1.63
1
11.50 3.0 11.500 10.354 0.867 1.146 0.36
2
12.03 3.0 12.030 12.080 1.024 -0.050 -0.02
3

Ejemplo de regresión múltiple


14.88 4.0 14.880 9.956 0.952 4.924 1.58
4
13.75 6.0 13.750 14.194 0.893 -0.444 -0.14
5
18.11 7.0 18.110 18.400 0.675 -0.290 -0.09
6
08.00 2.0 8.000 7.155 0.932 0.845 0.27
7
17.83 7.0 17.830 16.673 0.823 1.157 0.37
8
79.24 30.0 79.240 71.820 2.301 7.420 3.21RX
9
21.50 5.0 21.500 19.124 1.444 2.376 0.81
10
40.33 16.0 40.330 38.093 0.957 2.237 0.72
11
21.00 10.0 21.000 21.593 1.099 -0.593 -0.19
12
13.50 4.0 13.500 12.473 0.806 1.027 0.33
13
19.75 6.0 19.750 18.682 0.912 1.068 0.34
14
24.00 9.0 24.000 23.329 0.661 0.671 0.21
15
29.00 10.0 29.000 29.663 1.328 -0.663 -0.22
16
15.35 6.0 15.350 14.914 0.795 0.436 0.14
17
19.00 7.0 19.000 15.551 1.011 3.449 1.11
18
09.50 3.0 9.500 7.707 1.012 1.793 0.58
19
35.10 17.0 35.100 40.888 1.039 -5.788 -1.87
20
17.90 10.0 17.900 20.514 1.325 -2.614 -0.88
21
52.32 26.0 52.320 56.007 2.040 -3.687 -1.45 22
18.75 9.0 18.750 23.358 0.662 -4.608 -1.44 23
19.83 8.0 19.830 24.403 1.132 -4.573 -1.50 24
10.75 4.0 10.750 10.963 0.841 -0.213 -0.07 25

R denotes an observation with a large standardized residual


X denotes an observation whose X value gives it large influence.

Durbin-Watson statistic = 1.17


77
Ejemplo de regresión múltiple
Solución matricial
Matrix M5 = X'
[ 1 1 1 1 1 1 1 1 1 1 1 1
1
7 3 3 4 6 7 2 7 30 5 16 10
4
560 220 340 80 150 330 110 210 1460 605 688 215
255

1 1 1 1 1 1 1 1 1 1 1 1
6 9 10 6 7 3 17 10 26 9 8 4
462 448 776 200 132 36 770 140 810 450 635 150 ]

Matrix M6 = X'Y

[ 25 219 10232
219 3055 133899
10232 133899 6725688 ]

Matrix M7 = X'Y

[ 560
7375
337072 ]
78
Ejemplo de regresión múltiple
Solución matricial
Matrix M8 = INV(X'X)

0.113215 -0.004449 -0.000084


-0.004449 0.002744 -0.000048
-0.000084 -0.000048 0.000001

Matrix M9 = INV(X'X) X'Y

2.34123
1.61591
0.01438

The regression equation is


Y-TENT = 2.34 + 1.62 X1-CAS + 0.0144 X2-DIST
Predictor Coef SE Coef T P
Constant 2.341 1.097 2.13 0.044
X1-CAS 1.6159 0.1707 9.46 0.000
X2-DIST 0.014385 0.003613 3.98 0.001

S = 3.259 R-Sq = 96.0% R-Sq(adj) = 95.6%

79
Ejemplo de regresión múltiple
Solución matricial
Cálculo de la estimación de la varianza:
Data Display

Matrix M10 = Y'

[ 16.68 11.50 12.03 14.88 13.75 18.11 8.00 17.83 79.24 21.50
40.33
21.00 13.50 19.75 24.00 29.00 15.35 19.00 9.50 35.10 17.90 52.32
18.75 19.83 10.75 ]

Matrix M11 = Y'Y = 18310.6

Matrix M12 = b' = [ 2.34123 1.61591 0.01438 ]

Matrix M13 = b'X'Y = 18076.9

Matrix M14 = SSe = Y'Y - b'X'Y = 233.732

SS E 233.732
S2    10.624
Np 25  3
80
Ejemplo de regresión múltiple
Solución matricial
 Intervalo de confianza para Beta 1

b1  t.025, 22 se(b1 )  1  b1  t.025, 22 se(b1 )

1.61591  ( 2.074) (10.6239)(0.00274378)   1  1.6191  ( 2.074)(0.17073)

Por tanto el intervalo de confianza para el 95% es:


1.26181  1  1.97001

81
Ejemplo de regresión múltiple
Solución matricial
 El embotellador desea construir un intervalo de confianza sobre
el tiempo medio de entrega para un local requiriendo:

X1 = 8 envases y cuya distancia es X2 = 275 pies.

1  2.34123
X 0  8  Yˆ0  X ' 0 b  1,8,275 1.61591   19.22minutos
   
275 0.01438

La varianza de la Y0 estimada es (tomando M8=inv(X’X) :


1 
Var (Yˆ0 )  S 2 X ' 0 ( X ' X ) 1 X 0  10.62391,8,275 M 88   10.6239(0.05346)  0.56794
 
275

82
Ejemplo de regresión múltiple
Solución matricial
 El intervalo de confianza sobre el tiempo medio de entrega para
un local requiriendo es para 95% de nivel de confianza:

19.22  2.074 0.56794  Y0  19.22  2.074 0.56794

 Que se reduce a: 17.66  Y0  20.78

83
Ejemplo de regresión múltiple
Solución matricial
 El análisis de varianza es:
Analysis of Variance

(559.6) 2
SST = 18,310.629 - = 5784.5426
25
(559.6) 2
SSR = 18,076.930 - = 5,550.8166
25
SSE = SST – SSR = 233.7260

Con el paquete Minitab se obtuvo lo siguiente:


MSR 2775.4083
F0    261.24
MSE 10.6239 Source DF SS MS F P
Regression 2 5550.8 2775.4 261.24 0.000
F0.05, 2 , 22  3.44 Residual Error 22 233.7 10.6
Total 24 5784.5
Como la F calculada es mayor que la F de tablas, se
concluye que existe el modelo con alguno de sus
coeficientes diferente de cero
84
Ejemplo de regresión múltiple
Solución matricial
 El comportamiento de los residuos es como sigue:

85
Multicolinealidad
 La multicolinealidad implica una dependencia cercana entre
regresores (columnas de la matriz X ), de tal forma que si hay
una dependencia lineal exacta hará que la matriz X’X sea
singular.

 La presencia de dependencias cercanamente lineales impactan


dramáticamente en la habilidad para estimar los coeficientes de
regresión.

 La varianza de los coeficientes de la regresión son inflados


debido a la multicolinealidad. Es evidente por los valores
diferentes de cero que no están en la diagonal principal de X’X.
Que son correlaciones simples entre los regresores.

86
Multicolinealidad
 Una prueba fácil de probar si hay multicolinealidad entre dos
variables es que su coeficiente de correlación sea mayor a 0.7

 Los elementos de la diagonal principal de la matriz X’X se


denominan Factores de inflación de varianza (VIFs) y se usan
como un diagnóstico importante de multicolinealidad. Para el
componente j – ésimo se tiene:

1
VIF j 
1  R 2j
 Si es mayor a 10 implica que se tienen serios problemas de
multicolinealidad.

87
Análisis de los residuos
 Los residuos graficados vs la Y estimada, pueden mostrar
diferentes patrones indicando adecuación o no adecuación del
modelo:

 Gráfica de residuos aleatorios cuya suma es cero (null plot) indica


modelo adecuado

 Gráfica de residuos mostrando una no linealidad curvilínea indica


necesidad de transformar las variables

 Si los residuos se van abriendo indica que la varianza muestra


heteroestacidad y se requiere transformar las variables. Se puede
probar con la prueba de Levene de homogeneidad de varianzas
88
Escalamiento de residuos
 En algunos casos es difícil hacer comparaciones directas entre
los coeficientes de la regresión debido a que la magnitud de bj
refleja las unidades de medición del regresor Xj. Por ejemplo:

Yˆ  5  X 1  1000 X 2

 Para facilitarla visualización de residuos ante grandes


diferencias en los coeficientes, se sugiere estandarizar o
estudentizar los residuos

89
Escalamiento de residuos
 Residuos estandarizados
 Se obtienen dividiendo cada residuo entre la desviación
estándar de los residuos
ei
di  ,
MSE
 Después de la estandarización, los residuos tienen una
media de 0 y desviación estándar de 1

 Con más de 50 datos siguen a la distribución t, de


manera que si exceden a 1.96 (límite para alfa 0.05)
indica significancia estadística y son “outliers”
90
Escalamiento de residuos
 Residuos estudentizados
 Son similares a los residuos donde se elimina una
observación y se predice su valor, pero además se elimina la
i-ésima observación en el cálculo de la desviación estándar
usada para estandarizar la í-ésima observación

 Puede identificar observaciones que tienen una gran


influencia pero que no son detectadas por los residuos
estandarizados

 H = X (X’X)-1X’ es la matriz sombrero o “hat matriz”.


ei
ri  ,
MSE (1  hii ) 91
Escalamiento de residuos
 El estadístico PRESS (Prediction Error Sum of Squares) es una
medida similar a la R2 en la regresión. Difiere en que se
estiman n-1 modelos de regresión.

 En cada modelo se omite una observación en la estimación del


modelo de regresión y entonces se predice el valor de la
observación omitida con el modelo estimado. El residuo iésimo
será:
e( i )  Yi  Yˆ( i )

 El residuo PRESS es la suma al cuadrado de los residuos


individuales e indica una medida de la capacidad de predicción
PRESS   e(2i )   Yi  Yˆ( i ) 
N
2 PRESS
RPr2 edicción  1 
i 1 SYY 92
Gráficas parciales de regresión
 Para mostrar el impacto de casos individuales es más efectiva la
gráfica de regresión parcial. Un caso “outlier” impacta en la
pendiente de la ecuación de regresión (y su coeficiente).

 Una comparación visual de la gráfica de regresión parcial con y


sin la observación muestra la influencia de la observación

 El coeficiente de correlación parcial es la correlación de la


variable independiente Xi la variable dependiente Y cuando se
han eliminado de ambos Xi y Y

 La correlación semiparcial refleja la correlación entre las


variables independiente y dependiente removiendo el efecto Xi
93
Matriz sombrero
 Los puntos de influencia son observaciones substancialmente
diferentes de las observaciones remanentes en una o más
variables independientes

 Contiene valores (sombrero en su diagonal) para cada


observación que representa influencia. Representa los efectos
combinados de todos las variables independientes para cada
caso

94
Matriz sombrero
 Los valores en la diagonal de la matriz sombrero miden dos
aspectos:
 Para cada observación miden la distancia de la observación

al centro de la media de todas las observaciones de las


variables independientes

 Valores altos en la diagonal indica que la observación tiene


mucho peso para la predicción del valor de la variable
dependiente, minimizando su residuo
 El rango de valores es de 0 a 1, con media p/n, p es el
número de predictores y n es el tamaño de muestra. Valores
límite se encuentran en 2p/n y 3p/n

95
Distancia de Mahalanobis
 D2 es una medida comparable a los valores sombrero (hat
values) que considera sólo la distancia de una observación del
valor medio de las variables independientes.

 Es otra forma de identificar “outliers”

 La significancia estadística de la distancia de Malahanobis se


puede hacer a partir de tablas del texto:
 Barnett, V., Outliers in Statistical Data, 2nd. Edition, Nueva

York, Wiley, 2984

96
Influencia en coeficientes
individuales
 El impacto de eliminar una observación simple en cada
uno de los coeficientes de la regresión múltiple se muestra
con la DFBETA y su versión estandarizada SDFBETA.

 Se sugiere aplicar como límites ±1.0 o ±2 para tamaños


de muestra pequeños y ±√n para muestras medias y
grandes

 La distancia de Cook (Di) captura el impacto de una


observación:
 La dimensión del cambio en los valores pronosticados

cuando se omite la observación y la distancia de las


otras observaciones, el límite es 1 o 4/(n-k-1)
97
Influencia en coeficientes
individuales
 La medida COVRATIO estima el efecto de la observación
en la eficiencia del proceso, en sus errores estándar de los
coeficientes de la regresión. Considera a todos los
coeficientes colectivamente.

 El límite puede ser establecido en 1 ±3p/n, los valores


mayores al límite hacen el proceso más eficiente y los
menores más ineficiente

 La medida SDFFIT es el grado en que cambian los


valores ajustados o pronosticados cuando el caso se
elimina. El valor límite es 2*raíz((k+1)/(n-k-1))
Ejemplo de regresión múltiple
Solución con Excel y Minitab

99
Ejemplo de Regresión Múltiple
Cat. (US News) GMAT Salario Inicial ($) % Aceptación
Stanford 1 711 82000 7.4
Harvard 2 670 80000 12.8
Penn (Wharton) 3 662 79000 14.7
MIT (Sloan) 4 650 78000 15.1
Chicago 5 680 65000 25.0
Northwestern 6 660 70000 16.0
Columbia 7 660 83000 14.8
Dartmouth 8 670 70000 12.6
Duke 9 646 67500 20.5
Berkeley 10 653 70000 13.3
Virginia 11 660 66000 18.9
Michigan 12 645 65000 28.0
NYU 13 646 70583 20.9
Carnegie Mellon 14 640 67200 30.8
Yale 15 675 65000 23.5
U.N.C. 16 630 60000 19.8
UCLA 17 651 65000 17.5
Texas-Austin 18 630 60000 27.3
Indiana 19 630 61500 44.7
Cornell 20 637 64000 25.4
Rochester 21 630 58500 36.0
Ohio State 22 611 61000 23.2
Emory 23 626 60000 33.0
Purdue 24 603 63700 20.7
Maryland 25 640 53000 18.9
100
Interpretación de Resultados de Excel- Regresión Multiple
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.8749313 R Square 0.76550478
Adjusted R Square 0.732005463 Standard Error 4050.855918 Observations 25

ANOVA
df SS MS F Significance F
Regression 3 1.12E+09 374977790.1 22.851355 8.17E-07
Residual 21 3.45E+08 16409433.67
Total 24 1.47E+09

Coefficients Standard t Stat P-value Lower 95% U pper 95%


Error
Intercept 122481.40 41473.13 2.953271081 0.007589 36233.29 208729.5

X Variable1 -926.873 198.8104 -4.662094325 0.0001336 -1340.32 -513.424

X Variable2 -59.9488 60.44875 -0.991730876 0.3326192 -185.659 65.76118

X Variable3 -191.7291 125.6138 -1.526337637 0.1418472 -452.957 69.49917


Resultados de Excel- Regresión sólo con sólo X1
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.855974
R Square 0.732691
Adjusted R Square 0.721069
Standard Error 4132.688
Observations 25

ANOVA
df SS MS F Significance F

Regression 1 1.08E+09 1.08E+09 63.04264 4.88E-08


Residual 23 3.93E+08 17079107
Total 24 1.47E+09

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 79230.32 1703.951 46.49801 2.98E-24 75705.43405 82755.20595
X Variable1 -910.077 114.6201 -7.93994 4.88E-08 -1147.186411 -672.9674353

Con
Consólo
sóloX1,
X1,el
elModelo
Modelosesesimplifica
simplificaenormemente
enormemente
poca
poca importancia
importanciapráctica
prácticase
sepierde
pierdeen
enRR2 (ajustada)
2
(ajustada)
Reducción
Vuelva a del Modelo
correr la regresión usando la categoría
US News, como el único agente de predicción (“predictor”)

La ecuación de regresión es:


y = 79230 - 910 x

“Predictor” Coef Desv. Estándar T p


Constante 79230 1704 46.50 0.000
x -910.1 114.6 -7.94 0.000

S = 4133 R2 = 73.3% R2 (ajustada) = 72.1%

Análisis de Variancia

Fuente DF SS MS F p
Regresión 1 1076712008 1076712008 63.04 0.000
Error 23 392819470 17079107
Total 24 1469531477

El
El Modelo
Modelo se
se simplifica
simplifica enormemente..…poca
enormemente..…poca
importancia
importancia práctica se pierde en R (ajustada)
práctica se pierde en R 22
(ajustada)
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C5
incluyendo la respuesta Y (heatflux) y las variables
predictoras X’s (North, South, East)
HeatFlux Insolation East South North
271.8 783.35 33.53 40.55 16.66
264.0 748.45 36.50 36.19 16.46
238.8 684.45 34.66 37.31 17.66
230.7 827.80 33.13 32.52 17.50
251.6 860.45 35.75 33.71 16.40
257.9 875.15 34.46 34.14 16.28

104
Corrida en Minitab
 Utilzar el archivo de ejemplo Exh_regr.mtw
 Opción: Stat > Regression > Regression
 Para regresión lineal indicar la columna de respuesta
Y (Score2) y X (Score1)

 En Regresión lienal en opciones se puede poner un


valor Xo para predecir la respuesta e intervalos. Las
gráficas se obtienen Stat > Regression > Regression
> Fitted line Plots

 Para regresión múltiple Y (heatflux) y las columnas


de los predictores (north, south, east)
105
Resultados de la regresión lineal
The regression equation is
Score2 = 1.12 + 0.218 Score1
Predictor Coef SE Coef T P
Constant 1.1177 0.1093 10.23 0.000
Score1 0.21767 0.01740 12.51 0.000
S = 0.1274 R-Sq = 95.7% R-Sq(adj) = 95.1%
Analysis of Variance
Source DF SS MS F P
Regression 1 2.5419 2.5419 156.56 0.000
Residual Error 7 0.1136 0.0162
Total 8 2.6556
Predicted Values for New Observations
New Obs Fit SE Fit 95.0% CI 95.0% PI
1 2.6414 0.0474 ( 2.5292, 2.7536) ( 2.3197, 2.9631)

New Obs Score1


106
Resultados de la regresión lineal
Regression Plot
Score2 = 1.11771 + 0.217670 Score1

S = 0.127419 R-Sq = 95.7 % R-Sq(adj) = 95.1 %

3.5
Score2

2.5

Regression
1.5 95% CI
95% PI

2 3 4 5 6 7 8 9

Score1

107
Resultados de la regresión Múltiple
The regression equation is
HeatFlux = 389 - 24.1 North + 5.32 South + 2.12 East
Predictor Coef SE Coef T P
Constant 389.17 66.09 5.89 0.000
North -24.132 1.869 -12.92 0.000
South 5.3185 0.9629 5.52 0.000
East 2.125 1.214 1.75 0.092
S = 8.598 R-Sq = 87.4% R-Sq(adj) = 85.9%
Analysis of Variance
Source DF SS MS F P
Regression 3 12833.9 4278.0 57.87 0.000
Residual Error 25 1848.1 73.9
Total 28 14681.9
Source DF Seq SS
North 1 10578.7
South 1 2028.9
108
East 1 226.3
Resumen de la Regresión
• La regresión sólo puede utilizarse con información de variables
continuas.

• Los residuos deben distribuirse normalmente con media cero.

• Importancia práctica: (R2). Importancia estadística: (valores p)

• La regresión puede usarse con un “predictor” X o más,


para una respuesta dada

• Reduzca el modelo de regresión cuando sea posible,


sin perder mucha importancia práctica
109
VI.A.4 Herramientas
multivariadas

110
Herramientas multivariadas
1. Introducción

2. Análisis de componentes principales

3. Análisis factorial

4. Análisis discriminante

5. MANOVA

111
Introducción
 En el análisis multivariado se incluyen dos o más
variables dependientes Y1, Y2, etc. Consideradas
simultáneamente para las variables independientes
X1, X2, …., Xn

 Normalmente se resuelven con herramientas


computacionales tales como Minitab y SPSS.

 Entre las herramientas principales se encuentran:


 Componentes principales, análisis factorial, análisis
discriminante, análisis de conglomerados, análisis
canónico, MANOVA
112
Análisis de componentes principales
 El análisis (PCA) y el análisis factorial (FA) se usan
para encontrar patrones de correlación entre muchas
variables posibles y subconjuntos de datos

 Busca reducirlas a un menor número de


componentes o factores que representen la mayor
parte de la varianza.

 Normalmente se requieren al menos cinco


observaciones por variable

113
Análisis de componentes principales
 Pasos de análisis en Minitab
 Se usa una matriz de correlación para determinar la
relación entre componentes
 Las matrices definen cantidades como eigenvalores y
eigenvectores
 Se suman los eigenvalores y se calculan las
proporciones de cada componente
 Se identifican los PC1, PC2, … que explican la mayor
parte de la varianza
 Se puede hacer un diagrama de Pareto como apoyo

114
Ejemplo: Alimentos en Europa
X1 X2 X3 X4 X5 X6 X7 X8 X9
País RMEAT WMEAT EGGS MILK FISH CERL STARCH NUTS FR-VEG
1 10.1 1.4 0.5 8.9 0.2 42.3 0.6 5.5 1.7
2 8.9 14 4.3 19.9 2.1 28 3.6 1.3 4.3
3 13.5 9.3 4.1 17.5 4.5 26.6 5.7 2.1 4
4 7.8 6 1.6 8.3 1.2 56.7 1.1 3.7 4.2
5 9.7 11.4 2.8 12.5 2 34.3 5 1.1 4
6 10.6 10.8 3.7 25 9.9 21.9 4.8 0.7 2.4
7 8.4 11.6 3.7 11.1 5.4 24.6 6.5 0.8 3.6
8 9.5 4.9 2.7 33.7 5.8 26.3 5.1 1 1.4
9 18 9.9 3.3 19.5 5.7 28.1 4.8 2.4 6.5
10 10.2 3 2.8 17.6 5.9 41.7 2.2 7.8 6.5
11 5.3 12.4 2.9 9.7 0.3 40.1 4 5.4 4.2
12 13.9 10 4.7 25.8 2.2 24 6.2 1.6 2.9
13 9 5.1 2.9 13.7 3.4 36.8 2.1 4.3 6.7
14 9.5 13.6 3.6 23.4 2.5 22.4 4.2 1.8 3.7
15 9.4 4.7 2.7 23.3 9.7 23 4.6 1.6 2.7
16 6.9 10.2 2.7 19.3 3 36.1 5.9 2 6.6
17 6.2 3.7 1.1 4.9 14.2 27 5.9 4.7 7.9
18 6.2 6.3 1.5 11.1 1 49.6 3.1 5.3 2.8
19 7.1 3.4 3.1 8.6 7 29.2 5.7 5.9 7.2
20 9.9 7.8 3.5 24.7 7.5 19.5 3.7 1.4 2
21 13.1 10.1 3.1 23.8 2.3 25.6 2.8 2.4 4.9
22 17.4 5.7 4.7 20.6 4.3 24.3 4.7 3.4 3.3
23 9.3 4.6 2.1 16.6 3 43.6 6.4 3.4 2.9
24 11.4 12.5 4.1 18.8 3.4 18.6 5.2 1.5 3.8
25 4.4 5 1.2 9.5 0.6 55.9 3 5.7 3.2

115
Corrida en Minitab
2    Stat > Multivariate > Principal components
3    En Variables, X1, X2, X3, X4, X6, X7, X8, X9

4    En Number of factors to extract, 3. Seleccionar


Correlation Matrix
5    Click Graphs y seleccionar Scree Plot, Score plot for first
2 components Loading plot for first 2 components

8    Click Storage e indicar las columnas donde se guarden los


coeficientes y los valores Z (scores) Coef1 Coef 2 y Z1 Z2
9. Click OK en cada uno de los cuadros de diálogo

116
Ejemplo: Alimentos en Europa
Scree Plot of RMEAT, ..., FR-VEG

3
Loading Plot of RMEAT, ..., FR-VEG
Eigenvalue

WMEA T C ERL
MILK
2 0.2

0.1 RMEA T
EGGS

0.0

Second Component
1
-0.1 NUTS

-0.2
0
-0.3 STA RC H
1 2 3 4 5 6 7 8 9
Component Number -0.4

-0.5 FR-VEG

-0.6 FISH

Dos componentes exceden -0.7


-0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4

El eigenvalor de ref. de 1 First Component

117
Ejemplo: Alimentos en Europa
Se tiene la gráfica siguiente de países:
Europa occidental Europa oriental Balcanes

Scatterplot of Z2 vs Z1
2 1
4
18
14 2 11
25
1 12
8
21
5
24 20
22 23
0 6 3
7 13
16
9 15
10
-1
Z2

-2
19

-3

-4 17

-5
-3 -2 -1 0 1 2 3 4
Z1

Península ibérica

118
Análisis factorial
 Es una técnica de reducción de variables para
identificar factores que expliquen la variación,
aunque se reiere un juicio subjetivo.

 Las variables de salida están relacionadas


linealmente con las variables de entrada.

 Las variables deben ser medibles y simétricas. Debe


haber cuatro o más factores de entrada para cada
variable independiente

119
Análisis factorial
 Se especifican un cierto número de factores comunes

 El análisis factorial se hace en dos etapas:


 Extracción de factores, para identificar los factores
principales para un estudio posterior
 Rotación de factores, para hacerlos más significativos

120
Corrida con Minitab
2    Stat > Multivariate > Factor Analysis.
3    En Variables, X1, X2, X3, X4, X6, X7, X8, X9
4    En Number of factors to extract, 4.
En Method of Extraction, seleccionar Principal components
6    En Type of Rotation, seleccionar Varimax.
7    Click Graphs y seleccionar Loading plot for first 2 factors
y Scree Plot.
Click Results y seleccionar Sort loadings.
Seleccionar Storage e indicar columnas para ponderaciones,
coeficientes, Z’s, eigenvalores, etc.
Click OK en cada uno de los cuadros de d

121
Loading Plot of RMEAT, ..., FR-VEG
CERL
0.50

NUTS

Ejemplo
0.25

FR-VEG STA RC H

Second Factor
0.00 FISH
WMEA T

-0.25

-0.50
MILK
EGGS

-0.75
RMEA T

-1.00
-0.50 -0.25 0.00 0.25 0.50 0.75 1.00
First Factor

Rotated Factor Loadings and Communalities


Varimax Rotation

Variable Factor1 Factor2 Factor3 Factor4 Communality


X1 RMEAT 0.051 -0.931 0.014 0.037 0.871
X2 WMEAT 0.943 -0.127 -0.100 0.050 0.918
X3 EGGS 0.628 -0.664 0.163 0.020 0.862
X4 MILK 0.197 -0.610 0.219 0.579 0.795
X5 FISH -0.226 -0.088 0.921 -0.104 0.919
X6 CERL -0.395 0.549 -0.624 -0.145 0.867
X7 STARCH 0.515 -0.004 0.683 -0.026 0.732
X8 NUTS -0.638 0.263 -0.326 -0.515 0.849
X9 FR-VEG -0.010 0.003 0.178 -0.937 0.910

Variance 2.2054 2.0749 1.9273 1.5165 7.7240


% Var 0.245 0.231 0.214 0.168 0.858 122
Ejemplo:

Scatterplot of Z2 vs Z1
2
Yugoslav ia

Portugal
Rumania Hungría

1 Bulgaria Rusia Polonia


Checa Alemania orien
España
Albania
Noruega
0 Finlandia
Dinamarca Holanda Autria
Z2

Italia Suecia A lemania Occ

Bélgica
Grecia
-1 Suiza Irlanda

Francia

-2 Reino Unido

-2 -1 0 1 2
Z1

123
Análisis discriminante
 Si se tiene una muestra con grupos conocidos, el
análisis discriminante clasifica las observaciones o
atributos en dos o más grupos

 Puede utilizarse como herramienta predictiva o


descriptiva

 Las variables deben ser multivariadamente normales,


con la misma varianza y covarianza poblacional entre
variables dependientes, y las muestras exhiben
independencia

124
Ejemplo de actividades en países
No Grupo Ciudad Agr Min Man Ps Con Ser Fin Sps Tc
1 1 Bélgica 3.3 0.9 27.6 0.9 8.2 19.1 6.2 26.6 7.2
2 1 Dinamarca 9.2 0.1 21.8 0.6 8.3 14.6 6.5 32.2 7.1
3 1 Francia 10.8 0.8 27.5 0.9 8.9 16.8 6.0 22.6 5.7
4 1 Alemania Occ. 6.7 1.3 35.8 0.9 7.3 14.4 5.0 22.3 6.1
5 1 Irlanda 23.2 1.0 20.7 1.3 7.5 16.8 2.8 20.8 6.1
6 1 Italia 15.9 0.6 27.6 0.5 10.0 18.1 1.6 20.1 5.7
7 1 Luxenburgo 7.7 3.1 30.8 0.8 9.2 18.5 4.6 19.2 6.2
8 1 Holanda 6.3 0.1 22.5 1.0 9.9 18.0 6.8 28.5 6.8
9 1 Inglaterra 2.7 1.4 30.2 1.4 6.9 16.9 5.7 28.3 6.4
10 1 Austria 12.7 1.1 30.2 1.4 9.0 16.8 4.9 16.8 7.0
11 1 Finlandia 13.0 0.4 25.9 1.3 7.4 14.7 5.5 24.3 7.6
12 2 Grecia 41.4 0.6 17.6 0.6 8.1 11.5 2.4 11.0 6.7
13 1 Noruega 9.0 0.5 22.4 0.8 8.6 16.9 4.7 27.6 9.4
14 2 Portugal 27.8 0.3 24.5 0.6 8.4 13.3 2.7 16.7 5.7
15 2 España 22.9 0.8 28.5 0.7 11.5 9.7 8.5 11.8 5.5
16 1 Suecia 6.1 0.4 25.9 0.8 7.2 14.4 6.0 32.4 6.8
17 1 Suiza 7.7 0.2 37.8 0.8 9.5 17.5 5.3 15.4 5.7
18 2 Turquía 66.8 0.7 7.9 0.1 2.8 5.2 1.1 11.9 3.2
19 3 Bulgaria 23.6 1.9 32.3 0.6 7.9 8.0 0.7 18.2 6.7
20 3 Checa 16.5 2.9 35.5 1.2 8.7 9.2 0.9 17.9 7.0
21 3 Alemania Ori. 4.2 2.9 41.2 1.3 7.6 11.2 1.2 22.1 8.4
22 3 Hungría 21.7 3.1 29.6 1.9 8.2 9.4 0.9 17.2 8.0
23 3 Polonia 31.1 2.5 25.7 0.9 8.4 7.5 0.9 16.1 6.9
24 3 Rumania 34.7 2.1 30.1 0.6 8.7 5.9 1.3 11.7 5.0
25 3 Rusia 23.7 1.4 25.8 0.6 9.2 6.1 0.5 23.6 9.3
26 3 Yugoslavia 48.7 1.5 16.8 1.1 4.9 6.4 11.3 5.3 4.0

125
Corrida con Minitab
2    Stat > Multivariate > Discriminant Analysis.

3    En Groups, poner SalmonOrigin.

4    En Predictors, poner Freshwater Marine. Click OK.

126
Corrida con Minitab
Canonical Discriminant Functions
3

1 3
1
0

-1 GRUPO
F u n c t io n 2

2 Group Centroids
-2
3
-3
2

-4 1
-6 -4 -2 0 2 4 6

Function 1

127
Análisis de conglomerados

128
Análisis de conglomerados
 Se usa para determinar agrupaciones o
clasificaciones de un conjunto de datos

 Las personas se pueden agrupar por IQ, padres,


hábitos de estudio, etc.

 Se trata de dar sentido a grandes cantidades de


datos de cuestionarios, ecnuestas, etc.

129
Ejemplo
 Suponer que un estudio de Variables V1 V2
mercado trata de determinar
segmentos de mercado en A 3 2
base a los patrones de B 4 5
lealtad de marcas (V1) y
tiendas (V2), medidas del 0 C 4 7
al 10 en 7 personas (A-G).
D 2 7

E 6 6

F 7 7

G 6 4

130
Corrida en Minitab
 Stat > Multivariate Análisis > Cluster Observations
 Distance Measured Euclidean Seleccionar Show
Dendogram OK
Dendrogram with Single Linkage and Euclidean Distance

3.16

2.11
Distance

1.05

0.00
1 2 3 4 5 6 7
Observations
131
Análisis de correlación canónico
 Prueba la hipótesis de que los efectos pueden tener
causas múltiples y de que las causas pueden tener
efectos múltiples (Hotelling 1935)

 Es como una regresión múltiple para determinar la


correlación entre dos conjuntos de combinaciones
lieneales, cada conjunto puede tener varias variables
relacionadas.
 La relación de un conjunto de variables dependientes
a un conjunto de variables independientes forma
combinaciones lineales

132
Análisis de correlación canónico
 Se usan los más altos valores de correlación para los
conjuntos. Los pares de combinaciones lineales se
denominan variates canónicas con correlaciones
canónicas (Rc con valor mayor a 0.3)

 Por ejemplo se quiere determinar si hay una


correlación entre las características de un ingeniero
industrial y las habilidades requeridas en la
descripción de puesto del mismo ingeniero.

133
MANOVA
(Análisis de varianza múltiple)
 Es un modelo para analizar la relación entre una o
más variables independientes y dos o más variables
dependientes

 Prueba si hay diferencias significativas en las medias


de grupos de una combinanción de respuestas Y.

 Los datos deben ser normales, con covarianza


homogenea y observaciones independientes

134
MANOVA
(Análisis de varianza múltiple)

135
Diferencias de ANOVA y MANOVA

136
Ejemplo:
Extrusión de película plástica
 Se realiza un estudio para determinar las condiciones
óptimas para extruir película plástica.

 Se miden tres respuestas – Tear, gloss y opacity –


cinco veces en cada combinación de dos factores –
tasa de extrusión y cantidad de aditivo – cada grupo
se pone en niveles bajos y altos.

 Se utiliza el MANOVA balanceado para probar la


igualdad de las medias.

137
Ejemplo:
Extrusión de película plástica
Tear Gloss Opacity Extrusión Additive
6.5 9.5 4.4 1 1
6.2 9.9 6.4 1 1
5.8 9.6 3 1 1
6.5 9.6 4.1 1 1
6.5 9.2 0.8 1 1
6.9 9.1 5.7 1 2
7.2 10 2 1 2
6.9 9.9 3.9 1 2
6.1 9.5 1.9 1 2
6.3 9.4 5.7 1 2
6.7 9.1 2.8 2 1
6.6 9.3 4.1 2 1
7.2 8.3 3.8 2 1
7.1 8.4 1.6 2 1
6.8 8.5 3.4 2 1
7.1 9.2 8.4 2 2
7 8.8 5.2 2 2
7.2 9.7 6.9 2 2
7.5 10.1 2.7 2 2
7.6 9.2 1.9 2 2
138
Ejemplo:
Extrusión de película plástica
1    Abrir el archivo EXH_MVAR.MTW.
2    Seleccionar Stat > ANOVA > Balanced
MANOVA.
3    En Responses, poner Tear Gloss Opacity.
4    En Model, poner Extrusion | Additive.
5    Click Results. En Display of Results, seleccionar
Matrices (hypothesis, error, partial
correlations) y Eigen analysis.
6    Click OK en cada cuadro de diálogo.

139
Ejemplo
Criterion Statistic F Num Denom P
Wilks' 0.38186 7.554 3 14 0.003
SSCP Matrix for Extrusion
Tear Gloss Opacity
Tear 1.740 -1.505 0.8555
Gloss -1.505 1.301 -0.7395
Opacity 0.855 -0.739 0.4205
SSCP Matrix for Error
Tear Gloss Opacity
Tear 1.764 0.0200 -3.070
Gloss 0.020 2.6280 -0.552
Opacity -3.070 -0.5520 64.924
Partial Correlations for the Error SSCP Matrix
Eigenvector 1 2 3
Tear 0.6541 0.4315 0.0604
Gloss -0.3385 0.5163 0.0012
Opacity 0.0359 0.0302 -0.1209

140
Ejemplo:
Extrusión de película plástica
Las matrices SSCP evalúan la contribución a la
variabilidad de manera similar a la suma de
cuadrados en la ANOVA univariada.

Las correlaciones parciales entre Tear y Gloss son


pequeñas. Como la estructura de las correlaciones es
débil, se pueden realizar análisis univariados de
ANOVA para cada una de las respuestas.

141
VI.A.4 Estudios Multivari

142
Estudios Multivari
 La carta multivari permite analizar la variación dentro
de la pieza, de pieza a pieza o de tiempo en tiempo

 Permite investigar la estabilidad de un proceso


consiste de líneas verticales u otro esquema en
función del tiempo. La longitud de la línea o del
esquema representa el rango de valores encontrados
en cada conjunto de muestras

143
Estudios Multivari
 La variación dentro de las muestras (cinco puntos en
cada línea). La variación de muestra a muestra como
posición vertical de las líneas.

E
S
P
E
S
O
R

Número de subgrupo 144


Estudios Multivari
 Ejemplo de parte metálica
Centro más grueso

145
Estudios Multivari
 Procedimiento de muestreo:
 Seleccionar el proceso y la característica a
investigar

 Seleccionar tamaño de muestra y frecuencia de


muestreo

 Registrar en una hoja la hora y valores para


conjunto de partes

146
Estudios Multivari
 Procedimiento de muestreo:
 Realizar la carta Multivari
 Unir los valores observados con una línea

 Analizar la carta para variación dentro de la parte,


de parte a parte y sobre el tiempo

 Puede ser necesario realizar estudios adicionales


alrededor del área de máxima variación aparente
 Después de la acción de mejora comprobar con
otro estudio Multivari
147
Cartas Multivari
 Su propósito fundamental es reducir el gran número de causas
posibles de variación, a un conjunto pequeño de causas que
realmente influyen en la variabilidad.

 Sirven para identificar el patrón principal de variación de entre


tres patrones principales:

 Temporal: Variación de hora a hora; turno a turno;


día a día; semana a semana; etc.

 Cíclico: Variación entre unidades de un mismo


proceso; variación entre grupos de unidades;
variación de lote a lote.
148
Cartas Multivari
 Posicional:

Variaciones dentro de una misma unidad (ejemplo:
porosidad en un molde de metal) o a través de una sola
unidad con múltiples partes (circuito impreso).


Variaciones por la localización dentro de un proceso que
produce múltiples unidades al mismo tiempo. Por
ejemplo las diferentes cavidades de un molde


Variaciones de máquina a máquina; operador a
operador; ó planta a planta

149
Cartas Multivari
 Ejemplo: Se toman 3 a 5 unidades consecutivas, repitiendo el
proceso tres o más veces a cierto intervalo de tiempo, hasta que al
menos el 80% de la variación en el proceso se ha capturado.

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN POSICIONAL DENTRO DE LA UNIDAD
150
Cartas Multivari
 Ejemplo: (cont...)

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59
VARIACIÓN CÍCLICA DE UNIDAD A UNIDAD

151
Cartas Multivari
 Ejemplo: (cont...)

1 2 3 4 5 27 28 29 30 31 55 56 57 58 59

VARIACIÓN TEMPORAL DE TIEMPO A TIEMPO

152
Cartas Multivari
 Ejemplo: Un proceso produce flecha cilíndricas, con un
diámetro especificado de 0.0250”  0.001”.

 Sin embargo un estudio de capacidad muestra un Cp =


0.8 y una dispersión natural de 0.0025” (6  ) contra la
permitida de 0.0002”.

 Se tiene pensado comprar un torno nuevo de


US$70,000 para tolerancia de  0.0008”, i.e. Cpk =
1.25. Se sugirió un estudio Multi Vari previo.

153
Cartas Multivari
 Se tomaron cuatro lecturas en cada flecha, dos a cada
lado. Estas muestran una disminución gradual desde
el lado izquierdo al lado derecho de las flechas,
además de excentricidad en cada lado de la flecha.

 La variación cíclica, de una flecha a la siguiente, se


muestra mediante las líneas que concentran las cuatro
lecturas de cada flecha.

 También se muestra la variación temporal.

154
Cartas Multivari
8 AM 9 AM 10 AM 11 AM 12 AM
.0.2510”

0.2500”

0.2490”

Izquierda

Máximo
Derecha

Mínimo

155
Cartas Multivari
 Un análisis rápido revela que la mayor variación es temporal con un cambio mayor entre las 10 AM y las 11 AM.

 A las 10 AM se para el equipo para el almuerzo y se arranca a las 11 AM, con lecturas similares a las de las 8 AM. Conforme pasa el tiempo
las lecturas tienden a decrecer más y más, hasta que se invierten a las 10 A.M. en forma drástica.

 Se investigó y se encontró que la temperatura tenía influencia en la variación.

 La variación en temperatura era causada por que la cantidad de refrigerante no era la adecuada, lo cual se notaba más cuando se paraba el
equipo y se volvía a arrancar. Se adicionó, reduciendo la variación en 50% aproximadamente..

156
Cartas Multivari
 También se encontró que el acabado cónico era causado por que la herramienta de corte estaba mal
alineada. Se ajustó, contribuyendo a otra reducción del 10% de la variabilidad.

 La excentricidad de las flechas se corrigió al cambiar un rodamiento excéntrico por desgaste en el


torno. Se instaló un nuevo rodamiento eliminándose otro 30% de la variabilidad.

 La tabla siguiente muestra un resumen de los resultados.

157
Cartas Multivari
Tipo de % var. Causas de Acción % de variación
Variación Total Variación Correctiva Reducida
Temporal 50 Bajo nivel de Adicionar Casi 50
Tiempo a tiempo Refrigerante refrigerante
Dentro de 10 Ajuste no Ajuste de la Casi 10
la flecha no paralelo herramienta de
corte
Dentro de 30 Rodamiento Nuevo Casi 30
la flecha gastado rodamiento

Flecha a 5 -??? - -
flecha
158
Cartas Multivari
 Resultados:
 La variación total en la siguiente corrida de producción se redujo de 0.0025” a 0.0004”

 El nuevo Cp fue de 0.002 / 0.0004 = 5.0

 Como beneficios se redujo a cero el desperdicio y no hubo necesidad de adquirir una nueva máquina.

 Se observa que antes de cambiar equipo o máquinas, es conveniente realizar un estudio de variabilidad para identificar las fuentes de
variación y tratar de eliminarlas.

159
Cartas Multivari
Ejemplo: Búsqueda de fuentes de variación con el diagrama sistemático.

Diámetro de Flecha
(0.150" +/- .002)

Variación
Variación de
de
sist. medición
proceso

Pieza a Dentro de Máquina a Turno a Tiempo a


Lote a lote
pieza la pieza máquina turno tiempo

Operador a
operador
Programa Máquina Accesorios

160
Cartas Multivari
Ejemplo (cont..):
• Al realizar la prueba de homogeneidad de varianza F, se
encontró que había una diferencia significante entre los
operadores.

Se Rechaza Ho: Oper1 = Oper2 = Oper3


• Para probar si existe diferencia significativa entre
medias de operadores se hacen las siguientes
comparaciones

Ho: Oper1 = Oper2 Ho: Oper1 = Oper3


Ho: Oper2 = Oper3 Ha: Oper1 Oper2 Oper3 161
Corrida en Minitab
 Se introducen los datos en varias columnas C1 a C3
incluyendo la respuesta (strenght) y los factores
(time y Metal)
SinterTime MetalType Strength
0.5 15 23
0.5 15 20
0.5 15 21
0.5 18 22
0.5 18 19
0.5 18 20
0.5 21 19
0.5 21 18 162
Corrida en Minitab
 Utilizar el achivo de ejemplo Sinter.mtw

 Opción: Stat > Quality Tools > Multivari charts

 Indicar la columna de respuesta y las columnas de


los factores

 En opciones se puede poner un título y conectar las


líneas

163
Resultados
Multi-Vari Chart for Strength by SinterTime - MetalType

SinterTime
0.5
23.5
1.0
2.0
22.5

21.5
Strength

20.5

19.5

18.5

17.5

15 18 21

MetalType

164
VI.A.5 Análisis de datos
por atributos

165
Análisis de datos por atributos
 Si los CTQ’s son variables continuas, se usa la
regresión, dependiendo de la naturaleza de la
característica crítica para el cliente (CTS’s) como éste
la expresa:

CTS HERRAMIENTA
Nominal (Verde, Rojo, azul) Regresión Logística Nominal
Atributo (Pasa/No pasa) Regresión Logística Binaria
Ordinal (1, 2, 3, 4, 5) Regresión Logística Ordinal

166
Análisis de datos por atributos
 El análisis de datos por atributos se organiza en
valores, categorías o grupos dicotómicos

 Las decisiones incluyen: si / no, pasa / no pasa,


bueno / malo, pobre/justo/bueno/superior/excelente,
etc.

 Entre los modelos no lineales de regresión usados se


tienen: regresión logística, regresión logit y regresión
probit

167
Análisis de datos por atributos
 Regresión logística
 Relaciona variables independientes categóricas a una
variable dependiente (Y). Minitab incluye los modelos
binario, ordinal y nominal

 Regresión logit
 Es subconjunto del modelo log-lineal. Tiene solo una
variable dependiente, usa determinaciones de
probabilidad o tasa de probabilidad

168
Análisis de datos por atributos
 Regresión probit
 Es similar a la prueba de vida acelerada, la unidad se
somete a esfuerzo con la respuesta pasa/falla, bueno o
malo. Es una respuesta binaria en un tiempo de falla
futuro

169
Regresión logística o binaria
• En caso de información cualitativa es necesario
traducir las preferencias del cliente expresadas como
atributos a un intervalo de valores aceptables de
variables (Especificaciones).

170
Regresión logística o binaria
 Es similar a la regresión múltiple excepto que la
respuesta es binaria (si/no, bueno/malo, etc.) Sus
coeficientes se determinan por el método de máxima
verosimilitud

 Su función tiene forma de “S”, con valores máximos


de Cero y Uno.

Yi = 0, 1

171
Regresión logística o binaria
 La probabilidad de que el resultado esté en cierta
categoría es:

 El método de cálculo del coeficiente b es diferente


que en la regresión lineal

 Los coeficientes se determinan con la relación sig.:


P(evento )
 e B 0  B1 X 1  B2 X 2  ....  Bn X n
P (no evento )
172
Regresión logística
 Condiciones:
 Hay solo dos resultados posibles
 Hay solo un resultado por evento
 Los resultados son independientes estadísticamente
 Todos los predictores relevantes están en el modelo
 Es mutuamente exclusivo y colectivamente exhaustivo
 Los tamaños de muestra son mayores que para la
regresión múltiple

 Los efectos positivos se obtienen con b1>1 y los


negativos con b1 e 0 a 1

173
Regresión logística
Relación con ajuste pobre

Relación con buen ajuste

174
Regresión logística - Procedimiento
 Definir el atributo a “traducir” (“y”)
 Definir la variable apropiada para el atributo (“x”)
 Definir el modelo matemático a probar
 Determinar los defectos que está dispuesto a
aceptar
 Recolecte información de “x” vs “y”. Asigne 1 si falla
y 0 si es aceptable.
 Analice la información mediante Regresión Logística
Binaria

175
Regresión logística- Procedimiento

176
Regresión logística - Procedimiento

Coeficientes del modelo

P-Value de Deviance

 Observe el P-Value de “Deviance” en la Sesión, debe


de ser grande (P >0.10)
 Obtenga los coeficientes del modelo (De la Sesión)

177
Regresión logística - Procedimiento
• Construya el modelo de regresión para la
probabilidad de falla estará dado por :

P(Falla) =
e
b +b x +....
0 1 1

Donde :
1+e
b +b x +....
0
b , b , ... = Coeficientes del modelo
1 1
0 1

• Identifique el(los) valor(es) de “x” que le generarán


como máximo la cantidad de defectos que usted
está dispuesto a aceptar [4]

178
Ejemplo de riesgo de paro cardiaco
Logistic Regression Table
Odds 95% CI
Predictor Coef SE Coef Z P Ratio Lower Upper
Constant -1.98717 1.67930 -1.18 0.237
Fuma
Si -1.19297 0.552980 -2.16 0.031 0.30 0.10 0.90
Peso 0.0250226 0.0122551 2.04 0.041 1.03 1.00 1.05

 Para Fuma, el coeficiente negativo de -1.193 y la tasa de


posibilidades de 0.30, indica que quien fuma, tiende a tener una
tasa de pulso más alta que los sujetos que no fuman. Si los
sujetos tienen el mismo peso, las posibilidades de que los
fumadores tengan un pulso bajo sea sólo del 30% de las
posibilidades de que los no fumadores tengan un pulso bajo.
179
Regresión logística ordinal
• Cuando la respuesta ó CTS es de tipo ordinal (Varias
categorías de respuesta como “totalmente de
acuerdo”, “de acuerdo”, “en desacuerdo” y
“totalmente en desacuerdo”) y el Factor ó CTQ es
de naturaleza continua, entonces, para definir
Especificaciones, la herramienta a utilizar es la
Regresión Logística Ordinal.

180
Regresión logística ordinal -
Procedimiento
 Defina la variable de respuesta a “traducir” (“y” ó
CTS)
 Defina el CTQ (“x”) ó variable a relacionar con el CTS
 Defina el modelo matemático a probar
 Determine los defectos que está dispuesto a aceptar
en la categoría de interés
 Recolecte información de “x” vs “y”
 Analice la información mediante Regresión Logística
Ordinal

181
Regresión logística ordinal -
Procedimiento
 Stat > Regression > Ordinal Logistic Regression
 Seleccione la respuesta (“y”)
 Seleccione los términos que estima tiene el modelo
[3]

Constantes y
Coeficientes
del modelo

182
Regresión logística ordinal -
Procedimiento
 Observe el P-Value de “Deviance” en la Sesión, debe
de ser grande (P >0.10)

 Obtenga las constantes y coeficientes del modelo


(De la Sesión)

 Construya los modelos de regresión para la


probabilidad acumulada por categoría

183
Regresión logística ordinal -
Procedimiento

Pacumulada hasta= e Ki+b1x1+ b2x2.... Donde :


Ki = Constante de la categoría i

categoría i 1+ e Ki+b1x1+ b2x2.... b1, b2, ... = Coeficientes del modelo

Constantes y
Coeficientes
del modelo

• Identifique el(los) valor(es) de “x” que le generarán como máximo la


cantidad de defectos que usted está dispuesto a aceptar en la
categoría de interés [4]
184
Regresión logística ordinal -
Procedimiento
 Una vez que se tienen establecidos los CTQs con los
que se medirá el desempeño del producto, es
necesario indicar las Especificaciones de los mismos
Parámetros

Expectativas
de Diseño

Matriz de

Importan.
CTQs
Diseño

Producto

(CTS’s)
(DPs)

Tipo
(General) Especificaciones Clientes
LIE LSE Otra
Usuarios
Finales

Producto
(Específico)

185
Análisis Logit
 Usa razones para determinar que tanta posibilidad
tiene una observación de pernecer a un grupo que a
otro.
 Una posibilidad de 0.8 de estar en el grupo A se
puede expresar como una tasa de posibilidades de
4:1 ( que es p/(1-p)), cuyo logaritmo es el logit.

 La probabilidad para un valor L está dado por la


ecuación

186
Análisis Logit - ejemplo
50 estudiantes tomaron un examen, donde solo 27 pasaron.
¿Cuáles son las posibilidades de pasar?
Posibilidades = P/(1-P) = 0.54/0.46 = 1.17 o 1.71:1

Un estudiante que estudia 80 horas tiene un 54.5% de pasar,


¿cuáles son las posibilidades?
Posibilidades = 0.545/(1-0.545) = 1.198 o 1.198:1

Logit = ln(p/(1-p)) = ln(1.189) = 0.1809 y despejando al


Exp(b1) = exp(0.1082) = 1.11 que es la tasa de pasar a otro nivel

187
Análisis Probit
 Es similar a las pruebas de vida acelerada y análisis
de sobrevivencia. Un artículo sujeto a esfuerzo puede
fallar o sobrevivir. El modelo probit tiene un valor
esperado de 0 y una varianza de 1.

 Requiere tamaños de muestra muy grandes para


diferenciarse del modelo logit

 Los coeficientes b del modelo logit difieren del probit


en 1.814 con: bl = -1.1814 bp
188
VI.B Pruebas de hipótesis

189
VI.B Pruebas de hipótesis
1. Conceptos fundamentales
2. Estimación puntual y por intervalo
3. Pruebas para medias, varianzas y proporciones
4. Pruebas comparativas para varianzas, medias y prop.

5. Bondad de ajustes
6. Análisis de varianza (ANOVA)
7. Tablas de contingencia
8. Pruebas no paramétricas

190
VI.B.1 Conceptos
fundamentales

191
Análisis Estadístico
En CADA prueba estadística, se comparan algunos valores
observados a algunos esperados u otro valor observado
comparando estimaciones de parámetros (media, desviación
estándar, varianza)

Estas estimaciones de los VERDADEROS parámetros son


obtenidos usando una muestra de datos y calculando los
ESTADÏSTICOS...

La capacidad para detectar un diferencia entre lo que es


observado y lo que es esperado depende del desarrollo de la
muestra de datos

Incrementando el tamaño de la muestra mejora la estimación y tu


confianza en las conclusiones estadísticas. 192
Conceptos fundamentales
 Hipótesis nula Ho
 Es la hipótesis o afirmación a ser probada

 Puede ser por ejemplo , , , = 5

 Sólo puede ser rechazada o no rechazada

 Hipótesis alterna Ha
 Es la hipótesis que se acepta como verdadera cuando se

rechaza Ho, es su complemento


 Puede ser por ejemplo  = 5 para prueba de dos colas

  < 5 para prueba de cola izquierda

  > 5 para prueba de cola derecha

 Esta hipótesis se acepta cuando se rechaza Ho

193
Conceptos fundamentales
 Ejemplos:
 Se está investigando si una semilla modificada
proporciona una mayor rendimiento por hectárea, la
hipótesis nula de dos colas asumirá que los
rendimientos no cambian Ho: Ya = Yb

 Se trata de probar si el promedio del proceso A es


mayor que el promedio del proceso B. La hipótesis nula
de cola derecha establecerá que el proceso A es <=
Proceso B. O sea Ho: A <= B.

194
Conceptos fundamentales
 Estadístico de prueba
 Para probar la hipótesis nula se calcula un estadístico
de prueba con la información de la muestra el cual se
compara a un valor crítico apropiado. De esta forma se
toma una decisión sobre rechazar o no rechazar la Ho

 Error tipo I (alfa = nivel de significancia, normal=.05)


 Se comete al rechazar la Ho cuando en realidad es
verdadera. También se denomina riesgo del productor

 Error tipo II (beta )


 Se comete cuando no se rechaza la hipótesis nula
siendo en realidad falsa. Es el riesgo del consumidor
195
Conceptos fundamentales
 Tipos de errores
 Se asume que un valor pequeño para  es deseable, sin

embargo esto incrementa el riesgo .


 Para un mismo tamaño de muestra n ambos varían

inversamente
 Incrementando el tamaño de muestra se pueden reducir ambos

riesgos.
Decisión realizada Ho en realidad es Ho en realidad es
Verdadera falsa
No hay evidencia para p = 1- p=
rechazar Ho Decisión correcta Error tipo II
Rechazar Ho p= p=1-
Error tipo I Decisión correcta
196
Conceptos fundamentales
 Pruebas de dos colas
 Si la Ho: , , , = cte. que un valor poblacional,
entonces el riesgo alfa se reparte en ambos extremos
de la distribución. Por ejemplo si Ho = 10 se tiene:

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

197
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: , , ,  >= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola izquierda de
la distribución. Por ejemplo si Ho: >= 10 y Ha: < 10
se tiene una prueba de cola izquierda:

P(Z <= - Zexcel ) = alfa

198
Conceptos fundamentales
 Pruebas de una cola
 Si la Ho: , , , <= Cte. que un valor poblacional,
entonces el riesgo alfa se coloca en la cola derecha de
la distribución. Por ejemplo si Ho: <= 10 y Ha:  >
10 se tiene una prueba de cola derecha:

P(Z>= + Zexcel ) = alfa

199
Conceptos fundamentales
 Tamaño de muestra requerido
 Normalmente se determina el error alfa y beta deseado
y después se calcula el tamaño de muestra necesario
para obtener el intervalo de confianza.

 El tamaño de muestra (n) necesario para la prueba


de hipótesis depende de:
 El riesgo deseado tipo I alfa y tipo II Beta
 El valor mínimo a ser detectado entre las medias de la
población (Mu – Mu0)
 La variación en la característica que se mide (S o
sigma) 200
Conceptos fundamentales
 El Tamaño de muestra requerido en función del error
máximo E o Delta P intervalo proporcional esperado
se determina como sigue:

Z 2 / 2 2
n
E2
Z 2 / 2 ( p )(1  p )
n
( p ) 2 Z 2 / 2  2
n 
(X   )2
Z 2 / 2 (  )( 1   )
n 
( p   )2 201
Conceptos fundamentales
 Ejemplo:
 ¿Cuál es el tamaño de muestra mínimo que al 95% de
nivel de confianza (Z=1.96) confirma la significancia de
una corrida en la media mayor a 4 toneladas/hora (E),
si la desviación estándar (sigma) es de 20 toneladas?

n = (1.96^2)(20^2)/(4)^2 = 96

Obtener 96 valores de rendimiento por hora y determinar


el promedio, si se desvía por más de 4 toneladas, ya
ha ocurrido un cambio significativo al 95% de nivel de
confianza
202
Efecto del tamaño de muestra

203
Efecto del tamaño de muestra

204
Efecto del tamaño de muestra

205
Efecto del tamaño de muestra

206
Potencia de la prueba
 La potencia de una prueba estadística es su habilidad
para detectar una diferencia crítica

Potencia  1  
 Si Beta = 0.1 la potencia es del 90%

 Delta se puede normalizar dividiéndolo entre la


desviación estándar  y se expresa en un cierto

número de  (1 , 1.5  )
207
Potencia de la prueba
 La potencia de la prueba es la probabilidad de de
rechazar correctamente la hipótesis nula siendo que
en realidad es falsa.
 El análisis de potencia puede ayudar a contestar
preguntas como:

 ¿Cuántas muestras se deben tomar para el análisis?


 ¿Es suficiente el tamaño de muestra?
 ¿Qué tan grande es la diferencia que la prueba puede
detectar?
 ¿Son realmente valiosos los resultados de la prueba?

208
Potencia de la prueba
 Para estimar la potencia, Minitab requiere de dos de
los siguientes parámetros:

 Tamaños de muestra
 Diferencias - un corrimiento significativo de la media
que se desea detectar
 Valores de potencia - La probabilidad deseada de
rechazar Ho cuando es falsa

209
Considerando la potencia de prueba

210
VI.2 Significancia estadística
vs práctica

211
Estimación de riesgos

212
Pruebas de Minitab
 Permite hacer las siguientes pruebas:
 Prueba z de una muestra
 Prueba t de una muestra
 Prueba t de dos muestras
 Prueba de 1 proporción
 Prueba de 2 proporciones

 ANOVA
 Diseños factoriales de dos niveles
 Diseños de Packett Burman

213
Calculo manual

214
Calculo manual

215
VI.3 Tamaño de muestra

216
Calculo manual de tamaño de
muestra

217
Calculo manual de tamaño de
muestra – Pruebas de una cola

218
Calculo manual de tamaño de
muestra – Pruebas de una cola

219
Ejemplo con prueba de una media t
 Ejemplo: Se tiene una población normal con media de 365 y
límites de especificación de 360 y 370. Si la media se desplaza
2.5 gramos por arriba de la media, el número de defectos sería
inaceptable, la desviación estándar histórica es de 2.403:
CORRIDA DE 2.5 GRS. EN PROMEDIO
Ha: Corrida
0.18 Ho: 367.5 Variable
Meta LIE 370
O riginal
0.16 LIE 360 C orrida
365
0.14

0.12

0.10
Y-Data

0.08

0.06

0.04

0.02

0.00

355 360 365 370 375


C1

220
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t
Completar el diálogo como sigue:

221
Ejemplo con prueba de una media t
Los resultados se muestran a continuación:
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403

Sample Se tiene un 53.76% de Potencia para detectar


Difference Size Power una diferencia de 2.5 si se usan 6 muestras
2.5 6 0.537662 O sea que hay una probabilidad del 46.24%
que no se rechaze Ho y se concluya que no
hay diferencia significativa.
¿cuántas muestras se requieren para tener un 80% de probabilidad de detectar
el corrimiento, y para 85%, 90% y 95%?

222
Ejemplo con prueba de una media t
Stat > Power and Sample Size > 1 - Sample t

Se cambia este parámetro

Los resultados se muestran a continuación:

Sample Target
Difference Size Power Actual Power
2.5 10 0.80 0.832695
2.5 11 0.85 0.873928
2.5 12 0.90 0.905836
2.5 15 0.95 0.962487

Si la potencia es demasiado alta por decir 99% se pueden detectar diferencias


que realmente no son significativas. 223
Ejemplo con prueba de 2 medias t
Ejemplo: La potencia de una prueba depende de la diferencia que se quiera detectar
respecto a la desviación estándar, para una sigma poner 1 en diferencia y desviación
estándar, con valores deseados de Potencia de 0.8 y 0.9.
Stat > Power and Sample Size > 2 - Sample t
Power and Sample Size 2-Sample t Test

Testing mean 1 = mean 2 (versus not =)


Calculating power for mean 1 = mean 2 + difference
Alpha = 0.05 Assumed standard deviation = 1
Sample Target
Difference Size Power Actual Power
1 17 0.8 0.807037
1 23 0.9 0.912498
Se requieren tamaños de muestra de entre 17 y 23
224
Ejemplo con prueba de 1 proporción
Para estimar la potencia, Minitab requiere de dos de los siguientes parámetros:
* Tamaños de muestra
* La proporción - una proporción que se desea detectar con alta probabilidad
* Valores de potencia - La probabilidad deseada de rechazar Ho cuando es falsa
Suponiendo que se desea detectar una proporción de 0.04 con el 0.8 y 0.9 de niveles
de Potencia:

Proporción que se desea detectar con alta


probabilidad (0.80, 0.90)

Es la proporción de la Hipótesis nula

225
Ejemplo con prueba de 1 proporción
Test for One Proportion
Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample Target
Proportion Size Power Actual Power
0.04 391 0.8 0.800388
0.04 580 0.9 0.900226
Si se desea saber la Potencia si se utiliza un tamaño de muestra de 500 se tiene:
Stat > Power and Sample Size > 2 - Sample t
Sample sizes = 500 Alternative values of p = 0.04
Options: Greater Than
Significance Level = 0.05

Test for One Proportion


Testing proportion = 0.02 (versus > 0.02)
Alpha = 0.05
Alternative Sample
Proportion Size Power
0.04 500 0.865861
Por tanto con un tamaño de muestra de 500, la potencia de la prueba para detectar
un corrimiento de 2% a 4% es del 86.6%
226
Ejercicios
Calcular los tamaños de muestra necesarios para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, b=0.1 y 0.2, d = 1.5s
b. 1-muestra t à a=0.05, b=0.1 y 0.2, d = 1.5s
c. 1-muestra t à a=0.01, b=0.05, d = 0.5s y 1.0s
d. 2-muestras t à a=0.05, b=0.1, d = 1.5s y 2.0s
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-muestra Z à a=0.05, d = 0.5s, n = 25, 35
b. 1-muestra t à a=0.05, d = 1.0s, n = 10, 20
c. 1-muestra t à a=0.01, d = 1.0s, n = 10, 25
d. 2-muestras t à a=0.05, d = 0.5s, n = 10, 25, 50, 75, 100
227
Ejercicios
Calcular el tamaño de muestra requerido para los siguientes
escenarios (usar pruebas de dos colas):
a. 1-proporción à a=0.05, b=0.1 & 0.2, P0 = 0.5, PA = 0.6
b. 1-proporción à a=0.01, b=0.1 & 0.2, P0 = 0.8, PA = 0.9
c. 2-proporción à a=0.05, b=0.1, P0 = 0.5, PA = 0.6, 0.8
d. 2-proporciones à a=0.01, b=0.1, P0 = 0.8, PA = 0.85, 0.95
2. Calcular la potencia de la prueba para los siguientes escenarios
(usar pruebas de dos colas):
a. 1-proporción à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
b. 1-proporción à a=0.01, P0 = 0.9, PA = 0.95, n = 400, 500
c. 2-proporciones à a=0.05, P0 = 0.5, PA = 0.6, n = 250, 350
d. 2-proporciones à a=0.01, P0 = 0.9, PA = 0.95, n = =400, 500
228
229
230
VI.B.4 Estimación puntual
y por intervalo

231
Estimación puntual y por
intervalo
 Las medias o desviaciones estándar calculadas de una muestra
se denominan ESTADÍSTICOS, podrían ser consideradas como
un punto estimado de la media y desviación estándar real de
población o de los PARAMETROS.

 ¿Qué pasa si no deseamos una estimación puntual como media


basada en una muestra, qué otra cosa podríamos obtener
como margen, algún tipo de error?

“Un Intervalo de Confianza”

232
Intervalo de confianza

Error de estimación

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

Intervalo de confianza donde


se encuentra el parámetro con
un NC =1-a
233
Estimación puntual y por
intervalo
 ¿Cómo obtenemos un intervalo de confianza?

Estimación puntual + error de estimación

 ¿De dónde viene el error de estimación?

Desv. estándar X multiplicador de nivel de confianza deseado Z/2

Por Ejemplo: Si la media de la muestra es 100 y la desviación


estándar es 10, el intervalo de confianza al 95% donde se
encuentra la media para una distribución normal es:

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z0.025

234
Estimación puntual y por
intervalo
95% de Nivel de Confianza significa que sólo tenemos un 5% de
oportunidad de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z


veremos que para un área de 0.025, corresponde a una Z de 1.960.
C. I. Multiplicador Z/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaños de muestra >30, o  conocida usar la distribución Normal
Para muestras de menor tamaño, o  desconocida usar la distribución
235t
Estimación puntual y por
intervalo

 para .n 30  X  Z 
2 n

 para .n 30  X  t  ; con n-1 gl.
2 n
( n  1) s 2 ( n  1) s 2
 2

2
 2

, n 1 1 , n 1
2 2

p (1  p )
  p  Z
2
n
236
Para n grande el IC es pequeño

237
Para n grande el IC es pequeño

238
Ejemplo
 Dadas las siguientes resistencias a la tensión: 28.7,
27.9, 29.2 y 26.5 psi

Estimar la media puntual


X media = 28.08 con S = 1.02

Estimar el intervalo de confianza para un nivel de


confianza del 95% (t = 3.182 con n-1=3 grados de
libertad)
Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)

239
Ejemplos para la media con
Distribución normal Z

Z 1. El peso promedio de una muestra de 50 bultos de productos


Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo
de confianza al NC del 95% y al 99% donde se encuentra la media del
proceso (poblacional). Alfa = 1 - NC
2. Un intervalo de confianza del 90% para estimar la ganancia
promedio del peso de ratones de laboratorio oscila entre 0.93 y 1.73
onzas. ¿Cuál es el valor de Z?.
3. 100 latas de 16 onzas de salsa de tomate tienen una media de
Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de
confianza del 95%, las latas parecen estar llenas con 16 onzas?.
4. Una muestra de 16 soluciones tienen un peso promedio de 16.6
onzas con S = 3.63. Se rechaza la solución si el peso promedio de
todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de
nivel de confianza?.

240
Ejemplos para la media y varianza
con Distribución t

t 5. 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál


es el intervalo donde se encuentra la media y varianza del lote
para un 90% de nivel de confianza?. Grados libertad=20 -1 =19

6. Una muestra de 25 productos tienen un peso promedio de 23.87


grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de
confianza para la media y varianza a un nivel de confianza del
95 y del 98% del peso de productos del lote completo?.
7. Los pesos de 25 paquetes enviados a través de UPS tuvieron una
media de 3.7 libras y una desviación estándar de 1.2 libras.
Hallar el intervalo de confianza del 95% para estimar el peso
promedio y la varianza de todos los paquetes. Los pesos de los
paquetes se distribuyen normalmente.

241
Ejemplos para proporciones con
Distribución Z

Z 8. De 814 encuestados 562 contestaron en forma afirmativa.


¿Cuál es el intervalo de confianza para un 90% de nivel de
confianza?

9. En una encuesta a 673 tiendas, 521 reportaron problemas de


robo por los empleados ¿Se puede concluir con un 99% de nivel
de confianza que el 78% se encuentra en el intervalo de
confianza. ?

242
Instrucciones con Minitab
Intervalo de confianza para la media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

En Options:

Indicar el Confidence level -- 90, 95 o 99%

OK

243
Instrucciones con Minitab
Intervalo de confianza para proporción

Stat > Basic Statistics > 1-Proportion

Seleccionar Summarized Data


Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Seleccionar Use test and interval based in normal distribution

244
VI.B.5 Pruebas de hipótesis para
medias, varianzas y proporciones

245
Elementos de una
Prueba de Hipótesis

Prueba Estadística- Procedimiento para decidir no rechazar Ho


aceptando Ha o rechazar Ho.

Hipótesis Nula (Ho) - Usualmente es una afirmación representando


una situación “status quo”. Generalmente deseamos rechazar la
hipótesis nula.

Hipótesis Alterna (Ha) - Es lo que aceptamos si podemos rechazar


la hipótesis nula. Ha es lo que queremos probar.

246
Elementos de una
Prueba de Hipótesis

Estadístico de prueba: Calculado con datos de la muestra (Z, t, X2


or F).

Región de Rechazo Indica los valores de la prueba estadística


para que podamos rechazar la Hipótesis nula (Ho). Esta región
esta basada en un riesgo  deseado, normalmente 0.05 o 5%.

247
Pasos en la Prueba de Hipótesis
1. Definir el Problema - Problema Práctico

2. Señalar los Objetivos - Problema Estadístico

3. Determinar tipo de datos - Atributo o Variable

4. Si son datos Variables - Prueba de Normalidad

248
Pasos en la Prueba de Hipótesis
5. Establecer las Hipótesis
- Hipótesis Nula (Ho) - Siempre tiene el signo =, , 

Ho : , , , ,  parametro de la hipotesis


2

- Hipótesis Alterna (Ha) – Tiene signos , > o <.

Ha :  , 2 ,  , ,  parametro de la hipotesis

El signo de la hipótesis alterna indica el tipo de prueba a usar


249
Elementos de una Prueba de Hipótesis
Pruebas de Hipótesis de dos colas:
Ho: a = b Región de Región de
Ha: a  b Rechazo Rechazo

-Z 0 Z
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b Región de
Rechazo

0 Z
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b Región de
Rechazo

-Z 0 Z
250
Pasos en la Prueba de Hipótesis
6. Seleccionar el nivel de Alfa (normalmente 0.05 o 5%) o el
nivel de confianza NC = 1 - alfa

7. Establecer el tamaño de la muestra, >= 10.

8.Desarrollar el Plan de Muestreo

9.Seleccionar Muestras y Obtener Datos

10. Decidir la prueba estadística apropiada y calcular el


estadístico de prueba (Z, t, X2 or F) a partir de los datos.
251
Estadísticos para medias,
varianzas y proporciones
X 
Z  ;Una.media; n  30;   conocida
/ n
X 
t ;Una.media; n  30;   desconocida
S/ n
S12
F  2 ; DF  n1  1, n2  1; prueba.dos. var ianzas
S2
X1  X 2
t ; dos.medias;  ' s  desconocidas. pero. 
1 1
Sp / 
n1 n2
( n1  1) s12  ( n2  1) s22
Sp  ; DF  n1  n2  2
n1  n2  2
X1  X 2
t ; dos.medias;  ' s  desconocidas.diferentes
2 2
s s
1
 2
n1 n2
DF  formula.especial 252
Estadísticos para medias,
varianzas y proporciones
 Para el caso de muestras pareadas se calculan las
diferencias d individuales como sigue:

d
t ; Pares.de.medias; d i . para.cada. par
Sd / n
( n  1) S 2
X 2
 ; DF  ( n  1); prueba.una.v ar ianza
 2

(O  E ) 2
X 2
 ; DF  ( r  1)(c  1); bondad .ajuste
E

253
Pasos en la Prueba de Hipótesis
11. Obtener el estadístico correspondiente de tablas o Excel.

12.Determinar la probabilidad de que el estadístico de prueba


calculado ocurre al azar.

13.Comparar el estadístico calculado con el de tablas y ver si


cae en la región de rechazo o ver si la probabilidad es menor a
alfa, rechaze Ho y acepte Ha. En caso contrario no rechaze Ho.

14.Con los resultados interprete una conclusión estadística


para la solución práctica.
254
Estadístico
Prueba de Hipótesis Calculado con
Pruebas de Hipótesis de dos colas: Datos de la muestra
Ho: a = b Región de Región de
Ha: a  b Rechazo Rechazo

-Z 0 Z
Pruebas de Hipótesis de cola derecha:
Ho: a  b
Ha: a > b Región de
Rechazo

0 Z
Pruebas de Hipótesis cola izquierda:
Ho: a  b
Ha: a < b Región de
Rechazo

-Z 0 Z
255
Prueba de hipótesis para la varianza
 Las varianzas de la población se ditribuyen de
acuerdo a la distribución Chi Cuadrada. Por tanto las
inferencias acerca de la varianza poblacional se
basarán en este estadístico

 La distribución Chi Cuadrada se utiliza en:


Caso I. Comparación de varianzas cuando la varianza de
la población es conocida

Caso II. Comparando frecuencias observadas y esperadas


de resultados de pruebas cuando no hay una varianza
de la población definida (datos por atributos)
256
Prueba de hipótesis para la varianza
 Las pruebas de hipótesis para comparar una varianza
poblacional a un cierto valor constante 0, si la
población sigue la distribución normal es:

 Con el estadístico Chi Cuadrada con n-1 grados de


libertad

257
Prueba de hipótesis para la varianza

2.17

Ejemplo: ¿El material muestra una variación (sigma) en la


resistencia a la tensión menor o igual a 15 psi con 95% de
confianza?. En una muestra de 8 piezas se obtuvo una S = 8psi.

X^2c =(7)(8)^2/(15)^2 = 1.99


Como La Chi calculada es menor a la Chi de Excel de 2.17 se debe
rechazar la hipótesis nula. Si hay decremento en la resistencia
258
Prueba de hipótesis para atributos
Ejemplo: Un supervisor quiere evaluar la habilidad de 3 inspectores para detectar
radios en el equipaje en un aeropuerto.
¿Hay diferencias significativas para un 95% de confianza?

Valores Inspector Inspector 2 Inspector 3 Total por


observados O 1 tratamiento
Radios 27 25 22 74
detectados
Radios no 3 5 8 16
detectados
Total de la 30 30 30 90
muestra
259
Prueba de hipótesis para atributos
Ho: p1 = p2 = p3
Ha: p1  p2  p3
Grados de libertad = (No. de columnas -1)*(No. renglones -1)
Las frecuencias esperadas son: (Total columna x Total renglón)

Valores Inspector Inspector 2 Inspector 3 Total por


esperados E 1 tratamiento
Radios 24.67 24.67 24.67 74
detectados
Radios no 5.33 5.33 5.33 16
detectados
Total de la 30 30 30 90
muestra
260
Prueba de hipótesis para atributos
El estadístico Chi Cuadrado en este caso es:

El estadístico Chi Cuadrada de alfa = 0.05 para 4 grados de libertad es 5.99.


El estadístico Chi Cuadrada calculada es menor que Chi de alfa, por lo que no se rechaza Ho y las habilidades son similares

5.99

261
Ejemplo de Prueba de hipótesis para la media
Para una muestra grande (n>30)probar la hipótesis de una media u
1.) Ho: 
2.) Ha: 
3.) Calcular el estadístico de prueba
4.) Establecer la región de rechazo
Las regiones de rechazo para prueba de 2 colas: -Z Z

Zcalc= s
n

Región de Región de
Rechazo Rechazo
0

-Z 

Si el valor del estadístico de prueba cae en la región de rechazo


rechazaremos Ho de otra manera no podemos rechazar Ho.
262
Prueba de hipótesis de una población
para muestras grandes con Z
¿Parecería ser correcta la afirmación de que se mantiene el precio promedio de las computadoras en $2,100?
Probarlo a un 5% de nivel de significancia
Datos
Minoristas n 64 media mu = 2100
Precio prom. X 2251
Desv. Estándar s 812 (Alfa = 0.05
Paso 1. Establecimiento de hipótesis
Ho: uC = 2100 Se inicia con el planteamiento de la hipótesis nula
Ha: uC <> 2100 Por tanto se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc
X   HIPOTESIS .NULA 151 = > Zc = 1.48768473
Zc 
s
101.5 Error estándar
n
Como el valor de Zc es positivo se comparará contra de Zexcel (1-alfa/2) positivo
Paso 3. Determinar la Ze de Excel o de tablas para el valor de probabilidad (Alfa / 2):
Ze ( 0.025 ) = 1.95996398 DIST.NORM.STAND.INV.( -0.025 ) 263
Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2

Zexcel ( #¡REF! ) Zexcel ( -0.025 )


-1.95996398 1.959963985
Zc = 1.487684729
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para RECHAZAR Ho
Se concluye que el precio promedio no es diferente de $2,100
O Como el valor P = 0.068 correspondiente a la Z calculada Zc es mayor
que el valor de Alfa / 2 = 0.025, también nos da el criterio
para NO RECHAZAR la Ho
Paso 5. El Intervalo de confianza para la media poblacional (1-Alfa = 0.95 Porciento)
al nivel de confianza 1-Alfa

s
IC. para.estimar.  X  Z Error estándar
Z alfa/2
101.5
1.95996398
2 n
Intervalo de confianza 2251  198.936344
El intervalo de confianza incluye a la media de la hipótesis
por tanto no se rechaza la Ho. 2052.064 <=  <= ### ) 264
Prueba de hipótesis de una población
para muestras pequeñas con t
Se piensa que las ventas promedio de $5,775 se han incrementado gracias a la campaña publicitaria
Probar esta afirmación a un nivel de significancia alfa de 1%
Se inicia con el planteamiento de la hipótesis Alterna
Datos
Semanas n 15 media mu = 5775
Ventas prom X 6012
Desv. Estándar s 977 (Alfa = 0.01 (1-Alfa = 0.99
(Alfa/2 = 0.005 (1-Alfa/2 = 0.995
Paso 1. Establecimiento de hipótesis

Ho: uC <= 5775


Ha: uV > 5775 Se trata de una prueba de cola derecha
Paso 2. Cálculo del estadístico de prueba tc

X   HIPOTESIS 237 = > tc = 0.93950568


tc  . NULA
s 252.2603153 Error estándar
NOTA:En excel poner 2alfa
n para obtener t de alfa
Como el valor de tc es positivo se comparará contra de t excel (1- alfa) positivo
Paso 3. Determinar la te de Excel o de tablas para Alfa 0.01

te ( 0.99 2.62449406 DIST.T.INV( 0.02 , gl. 14 )


Gl=14; 265
Paso 4. Comparando los valores tc calculado contra t excel se tiene

P(t >= + t excel ) = alfa

texcel ( 0.02 gl. 14)


2.62449406
tc = 0.939505684 Valor p para tc es igual a
P(tc) = 0.368130427
Como tc es menor que texcel, no cae en el área de rechazo, p > Alfa
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la publicidad no ha tenido efecto en las ventas
O Como el valor de P para Zc es 0.368 mayor a Alfa = 0.05 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 99 Porciento)

s
IC . para.estimar .  X  t Error estándar 252.260315
2 n Z alfa/2 2.62449406
Como el intervalo de confianza Intervalo de confianza 6012  662.0557002
contiene a la media Hipótesis no se rechaza Ho 5349.94 <= 
<= 6674.06 )
266
Prueba de hipótesis
para una proporción con Z
El gerente de mercado considera que el 50% de sus clientes gasta menos de $10 en cada visita a la tienda.
¿Estás de acuerdo con esta afirmación a un nivel de significancia del 5%?
Se inicia con el planteamiento de la hipótesis nula
Datos
Clientes n 50 Proporción media = 0.5
30 gastaron p 0.6
menos de$10 (Alfa = 0.05 (1-Alfa = 0.95
(Alfa/2 = 0.025 (1-Alfa/2 = 0.975
Paso 1. Establecimiento de hipótesis

Ho :  c  0.5
Ha :  c  0.5 Se trata de una prueba de dos colas
Paso 2. Cálculo del estadístico de prueba Zc

p   HIPOTESIS . NULA 0.1 = > Zc = 1.41421356


Zc 
 HIP . NULA (1   HIP . NULA )
0.07071068 Error estándar
n

Como el valor de Zc es positivo se comparará contra de Zexcel (alfa/2) positivo

Paso 3. Determinar la Ze de Excel o de tablas para (1-Alfa/2 = 0.975

Ze ( (1-Alfa/2 = 1.95996398 DIST.NORM.STAND.INV.( 0.975 ) 267


Paso 4. Comparando los valores Zc calculado contra Zexcel se tiene

P(Z <= - Zexcel ) = alfa/2 P(Z>= Zexcel ) = alfa/2

Zexcel ( 0.025 ) Zexcel ( 0.975 )


-1.95996398 1.95996398

Zc = 1.41421356 Valor p para Zc es igual a


P(-Zc) = 0.07926984
Como Zc es menor que Zexcel, no cae en el área de rechazo, p > Alfa /2
y por tanto no hay suficiente evidencia para rechazar Ho y se concluye
que el porcentaje que compra menos de $10 no difiere del 50% de clientes
O Como el valor P de Zc es 0.079 mayor a Alfa/2 no se rechaza Ho
Paso 5. El Intervalo de confianza para la media poblacional al nivel (1-Alfa = 95 Porciento)

p (1  p ) Error estándar 0.07071068


IC . para.estimar .  p  Z  Z alfa/2 1.41421356
2 n
Intervalo de confianza 0.6  0.1
Como la media de p = 0.6 se encuentra
dentro del intervalo, no se rechaza Ho ( 0.5 <=   0.7 )
268
Instrucciones con Minitab para la
prueba de hipótesis de una media

Stat > Basic Statistics > 1-Sample Z, t

Variable -- Indicar la columna de los datos o Summarized Data

En caso de requerirse dar el valor de Sigma = dato

Proporcionar la Media de la hipótesis Test Mean

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

Indicar el signo de la hipótesis alterna: Less Than, Not equal,


Greater than
OK

269
Instrucciones con Minitab para la
prueba de hipótesis de una proporción

Stat > Basic Statistics > 1-Proportion


Seleccionar Summarized Data
Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Proportion Proporción de la hipótesis
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use test and interval based in normal distribution


OK

270
Pruebas de hipótesis para
comparación de varianzas, medias, y
proporciones

271
Prueba de Hipótesis
 Supongamos que tenemos muestras de dos reactores que
producen el mismo artículo. Se desea ver si hay diferencia
significativa en el rendimiento de “Reactor a Reactor”.
Reactor A Reactor B
89.7 84.7 Estadísticas Descriptivas
81.4 86.1
84.5 83.2 Variable Reactor N Media Desv.Std
84.8 91.9
87.3 86.3 Rendimiento A 10 84.24 2.90
79.7 79.3 B 10 85.54 3.65
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5
272
Prueba de Hipótesis
Pregunta Práctica: Existe diferencia entre los reactores?

Pregunta estadística ¿La media del Reactor B (85.54) es significativamente


diferente de la media del Reactor A (84.24)? O, su diferencia se da por
casualidad en una variación de día a día.

 Ho: Hipótesis Estadística:  Ha: Hipótesis Alterna: Las


No existe diferencia entre los medias de los Reactores son
Reactores diferentes.

Ho: a  b
Ha:  a   b

Se busca demostrar que los valores observados al parecer no


corresponden al mismo proceso, se trata de rechazar Ho.
273
Prueba de Hipótesis

 Hipótesis Estadística: No  Hipótesis Alterna: Cuando las


existe diferencia entre los medias de Reactores son
Reactores
diferentes. A esto se le llama
 Esto se llama Hipótesis Nula
Hipótesis Alterna (Ha)
(Ho)

Debemos demostrar que los valores que observamos al parecer no


corresponden al mismo proceso, que la Ho debe estar equivocada

274
¿Qué representa esto?

Reactor A Reactor B

B B B B B BB BB B
A AA AAAA A A
80.0 82.5 85.0 87.5 90.0 92.5
¿Representan los reactores dos procesos diferentes?

¿Representan los reactores un proceso básico?


275
Prueba F de dos varianzas
 Si se toman dos muestras de dos poblaciones normales con
varianzas iguales, la razón de sus varianzas crea una
distribución muestral F. Las hipótesis son las siguientes:

 El estadístico F se muestra a continuación donde S1 se


acostumbra tomar como la mayor

276
Prueba F de dos varianzas

 Sea S1 = 900 psi, n1 = 9, s2 = 300 psi, n2 = 7. A un 95% de nivel de


confianza se puede concluir que hay menor variación?

Ho: Varianza 1 <= Varianza 2 H1: Varianza 1 > Varianza 2


Grados de libertad para Var1 = 8 y para var 2 = 6

Falfa = F(0.05, 8, 6) = 4.15


Fcalculada = (900^2)/(300^2) = 9 >> Falfa, se rechaza Ho.
Hay evidencia suficiente para indicar que la variación ya se ha
reducido
277
Prueba de hipótesis de dos pob.
comparando varianzas con F
Se quiere comprobar si las varianzas de dos diferentes métodos de ensamble de CDs son diferentes en prod .
A un nivel de siginificancia del 5% ¿Qué se puede concluir?

Método 1 Método 2
No. De CDs n1 15 n2 17 Alfa/2 0.025
Desv. Estan. s1 5.4 X2 4.8
2 2
Varianza s1 29.16 s2 23.04

Paso 1. Establecimiento de hipótesis

Ho :  12   2
2

Ha :  12   2
2
Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba Fc


Grados de libertad
2
s 1.266 Numerador = n1 - 1 = 14
Fc  1
2 Denominador = n2 - 1 = 16
s
2

2
Tomamos a s1 como el mayor para comparar Fc contra Fexcel (1- Alfa/2)

Paso 3. Determinar la Fe de Excel o de tablas para Alfa/2 0.025

Fe (0.975) = 2.81701784 DIST.F.INV (0.025, 14,16) 278


Paso 4. Comparando los valores Fc calculado contra Fexcel (0.025) se tiene

f(F)

P(F>= + 2.81 ) = alfa/2

Fe(0.025) = 2.81701784

Fc = 1.266 Valor p para Fc es igual a


P(Fc) = 0.32259599
Como Fc es menor que Fexcel, no cae en el área de rechazo, p > Alfa / 2
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que la varianza de los dos métodos de ensamble no difieren
significativamente
279
Prueba de hipótesis de dos pob.
Comparando dos medias con Z
Investigar si el ambiente libre de tensiones mejoran el engorde y la calidad de la carne de vacas
Las varianzas poblacionales son desconocidas
Determinar el intervalo de confianza al 90% donde se encuentra la media. Alfa = 0.10

Vacas vacaciones Vacas normales


Vacas n1 50 n2 50
Peso promedio X1 112 X2 105.7
Desv. Estándar s1 32.3 s2 28.7

Paso 1. Establecimiento de hipótesis

Ho :  VV   VN Como el planteamiento es que las vacas de vacaciones


ganan más peso, se inicia planeando la Ha
Ha :  VV   VN
Paso 2. Cálculo del estadístico de prueba Zc

X1  X 2 6.3 = > Zc = 1.03099301


Zc 
s12 s 23 6.110613717

n1 n 2

Tomamos a X1 como el mayor para comparar Zc contra Ze positiva

Paso 3. Determinar la Ze de Excel o de tablas para una alfa de 0.1

Ze (0.90) = 1.28155157 DIST.NORM.STAND.INV (0.90) 280


Paso 4. Comparando los valores Zc calculado contra Zexcel (0.90) se tiene

P(Z>= + 1.28) = 0.90

Ze (0.90)= 1.28
Zc = 1.03099301 Valor p para Zc es igual a
P(-Zc) = 0.149402368
p > Alfa
Como Zc es menor que Zexcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia entre vacas de vacaciones y normales
Paso adicional. El Intervalo de confianza del 90% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:

s12 s 22
 X 1 X 2   = Error estándar 6.11061372
n1 n 2 Z (alfa/2) = 1.64485363

( X 1  X 2 )  Z  / 2 s X 1 X 2 = Intervalo de confianza
6.3 + - 10.05106514
La diferencia es del orden de cero,es decir ( -3.75107 < = u < = 16.3511 )
281
Prueba de dos medias
muestras pequeñas

Sigmas descono-
cidas e iguales

Sigmas desconocidas
y desiguales 282
Prueba de hipótesis de dos pob.
Comparando dos medias con t
Investigar si hay diferencia en los promedios de las ventas diarias de dos tiendas
Las varianzas de las dos poblaciones son iguales pero desconocidas  1   2
2 2

Determinar el intervalo de confianza al 99% donde se encuentra la media (alfa = 0.01)


Tienda 1 Tienda 2
Semanas n1 12 n2 15
Ventas promedio X1 125.4 X2 117.2
Desv. Estandar s1 34.5 s2 21.5

Paso 1. Establecimiento de hipótesis

Ho :  T 1   T 2
Ha :  T 1   T 2 Por tanto se trata de una prueba de dos colas

Paso 2. Cálculo del estadístico de prueba tc

2
s12 (n1  1)  s 22 (n 2  1) 19564.25 Sp = 782.57
s 
2
p
n1  n 2  2 25

X1  X 2 8.2 = > tc = 0.75684444


tc 
s 2p s 3p 10.8344589

n1 n2
Tomamos a X1 como el mayor para comparar tc contra te positiva
Si se toma a X1 como la media menor se debe comparar Zc contra -Ze

Paso 3. Determinar la te de Excel o de tablas para una alfa de 0.01 que corresponde a alfa/2 = 0.005
Se tienen n1 + n2 - 2 grados de libertad o sean 25
te (0.01) = 2.78743581 DIST.T.INV (0.01, 25)
283
Asi es para dos colas
Paso 4. Comparando los valores tc calculado contra texcel (0.01) se tiene

P(t<=-2.787 ) = alfa/2 P(t>=2.787 ) = alfa/2

te(0.01,25) = -2.787 te(0.01, 25) = 2.787


Valor p para tc es igual a
tc = 0.7568 P(tc) = 0.46025521
p > Alfa / 2
Como tc es menor que texcel, no cae en el área de rechazo,
y por tanto no hay suficiente evidencia para rechazar Ho
Se concluye que no hay diferencia sig. En las ventas de las dos tiendas
Paso adicional. El Intervalo de confianza del 99% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
s 2p s 2p
 = Error estándar 10.8344589
n1 n2
s 2p s 2p = Intervalo de confianza (8.2 + - 2.787*10.83)
( X 1  X 2 )  t / 2 
n1 n 2
Se observa una diferencia positiva sin embargo el cero está incluido ( -21.98 <= u <= 38.38)
284
Prueba de hipótesis de dos pob.
Comparando datos pareados con t
Las muestras pareadas de tamaño 25 reportaron una diferencia media de 45.2 y una desviación
estándar de las diferencias de 21.6. Pruebe la igualdad de medias a un nivel del 5%.
Paso 1. Establecimiento de Hipótesis
Ho : 1   2
Ha : 1   2 Grados de libertad = No. de pares - 1
No. Pares de muestras n = 25
Paso 2. Se calcula el estadístico tc: Diferencia media = 45.2
Desv. Estándar de difs. = 21.6
Alfa 0.05
d gl = 24
tc  = 10.462963
sd
n
Paso 3. Se determina el valor crítico del estadístico t de Excel o tablas para Alfa / 2 0.025

t excel = 2.06389855 DISTR.T.INV(0.05, 24) Excel divide entre 2 colas


285
Paso 4. Comparando el estadístico tcalculado contra t excel (0.025, 24) se tiene:
tc = 10.462963

P(t<=-2.063 ) = alfa/2 P(t>=2.063 ) = alfa/2

te(0.025,24) = -2.063 te(0.025, 24) = 2.063


Valor p para tc es igual a
P(t > tc) = 0
p < Alfa / 2
Como tc es mayor que t excel, si cae en el área de rechazo,
y por tanto si hay suficiente evidencia para rechazar Ho y aceptar Ha
se concluye que si hay diferencia significativa entre las medias
Paso 5. El intervalo de confianza para las diferencias en medias pareadas es
t alfa/2 = 2.063
Error estándar = 0.864
Dif. Promedio = 45.2
sd
I .C. para. d  d  t / 2 45.2 +- 0.864
n
Se observa diferencia positiva significativa entre diferencia de medias 43.4176 <= dm < =46.9824
286
Prueba de hipótesis de dos pob.
Comparando dos proporciones con Z
Investigar si tiene razon el analista sobre si los bonos convertibles se sobrevaloraron más que los
bonos de ingresos.
Probar la hipótesis a un 10% de nivel de significancia o error de equivocarse en rechazar Ho.
Convertibles Ingresos
Bonos n1 312 n2 205 Alfa 0.1
Sobrevalorad X1 202 X2 102 1-Alfa 0.9
7.8
p1 0.647 p2 0.498 Fracción de las muestras
Paso 1. Establecimiento de hipótesis
Ho :  1   2  0....otra. forma....Ho :  1   2
Por tanto se trata de una prueba de cola derecha
Ha :  1   2  0..........................Ha :  1   2
Paso 2. Cálculo del estadístico de prueba Zc
p1  p 2 0.150 = > Zc = 3.393046759
Zc 
p1 (1  p1 ) p 2 (1  p 2 )
 0.04417119
n1 n2
Tomamos a p1 como el mayor para comparar Zc contra Ze positiva (1- Alfa)
Paso 3. Determinar la Ze de Excel o de tablas para 1-Alfa 0.9
Ze (0.9) = 1.28155157 DIST.NORM.STAND.INV (0.9)
287
Paso 4. Comparando los valores Zc calculado contra Zexcel (0.9) se tiene

Zc = 3.39304676

P(Z>= + 1.28 ) = Alfa

Ze(0.9) = 1.281551566
Valor p para Zc es igual a
P(-Zc) = 0.00034946
p < Alfa
Como Zc es mayo que Zexcel, si cae en el área de rechazo,
y por tanto hay suficiente evidencia para rechazar Ho y aceptar Ha
Se concluye que la diferencia en conv. entre los bonos es significativa
Paso adicional. El Intervalo de confianza del 98% sobre la diferencia de medias poblacionales,
con sigmas desconocidas es:
p1 (1  p1 ) p 2 (1  p 2 )
s p1 p 2   = Error estándar 0.044171193
n1 n2 Zexcel (para alfa/2) 1.644853627

( p1  p 2 )  Z  / 2 s p1 p 2 = Intervalo de confianza ( 0.150  0.07265515


Se observa difererencia positiva entre proporciones ( 0.077 <= PI <= 0.223
el cero no está incluido en el intervalo
288
Robustez
 Los procedimientos estadísticos se basan en
supuestos acerca de su comportamiento teórico.
Cuando los estadísticos obtenidos no son afectados
por desviaciones moderadas de su expectativa
teórica, se dice que son robustos.

289
Resumen

290
Instrucciones con Minitab para la
comparación de dos varianzas

Stat > Basic Statistics > 2-variances

Seleccionar samples in different columns o Summarized data


First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%

OK

291
Instrucciones con Minitab para la
comparación de dos medias

Stat > Basic Statistics > 2-Sample t

Seleccionar samples in different columns o Summarized data


First-- Indicar la columna de datos de la muestra 1
Second- Indicar la columna de datos de la muestra 2
Seleccionar o no seleccionar Assume equal variances de acuerdo a
los resultados de la prueba de igualdad de varianzas

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Difference (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK
292
Instrucciones con Minitab para la
comparación de dos medias pareadas

Stat > Basic Statistics > Paired t

Seleccionar samples in columns o Summarized data


First sample - Indicar la columna de datos de la muestra 1
Second sample - Indicar la columna de datos de la muestra 2

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la diferencia a probar Test Mean (normalmente 0)
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than
En graphs seleccionar las graficas Boxplot e Individual value plot
OK

293
Instrucciones con Minitab para la
prueba de hipótesis de dos proporciones

Stat > Basic Statistics > 2-Proportions


Seleccionar Summarized Data Trials:
Events:
First: No. de elementos de la 1ª. Muestra y D1 éxitos encontrados
Second: No. de elementos de la 2ª. Muestra y D2 éxitos encontrados

En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Indicar la Test Difference Normalmente 0
Indicar el signo de la hipótesis alterna: Less Than, Not equal,
Greater than

Seleccionar Use pooled estimate of p for test


OK

294
VI.B.7 Pruebas de bondad de
ajuste

295
Bondad de ajuste
PRUEBAS DE BONDAD DE AJUSTE

Medidas sobre que tan cerca se ajustan los datos muestrales observados a una forma
de distribución particular planteada como hipótesis
Si el ajuste es razonablemente cercano, puede concluirse que sí exite la forma de distribución
planteada como hipótesis

Por ejemplo:

Ho: La distribución poblacional es uniforme


Ha: La distribución poblacional no es uniforme

Se usa el estadístico Chi-Cuadrado

(Oi  Ei) 2
K
 
2

i 1 Ei

Oi = Frecuencia de los eventos observados en los datos muestrales

Ei = Frecuencia de los eventos esperados si la hipótesis nula es correcta


Para que la prueba sea confiable Ei >= 5. De otra forma se combinan las categorias para
cumplir con este requisito.
K = Número de categorías o clases
296
Bondad de ajuste
Ejemplo:

Se venden n = 48 botes en 4 meses. Si la demanda es uniforme se esperaría que se vendieran


12 botes / mes. La cantidad real que se vendió fue:

Ventas (Oi) Ventas (Ei)


Tipo de bote observadas esperadas
A 15 12
B 11 12
C 10 12
D 12 12
DISTR.CHI

Entonces el estadístico Chi Cuadrado de la muestra es = 1.17 el valor P corresp.= 0.76020818

El Chi Cuadrado de excel se determina con alfa = 0.05 y K - 1 grados de libetad = 3

Chi cuadrado de excel = 7.815

El estadístico Chi cuadrado calculado de 1.17 es menor al de excel de 7.815 por tanto se acepta
la hipótesis nula

PRUEBA.CHI.INV 297
Prueba de Bondad de ajuste
para la distribución de Poisson
1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. De Poisson
Ha: Caso contrario
2. Tomar una muestra aleatoria, anotar la frecuencia observada fi
y calcular la media de ocurrencias 
3. Calcular la frecuencia esperada de ocurrencias ei. Multiplicar el
tamaño de muestra con la prob. de Poisson para cada valor de
la variable aleatoria. Si hay menos de 5 combinar las categorías
n
( f i  ei ) 2
 2

4. Calcular el estadístico de prueba i 1 ei

 2   2
5. Rechazar Ho si o si p < alfa. Con gl=k-p-1 y alfa nivel de
significancia
298
Ejemplo:
Distribución de Poisson =5
Ho: No. de clientes que llega en intervalos de 5 min. tiene una distribución
de Poisson Ha: No se sigue una distribución de Poisson

Clientes Frec. observada f(x) de Poisson 128*f(x) cantidad


esperada
0 2 0.0067 0.8576
1 8 0.0337 4.3136
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 6 0.0363 4.6464
10 o más 0.0318 4.0704
299
Ejemplo:
Distribución de Poisson =5
Combinando X=0,1 y X=9, 10 o más para que la frecuencia observada sea
mayor a 5 y se pueda aplicar la distribución Chi Cuadrada se tiene

Clientes Frec. Observada f(x) de Poisson 128*f(x)


(fi) frecuencia
esperada (ei)
0o1 10 0.0067+0.0337 5.1712
2 10 0.0842 10.7776
3 12 0.1404 17.9712
4 18 0.1755 22.4640
5 22 0.1755 22.4640
6 22 0.1462 18.7136
7 16 0.1044 13.3662
8 12 0.0653 8.3584
9 o más 6 0.0363+0.0318 8.7168
300
Estadístico y conclusión
Con los datos anteriores se calcula el estadístico Chi cuadrada que se
compara con Chi Cuadrada de alfa para k-p-1 grados de libertad (K –
categorías: 9, p – parámetros a estimar: 1 media).

( f i  ei ) 2
n
 
2

i 1 ei
Ho se rechaza si o si p es mayor que alfa.
   2
2

El valor de Chi Cuadrada calculado es de 10.9766 y el valor Chi Cuadrada


de alfa 0.05 con 2 gl. Es de 14.07 no se rechaza Ho
En este caso p = 0.14 > 0.05 por tanto no se rechaza Ho y se concluye
que los datos siguen una distribución de Poisson

301
Prueba de Bondad de ajuste
para la distribución Normal
1. Plantear la hipótesis nula y alterna
Ho: La población tiene una distribución de prob. Normal
Ha: Caso contrario

2. Tomar una muestra aleatoria, calcular la media  y la desviación


estándar

3. Definir K intervalos de valores de forma que la frecuencia


esperada sea 5 cuando menos para cada uno (intervalos de
igual probabilidad). Anotar la frecuencia observada de los
valores de datos fi, en cada intervalo

302
Prueba de Bondad de ajuste
para la distribución Normal
4. Calcular el número de ocurrencias esperado ei, para cada
intervalo de valores. Multiplicar el tamaño de muestra por la
probabilidad de que una variable aleatoria esté en el intervalo.
n
( f i  ei ) 2
5. Calcular el estadístico de prueba  2

i 1 ei

6. Rechazar Ho si     o si p < alfa. Con gl=k-p-1 y alfa nivel


2 2

de significancia

303
Prueba de Bondad de ajuste
para la distribución Normal
 Ejemplo: datos de calificaciones: Media = 68.42; S = 10.41

Calificaciones
71 66 61 65 54 93
60 86 70 70 73 73
55 63 56 62 76 54
82 79 76 68 53 58
85 80 56 61 61 64
65 62 90 69 76 79
77 54 64 74 65 65
61 56 63 80 56 71
79 84         304
Prueba de Bondad de ajuste
para la distribución Normal
Ho: la población tiene una distribución normal con media 68.42 y
S=10.41 Ha: Caso contrario

Para una muestra de 50 con una frecuencia mínima esperada de 5


se tiene el 10% al menos por cada celda

La primera celda correspondiente al 10% está en Z = -1.28 con


X = (Media - Z*S) = 55.10

Para el área del 20%, Z = -0.84 y X = 59.68


y así sucesivamente

305
Prueba de Bondad de ajuste
para la distribución Normal
Intervalo Frecuencia Frecuencia Se registran las
observada (fi) esperada (ei) frecuencias de
Menos de 5 5 los datos
55.10 tomados de las
55.10 a 59.68 5 5 calificaciones
59.68 a 63.01 9 5
63.01 a 65.82 6 5
65.82 a 68.42 2 5
68.42 a 71.02 5 5
71.02 a 73.83 2 5
73.83 a 77.16 5 5
77.16 a 81.74 5 5
81.74 o más 6 5
50 50
306
Prueba de Bondad de ajuste
para la distribución Normal
 Se determina el estadístico Chi Cuadrado = 7.2

( f i  ei ) 2
n
 
2

i 1 ei

 El Valor de Chi Cuadrado de alfa = 0.10 para k – p – 1 grados


de libertad. K = 10 categorías, p = 2 parámetros. Gl = 7. Chi
Cuadrado es 12.017

 Como  2
  2
 no se puede rechazar la hipótesis nula de

normalidad de las calificaciones

307
Prueba de Bondad de ajuste
para la distribución Multinomial
1. Enunciar la hipótesis nula y alternativa
Ho: La población sigue una distribución de probabilidad
multinomial con probabilidades especificadas para cada una de
las K categorías Ha: Caso contrario

2. Tomar una muestra aleatoria y anotar las frecuencias


observadas fi para cada categoría

3. Suponiendo que Ho es cierta, determinar la frecuencia esperada


ei, en cada categoría multiplicando la probabilidad de la
categoría por el tamaño de muestra

308
Prueba de Bondad de ajuste
para la distribución Multinomial
4. Se determina el estadístico Chi Cuadrado de prueba

( f i  ei ) 2
n
  2

i 1 ei

5. Regla de rechazo:

 2   2
Si no se puede rechazar la hipótesis nula

Rechazar si el valor p es menor a alfa

Con alfa nivel de significancia y los grados de libertad son k-1

309
Prueba de Bondad de ajuste
para la distribución Multinomial
Ejemplo: El año pasado la participación de mercado para la
empresa A fue del 30%, 50% para la empresa B y 20% para la
empresa C. La empresa C hace una prueba con un nuevo
producto para estimar su impacto en las preferencias del
mercado.

Se tomó una muestra de 200 clientes resultando preferencias de


compra de: 48 para A, 98 para B y 54 para C.

De acuerdo a las probabilidades esperadas, en los 200 clientes las


preferencias esperadas son: A=200*0.3=60, B=200*0.5=100,
C=200*0.2=40

310
Prueba de Bondad de ajuste
para la distribución Multinomial
Datos para calcular el estadístico de prueba Chi Cuadrado

Categoría Proporción Frecuencia Frecuencia


hipotética observada esperada

Empresa A 0.3 48 60

Empresa B 0.5 98 100

Empresa C 0.2 54 40

311
Prueba de Bondad de ajuste
para la distribución Multinomial
Chi Cuadrado calculado = 7.34

Chi cuadrado de alfa = 0.05 con k – 1 = 2 grados de libertad = 2


es de 5.99. El valor p correspondiente es de 0.025.

Como 7.34 es mayor a 5.99 o el valor p de 0.025 es menor a alfa


de 0.05 se rechaza la hipótesis nula Ho y se concluye que el
nuevo producto modificará las preferencias del mercado
actuales

La participación de la empresa C aumenta con el nuevo producto

312
Prueba de Bondad
de ajuste en Minitab
La columna C1 – Observadas contiene las frecuencias observadas
y la C2 – esperadas las frecuencias esperadas

Calc > Calculator > Store result in variable ChiCuadrada


Teclear en el cuadro de expresión sum((Observadas-
Esperadas)**2/Esperadas)

Calc > Probability distributions > Chi Square


Seleccionar Cummulative probability
Degrees of freedom 2
Input column ChiCuadrada; Optional Storage CumProb OK
Calc > Calculator > Store results in variable p
En el cuadro Expression teclear 1-CumProb
OK 313
Prueba de Bondad
de ajuste en Minitab
 Ejemplo: investigación de mercado

Observadas Esperadas ChiCuadrada CumProb p


48 60 7.34 0.974524 0.0254765
98 100      
54 40      

314
Prueba de Bondad
de ajuste en Excel
 Ejemplo: investigación de mercado

1. Calcular el estadístico Chi Cuadrada con =(A2-B2)^2/B2 y Suma


Chi cuadrada = 7.34
2. El valor P es =distr.chi(7.34, 2)

3. El estadístico Chi Cuadrada de alfa es:


=prueba.chi.inv(0.05,2) = 5.99

4. Como p es menor a alfa de 0.05 se rechaza la Ho

315
VI.B.6 ANOVA para un factor
principal y una o más variables de
bloqueo

316
Introducción
 Cuando es necesario comparar 2 o más medias poblacionales al
mismo tiempo, para lo cual se usa ANOVA.

 El método ANOVA tiene los siguientes supuestos:


 La varianza es la misma para todos los tratamientos del

factor en todos sus niveles


 Las mediciones indiviudales dentro de cada tratamiento se

distribuyen normalmente
 El término de error tiene un efecto distribuido normalmente

e independiente

317
Contenido
 ANOVA de un factor o dirección

 ANOVA de un factor y una variable de bloqueo

 ANOVA de un factor y dos variables de bloqueo –


CUADRADO LATINO

 ANOVA de un factor y tres variables de bloqueo –


CUADRADO GRECOLATINO

318
ANOVA de un factor
o dirección

319
Introducción
 Con el ANOVA las variaciones en la respuesta se dividen
en componentes que reflejan los efectos de una o más
variables independientes

 La variabilidad se representa como la suma de cuadrados


total que es la suma de cuadrados de las desviaciones de
mediciones individuales respecto a la gran media, se
divide en:
 Suma de cuadrados de las medias de los tratamientos

 Suma de cuadrados del residuo o error experimental

320
ANOVA – Prueba de hipótesis para
probar la igualdad de medias de
varias poblaciones para un factor
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp. 1, Temp. 2, Temp.3, etc.)

Ho : 1   2  3  .........   a
Ha : A lg unas. ' s.son.diferentes
321
ANOVA - Condiciones
 Todas las poblaciones son normales

 Todas las poblaciones tiene la misma varianza

 Los errores son independientes con distribución


normal de media cero

 La varianza se mantiene constante para todos los


niveles del factor
322
ANOVA – Ejemplo de datos
Niveles del Factor Peso % de algodón y Resistencia de tela
Peso porc. Respuesta
de algodón Resistencia de la tela
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
323
ANOVA – Suma de
cuadrados total

Xij

Gran media

Xij
a b 2

SCT    ( Xij  X )
i 1 j 1
324
ANOVA – Suma de cuadrados de
renglones (a)-tratamientos
Media Trat. 1 Media Trat. a

a renglones
Gran media

Media trat. 2
SCTr   b( X i  X ) 2

i 1
325
ANOVA – Suma de cuadrados
del error
X2j X3j
X1j

Media X1.
Media X3.
Media X2.

Muestra 1 Muestra 2 Muestra 3

a b
SCE   (X ij  X i) 2

i 1 j 1 326
ANOVA – Suma de cuadrados
del error
X2j X3j
X1j

Media X1.
Media X3.
Media X2.

Muestra 1 Muestra 2 Muestra 3

SCE  SCT  SCTr


327
ANOVA – Grados de libertad:
Totales, Tratamientos, Error

gl.SCT  n  1
gl.SCTr  a  1
gl.SCE  (n  1)  (a  1)  n  a
328
ANOVA – Cuadrados medios:
Total, Tratamiento y Error

MCT  SCT /( n  1)
MCTr  SCTr /( a  1)
MCE  SCE /( n  a )

329
ANOVA – Cálculo del estadístico
Fc y Fexcel

MCTr
Fc 
MCE
Fexcel  FINVALFA , gl .SCTr , gl .SCE

330
Tabla final de ANOVA
TABLA DE ANOVA

FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F


CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME

Dentro de muestras (error) SCE n-a CME

Variación total SCT n-1 CMT

Regla: Rechazar Ho si la Fc de la muestra es mayor que la F de Excel para una cierta alfa
o si el valor p correspondiente a la Fc es menor al valor de alfa especificado

331
ANOVA – Toma de decisión

Distribución F Fexcel

Alfa

Zona de no rechazo de Ho Zona de rechazo


O de no aceptar Ha De Ho o aceptar Ha

Fc
332
ANOVA – Toma de decisión

Si Fc es mayor que Fexcel se rechaza Ho


Aceptando Ha donde las medias son diferentes

O si el valor de p correspondiente a Fc es
menor de Alfa se rechaza Ho

333
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
CME
T  q , a , n  a
b
Para diseños balanceado
(mismo número de columnas
en los tratamientos) el valor
de q se determina por medio de
la tabla en el libro de texto
334
ANOVA – Identificar las medias
diferentes por Prueba de Tukey T
Se calcula la diferencia Di entre cada par de Medias Xi’s:

D1 = X1 – X2 D2 = X1 – X3 D3 = X2 – X3 etc.

Cada una de las diferencias Di se comparan con el


valor de T, si lo exceden entonces la diferencia es
Significativa de otra forma se considera que las medias
Son iguales

335
ANOVA – Identificar las medias
diferentes por Prueba de Diferencia
Mínima Significativa DMS

2(CME ) F ,1,n a
DMS 
b
Para diseños balanceados (los tratamientos
tienen igual no. De columnas), se calcula un
factor DMS contra el que se comparan las
diferencias Xi – Xi’. Significativas si lo exceden
336
Prueba DMS para Diseños no
balanceados
1 1
DMS j ,k     (CME ) F ,a 1,n a
 b j bk 
Para diseños no balanceados (los
tratamientos tienen diferente no. De
columnas), se calcula un factor DMS
Para cada una de las diferencias Xi – Xi’
337
Ejemplo:
 Considerar un experimento de un factor (máquina)
con tres niveles (máquinas A, B, C). Los datos se
muestran a continuación y debe verificarse si existe
diferencia significativa a un alfa = 0.05

Máquinas Datos Su Prom.


ma

338
Ejemplo:

La tabla completa de ANOVA es la siguientes:


Fuentes Cuadrado
De variación medio
Máquinas

Como el valor calculado de F(33.2) excede el valor crítico de F, se


rechaza la Hipótesis nula Ho 339
Ejemplo:
 Con Minitab: Stat>ANOVA>One way unstacked
 Responses (in separate columns) A B C
 Interpretar los resultados

A B C

5 2 1
7 0 0
6 1 -2
7 -2 -3
6 2 0

340
Ejemplo:
One-way ANOVA: A, B, C
Source DF SS MS F P

Factor 2 137.20 68.60 33.19 0.000 Rechazo Ho


Error 12 24.80 2.07
Total 14 162.00
S = 1.438 R-Sq = 84.69% R-Sq(adj) = 82.14%
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev ---------+---------+---------+---------+
A 5 6.200 0.837 (-----*----)
B 5 0.600 1.673 (----*-----)
C 5 -0.800 1.643 (-----*----)
---------+---------+---------+---------+
0.0 2.5 5.0 7.5
Pooled StDev = 1.438

341
Corrida en Minitab
 Se introducen las respuestas en una columna C1
 Se introducen los subíndices de los renglones en una
columna C2 Durability Carpet
18.95 1
12.62 1
11.94 1
14.42 1
10.06 2
7.19 2
7.03 2
14.66 2 342
Corrida en Minitab
 Opción: stat>ANOVA – One Way (usar archivo
Exh_aov)
 En Response indicar la col. De Respuesta (Durability)

 En factors indicar la columna de subíndices (carpet)


 En comparisons (Tukey)

 Pedir gráfica de Box Plot of data y residuales Normal


Plot y vs fits y orden

 Si los datos estan en columnas pedir ANOVA – One


Way (unstacked) 343
Results for: Exh_aov.MTW
One-way ANOVA: Durability versus Carpet

Resultados
Analysis of Variance for Durabili
Source DF SS MS F P
Carpet 3 111.6 37.2 2.60 0.101
Error 12 172.0 14.3
Total 15 283.6
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---------+---------+---------+-------
1 4 14.483 3.157 (-------*-------)
2 4 9.735 3.566 (-------*--------)
3 4 12.808 1.506 (--------*-------)
4 4 17.005 5.691 (-------*-------)
---------+---------+---------+-------
Pooled StDev = 3.786 10.0 15.0 20.0
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual error rate = 0.0117
Critical value = 4.20
344
ANOVA de dos vías un factor
principal y una variable de
bloqueo

345
ANOVA de 2 vías
 Este es un procedimiento extensión de los patrones
del ANOVA de una vía con tres fuentes de variación:
Tratamiento del factor A (columnas), Tratamiento del
factor B (renglones) y Error experimental.

X ijk   Ef . Ai  Ef .B j  Ef . AxBij   kij

346
ANOVA – Prueba de hipótesis para
probar la igualdad de medias de
varias poblaciones con dos vías
Se trata de probar si el efecto de un factor o
Tratamiento en la respuesta de un proceso o sistema es
Significativo, al realizar experimentos variando
Los niveles de ese factor (Temp.1, Temp.2, etc.)
POR RENGLON
Y
Considerando los niveles de otro factor que se piensa
Que tiene influencia en la prueba – FACTOR DE BLOQUEO
POR COLUMNA
347
ANOVA – 2 vías
Para el tratamiento – en renglones

Ho : 1   2   3  .........   a
Ha : A lg unas. ' s.son.diferentes
Para el factor de bloqueo – en columnas

Ho :  '1   '2   '3  .........   'a


Ha : A lg unas. ' s.son.diferentes
348
ANOVA 2 vías - Ejemplo

Experiencia en años de los operadores


Maquinas 1 2 3 4 5
Maq 1 27 31 42 38 45
Maq 2 21 33 39 41 46
Maq 3 25 35 39 37 45
349
ANOVA – Dos vías o direcciones
 La SCT y SCTr (renlgones) se determina de la misma
forma que para la ANOVA de una dirección o factor

 En forma adicional se determina la suma de


cuadrados del factor de bloqueo (columnas) de
forma similar a la de los renglones

 La SCE = SCT – SCTr - SCBl

350
ANOVA de 2 vías
b
SCBl   a ( X j  X ) 2

j 1

gl.SCBl  b  1
CMBl  SCBl /(b  1)
351
ANOVA de 2 vías

SCE  SCT  SCTr  SCBl


gl.SCE  (n  a )(n  b)
CME  SCBl /(n  a )(n  b)

352
ANOVA –Estadístico Fc y Fexcel

MCTr
Fc 
MCE
Fexcel  FINVALFA , gl .SCTr , gl .SCE

353
ANOVA – Estadístico Fb

MCBl
Fc 
MCE
Fexcel  FINVALFA , gl .SCBl , gl .SCE

354
Tabla final ANOVA 2 vías
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO

Entre muestras (tratam.) SCTR a-1 CMTR CMTR/CME

Entre Bloques (Factor Bl) SCBl b-1 CMBL CMBL/CME

Dentro de muestras (error) SCE (a-1)(b-1) CME

Variación total SCT n-1 CMT

Regla: No rechazar si la F de la muestra es menor que la F de Excel para una cierta alfa
355
ANOVA – 2 vías: Toma de decisión

Distribución F Fexcel

Alfa

Zona de no rechazo de Ho Zona de rechazo


O de no aceptar Ha De Ho o aceptar Ha

Fc
Tr o Bl 356
ANOVA – 2 vías: Toma de decisión

Si Fc (Tr o Bl) es mayor que Fexcel se rechaza


Ho Aceptando Ha donde las medias son
diferentes

O si el valor de p correspondiente a Fc (Tr o Bl)


es menor de Alfa se rechaza Ho

357
Cálculo de los residuales
ˆ ij  yi .  y. j  y..
y Y estimada

eij  yij  y
ˆ ij Error o residuo

MSE Error estándar


s yi . 
b
Rk  r0.05, k , gl . MSE * s yi . Factor de comparación

Si la diferencia de medias excede a Rk es significativa


358
Adecuación del modelo
 Los residuales deben seguir una recta en la gráfica
normal

 Deben mostrar patrones aleatorios en las gráficas de


los residuos contra el orden de las Yij, contra los
valores estimados y contra los valores reales Yij

359
Corrida en Minitab
 Se introducen las respuestas en una columna C3 y los
subíndices de renglones en columna C4 y de columnas en C5

Plantas Suplemento Lago


34 1 Rose
43 1 Rose
57 1 Dennison
40 1 Dennison
85 2 Rose
68 2 Rose
67 2 Dennison
53 2 Dennison
41 3 Rose
24 3 Rose
42 3 Dennison
52 3 Dennison
360
Corrida en Minitab
 Opción: stat>ANOVA – Two Way (usar archivo
Exh_aov)

 En Response indicar la col. De Respuesta (Plantas)

 En Row factor y Column Factor indicar las columnas


de subíndices de renglones y columnas (suplemento
y lago) y Display Means para ambos casos

 Pedir gráfica residuales Normal Plot y vs fits y orden


361
Two-way ANOVA: Zooplankton versus Supplement, Lake
Analysis of Variance for Zooplank
Source DF SS MS F P

Resultados
Suppleme 2 1919 959 9.25 0.015
Lake 1 21 21 0.21 0.666
Interaction 2 561 281 2.71 0.145
Error 6 622 104
Total 11 3123
Individual 95% CI
Suppleme Mean --+---------+---------+---------+---------
1 43.5 (-------*-------)
2 68.3 (--------*-------)
3 39.8 (--------*-------)
--+---------+---------+---------+---------
30.0 45.0 60.0 75.0
Individual 95% CI
Lake Mean ------+---------+---------+---------+-----
Dennison 51.8 (----------------*----------------)
Rose 49.2 (----------------*----------------)
------+---------+---------+---------+-----
42.0 48.0 54.0 60.0
362
ANOVA de un factor y dos o
tres variables de bloqueo

CUADRADO LATINO Y
GRECOLATINO

363
ANOVA – 3 y 4 factores
 El diseño de Cuadrado latino utiliza dos factores de
bloqueo adicionales al de Tratamiento

 EL diseño de Cuadrado Grecolatino utiliza tres


factores adicionales al del Tratamiento

 El cálculo de suma de cuadrados para renglones y


para columnas es similar al de ANOVA de un factor
principal y otro de bloqueo

364
Cuadrado Latino
Años exp. Turno
Empleado Mañana Tarde Noche
1 B=15 A=18 C=11

2 C=12 B=20 A=9

3 A=17 C=19 B=10


A, B, C = Máquinas 1, 2 y 3
365
ANOVA – Cuadrado Latino:
Factor principal (A,B,C,D)
b
SCTr   a ( X Tr  X ) 2

j 1

gl.SCTr  a  1  b  1
CMTr  SCTr /(b  1)
366
ANOVA – Cuadrado Latino: Cálculo
del error

SCE  SCT  SCTcol  SC Re ng  SCTr


gl.SCE  (a  2)(a  1)
CME  SCE /( a  2)(a  1)

367
ANOVA – Cálculo del estadístico
Fc y Fexcel

MCTr
Fc 
MCE
Fexcel  FINVALFA , gl .SCTr , gl .SCE

368
ANOVA – Cuadrado Latino Reng / Col
MC Re ng
Fcreng 
MCE
MCCols
Fcols 
MCE
Fexcel  FINVALFA , gl .SCBl , gl .SCE
369
Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO

Renglores SCRen a-1 CMRen CMRen/CME

Columnas SCCol b-1 CMCol CMCol/CME

Tratamiento SCTr a-1 CMTr CMTr/CME

Dentro de muestras (error) SCE (a-2)(a-1) CME

Variación total SCT n-1 CMT

370
Cuadrado latino en Minitab
 Se introducen las respuestas en una columna C1

 Se introducen los subíndices de los renglones en una


columna C2

 Se introducen los subíndices de las columnas en una


columna C3

 Se introducen las letras mayúsculas que indican el


nivel del factor (A, B, C, D, etc.) correspondientes a
cada respuesta en la columna C4
371
Cuadrado latino en Minitab
 Opción: stat> ANOVA – General linear model

 En Response indicar la col. De Respuesta,

 En Model indicar las columnas de los factores y

 En Random factors indicar los factores adicionales al


del efecto principal a probar (A, B, C, D). Se pueden
pedir interacciones entre factores x – y con Cx*Cy

 Pedir gráfica de residuales Normal y vs fits y orden


372
Cuadrado Greco Latino
Experiencia de los operadores

Lotes MP 1 2 3 4 5

1 Aa=-1 Bc=-5 Ce=-6 Db=-1 Ed=-1

2 Bb=-8 Cd=-1 Da=5 Ec=2 Ae=11

3 Cc=-7 De=13 Eb=1 Ad=2 Ba=-4

4 Dd=1 Ea=6 Ac=1 Be=-2 Cb=-3

5 Ee=-3 Ab=5 Bd=-5 Ca=4 Dc=6

a, b, c y d son 5 diferentes tipos de montaje A, B, C, D y E son las 5 formulaciones a probar

373
Cuadrado Greco latino en Minitab
 Se introducen las respuestas en una columna C1
 Se introducen los subíndices de los renglones en una
columna C2

 Se introducen los subíndices de las columnas en una


columna C3
 Introducir los subíndices del factor adicional de letras
griegas con letras latinas minúsculas (a,b,c,d,e) en C4

 Se introducen las letras mayúsculas que indican el nivel


del factor (A, B, C, D, etc.) correspondientes a cada
respuesta en la columna C5
374
Cuadrado Greco latino en Minitab
 Opción: ANOVA – General linear model

 En Response indicar la col. De Respuesta,

 En Model indicar las columnas de los factores y

 En Random factors indicar los factores adicionales al del efecto


principal a probar (A, B, C, D). También se pueden indicar
interacciones entre factores x-y con Cx * Cy

 Pedir gráfica de residuales Normal y vs fits y orden

375
ANOVA – Cuadrado Grecolatino

b
SCG   a ( X m  X ) 2

m 1

gl.SCG  b  1
CMG  SCG /(b  1)
376
ANOVA de 2 factores – Suma de
cuadrados, gl. y Cuadrado medio
para el error

SCE  SCT  SCTr  SCG  SC Re n  SCCol


gl.SCE  (a  3)(a  1)
CME  SCE /( a  3)(a  1)

377
ANOVA – Cálculo del estadístico
Fc y Fexcel

MCG
Fc 
MCE
Fexcel  FINVALFA , gl .SCTr , gl .SCE

378
ANOVA – Cuadrado Grecolatino

MCTr
Fc 
MCE
Fexcel  FINVALFA , gl .SCBl , gl .SCE

379
Tabla final ANOVA 2 Factores
FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F
CUADRADOS LIBERTAD MEDIO

Renglores SCRen a-1 CMRen CMRen/CME

Columnas SCCol b-1 CMCol CMCol/CME


Letras griegas SCG a-1 CMG CMG/CME
Tratamiento SCTr a-1 CMTr CMTr/CME

Dentro de muestras (error) SCE (a-3)(a-1) CME

Variación total SCT n-1 CMT

380
ANOVA para diseño factorial AxB
 En un experimento factorial involucrando el factor A con (a)
niveles y un factor B con (b) niveles, la suma de cuadrados se
puede dividir en:
SST = SS(A) + SS(B) + SS(AB) + SSE

381
VI.B.8 Tablas de contingencia

Prueba Chi2 (2)

382
¿Para qué se utiliza?

1. Para probar si una serie de datos


observada, concuerda con el modelo (serie
esperada) de la información.

2. Para probar las diferencias entre las


proporciones de varios grupos (tabla de
contingencia).
Para todos los casos, Ho: No hay diferencia
Ha: Hay diferencia

 2
383
Ejemplo 1: Chi Cuadrada( 2 )

Se lanza una moneda al aire 100 veces y que


obtenemos 63 águilas y 37 soles.

¿La proporción de águilas y soles sucede por


casualidad? O, se concluye que la moneda está
“cargada”?

Ho: La moneda es buena

Ha: La moneda “está cargada”

384
Ejemplo 1: Chi Cuadrada( 2 )

Observada Esperada (fo - fe)2


( fo ) ( fe ) fe

Aguilas 63 50 3.38
Soles 37 50 3.38
 2 = 3.38 + 3.38
 2 = 6.76

Estadístico Chi Cuadrada


g (fo - fe)2
 c=
2

j=1
fe

385
Ejemplo 1: Chi cuadrada
Función de Distribución Acumulada Chi2 con 1 grado de libertad
(d.f)
2c P(2c > x)
6.7600 p = 1 - 0.9907 = 0.0093

De tablas X2Crítica, (0.05, 1) = 3.8414

Ho: La moneda es buena.


Ha: La moneda está “cargada”.

Para un 95% de confianza antes de concluir que la moneda “está


cargada”, se requiere que X2c > X2Crítica o que el valor de p sea 
0.05.

Como p  0.05, se puede concluir -con un 95% de confianza -


que la moneda “está cargada”.
386
Cálculo en Excel del estadístico Chi cuadrada

1. Posicionarse en una celda vacía

2. Accesar el menú de funciones con Fx

3. Seleccionar STATISTICAL o ESTADÍSTICAS, CHIINV.

4. Dar valores de probabilidad (0.05) y grados de libertad,


normalmente (n - 1) para un parámetro o (# de renglones -1)
* (# de columnas - 1) para el caso de tablas de proporciones.

387
Tabla de Valores Críticos Seleccionados de Chi2
df .250 .100 .050 .025 .010 .005 .001 
1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515

6 7.841 10.645 12.592 14.449 16.812 18.548 22.458


7 9.037 12.017 14.067 16.013 18.475 20.278 24.322
8 10.219 13.362 15.507 17.535 20.090 21.955 26.125
9 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588

11 13.701 17.275 19.675 21.920 24.725 26.757 31.264


12 14.845 18.549 21.026 23.337 26.217 28.300 32.909
13 15.984 19.812 22.362 24.736 27.688 29.819 34.528
14 17.117 21.064 23.685 26.119 29.141 31.319 36.123
15 18.245 22.307 24.996 27.488 30.578 32.801 37.697

16 19.369 23.542 26.296 28.845 32.000 34.267 39.252


17 20.489 24.769 27.587 30.191 33.409 35.718 40.790
18 21.605 25.989 28.869 31.526 34.805 37.156 43.312
19 22.718 27.204 30.144 32.852 36.191 38.582 43.820
20 23.828 28.412 31.410 34.170 37.566 39.997 45.315

21 24.935 29.615 32.671 35.479 38.932 41.401 46.797


22 26.039 30.813 33.924 36.781 40.289 42.796 48.268
23 27.141 32.007 35.172 38.076 41.638 44.181 49.728
24 28.241 33.196 36.415 39.364 42.980 45.558 51.179
25 29.339 34.382 37.652 40.646 44.314 46.928 52.620

26 30.434 35.563 38.885 41.923 45.642 48.290 54.052


27 31.528 36.741 40.113 43.194 46.963 49.645 55.476
28 32.620 37.916 41.337 44.461 48.278 50.993 56.892
29 33.711 39.087 42.557 45.722 49.588 52.336 58.302
30 34.800 40.256 43.773 46.979 50.892 53.672 59.703

40 45.616 51.805 55.758 59.342 63.691 66.766 73.402


50 56.334 63.167 67.505 71.420 76.154 79.490 86.661
60 66.981 74.397 79.082 83.298 88.379 91.952 99.607

70 77.577 85.527 90.531 95.023 100.425 104.215 112.317


80 88.130 96.578 101.879 106.629 112.329 116.321 124.839
90 98.650 107.565 113.145 118.136 124.116 128.299 137.208

388
100 109.141 118.498 124.342 129.561 135.807 140.169 149.449
Tabla de contingencia
 Una tabla de clasificación de dos vías (filas y columnas) que
contiene frecuencias originales, se puede analizar para
determinar si las dos variables (clasificaciones) son
independientes o tienen una asociación significativa.

 La prueba Chi Cuadrada probará si hay dependencia entre las


dos clasificaciones.

 Además se puede calcular el coeficiente de contingencia


(correlación) que en todo caso muestra la fuerza de la
dependencia

389
Tabla de contingencia
 Para esta prueba se usa la prueba Chi Cuadrada donde:

 Entre mayor sea su valor, mayor será la diferencia de la


discrepancia entre frecuencias observadas y teóricas. Esta
prueba es similar a la de bondad de ajuste.

390
Tabla de contingencia
 Ejemplo: Cada una de las 15 celdas hace una contribución al
estadístico Chi Cuadrado (una celda)

 Asumiendo Alfa = 0.1 y Gl= (reng – 1)*(Col – 1) = 4*2 = 8 Chi-


Cuadrado de alfa = 20.09
 Como Chi Cuadrada calculada >> Chi C. Alfa, se rechaza Ho de
igualdad de resultados entre negocios

391
Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Ho: No existen diferencias en los índices de defectos de las dos máquinas.
Ha: Existen diferencias en los índices de defectos de las dos máquinas.

Los valores observados (fo) son los siguientes:

Partes buenas Partes defectuosas

máquina 1 fo = 517 fo = 17 Total = 534

máquina 2 fo = 234 fo = 11 Total = 245

Total 751 28 779

El índice de defectos totales es 28 / 779 = 3.6%

392
Ejemplo 2: Chi2 Para comparación de dos
grupos; ¿son las mismas proporciones?)
Cálculo de los valores esperados

Partes buenas Partes defectuosas

máquina 1 fo = 751*534/779 fo = 28*534/779 Total = 534

máquina 2 fo = 751*245/779 fo = 28*245/779 Total = 245


779
Basados en este índice, los valores esperados (fe) serían:
Partes Partes defectuosas
buenas
máquina 1 530.53 3.47

máquina 2 233.47 1.53


393
Prueba de chi cuadrada:
Los conteos esperados están debajo de los conteos observados
Partes buenas Partes Defectuosas Total
1 532 2 534
530.53 3.47

2 232 3 235
233.47 1.53
Total 764 5 769

Chi2 = 0.004 + 0.624 + 0.009 + 1.418 = 2.056


DF= 1; valor de p = 0.152

2 celdas con conteos esperados menores a 5.0

Nota: Chi cuadrada no podrá aplicarse en los casos donde los conteos seas menores a 5 en  20%
de celdas.
Si cualquiera de los conteos esperados en las celdas es menor a uno, no deberá usarse Chi 2.

Si algunas celdas tienen un conteo menor a los esperados, ya sea combinando u omitiendo
renglones y/o columnas, las categorías pueden ser de utilidad.
394
Tabla de Chi2
Tabla de valores críticos seleccionados para Chi 2

DF .250 .100 .050 .025 .010 .005  .001


1 1.323 2.706 3.841 5.024 6.635 7.879 10.828
2 2.773 4.605 5.991
. 7.378 9.210 10.597 13.816
3 4.108 6.251 7.815 9.348 11.345 12.838 16.266
4 5.385 7.779 9.488 11.143 13.277 14.860 18.467
5 6.626 9.236 11.070 12.832 15.086 16.750 20.515

6 7.841 10.645 12.592 14.449 16.812 18.548 22.458


7 9.037 12.017 14.067 16.013 18.475 20.278 24.322
8 10.219 13.362 15.507 17.535 20.090 21.955 26.125
9 11.389 14.684 16.919 19.023 21.666 23.589 27.877
10 12.549 15.987 18.307 20.483 23.209 25.188 29.588

11 13.701 17.275 19.675 21.920 24.725 26.757 31.264


12 14.845 18.549 21.026 23.337 26.217 28.300 32.909
13 15.984 19.812 22.362 24.736 27.688 29.819 34.528
14 17.117 21.064 23.685 26.119 29.141 31.319 36.123
15 18.245 22.307 24.996 27.488 30.578 32.801 37.697

16 19.369 23.542 26.296 28.845 32.000 34.267 39.252


17 20.489 24.769 27.587 30.191 33.409 35.718 40.790
18 21.605 25.989 28.869 31.526 34.805 37.156 43.312
19 22.718 27.204 30.144 32.852 36.191 38.582 43.820
20 23.828 28.412 31.410 34.170 37.566 39.997 45.315

395
Problema: Fugas
Beneficios Potenciales: $10,000 de ahorro en retrabajos, y en la
reducción de tiempo de ciclo.

Variación en familias a probar


Operador a operador
Ho: No existe diferencia en los índices de defecto de los diferentes
operadores
Ha: Existe diferencia en los índices de defecto de los diferentes
operadores

Máquina a máquina
Ho: No existe diferencia en los índices de defecto de las diferentes
máquinas
Ha: Existe diferencia en los índices de defecto de las diferentes
máquinas

Tamaño de la muestra:
5000 + total de oportunidades (172 piezas) 396
Prueba de chi2 (máquina a máquina)
Los conteos esperados están colocados debajo de los conteos observados
Con fugas Sin fugas Total
1 30 610 640
32.11 607.89

2 235 4217 4452


223.38 4228.62

3 3 253 256
12.84 243.16

4 18 334 352
17.66 334.34

Total 286 5414 5700

Chi2 = 0.139 + 0.007 + 0.604 + 0.032 + 7.546 + 0.399 + 0.006 +


0.000 = 8.734
DF= (4-1)(2-1) = 3; valor P = 0.033
397
Prueba de chi2 (operador a operador)
Los conteos esperados están colocados debajo de los conteos observados.
Con gotera Sin gotera Total
1 6 122 128
6.61 121.39

2 1 127 128
6.61 121.39

3 200 3836 4036


208.55 3827.45

4 54 202 256
13.23 242.77

5 5 699 704
36.38 667.62

6 12 116 128
6.61 121.39
Total 278 5102 5380

Chi2 = 0.057 + 0.003 + 4.765 + 0.260 + 0.351 + 0.019 +125.666 + 6.847 + 27.065 + 1.475
+ 4.386 + 0.239 = 171.132
DF= 5; valor P = 0.000 398
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)

Se utiliza un procedimiento denominado “Coeficiente de Contingencia” como clave


para determinar qué grupo de variación debe investigarse primero.

Coeficiente de Chi Cuadrada


x 100
Contingencia N
Chi2 N CC

Máquina 8.734 5700 0.15

Operador 171.132 5380 3.18


Controlador Mayor
SI el tamaño de la muestra (N), es similar para los grupos. Al dividir entre N,
probablemente, llevará a la misma ruta que hubiera alcanzado con sólo ver la
estadística Chi2.

Sin embargo, si N tiene una variación considerable, dependiendo del grupo de


variación que se investiga, el coeficiente de contingencia puede ser una herramienta
valiosa para determinar la prioridad sobre qué grupo debe investigarse primero.
399
¿Qué sucede si los grupos múltiples de variación son estadísticamente significativos?
(en este caso, operador a operador y máquina a máquina)
Ahora que la información nos
ha llevado a investigar a los Con gotera Sin gotera Total
grupos de operador a 1 6 122 128
operador. ¿Qué debemos 6.61 121.39
hacer ahora?
Encontremos cuál de los 2 1 127 128
operadores estaban fuera del 6.61 121.39
estándar.
¿Era alguno de ellos 3 200 3836 4036
notablemente peor (o mejor) 208.55 3827.45
que el resto?
Mucho peor que 4 54 202 256
lo esperado 13.23 242.77

Mucho mejor que 5 5 699 704


lo esperado 36.38 667.62

6 12 116 128
6.61 121.39
(Estos mismos operadores fueron quienes
tuvieron los números más grandes de chi2)
400
Operador a operador: = 0.000
Rechace
Ho y acepte Ha
(Existe una diferencia significativa entre los operadores)

Los operadores 4 y 5 están fuera del estándar:


El operador 4 es notablemente peor que el resto,
El operador 5 es notablemente mejor que los demás

¿Cuál es el próximo paso? Hable con todos los operadores para averiguar qué diferencias
pueden existen en sus técnicas.

El operador 4 no tenía experiencia en este tipo de trabajo y apenas se estaba acostumbrado a


soldar este producto en particular.

El operador 5 encontró un modo de mejor de hacer el ensamble, con lo cual consiguió mejorar
el trabajo de soldadura, aunque esto mostraba un grado de dificultad ergonómica. Se añadió
un colocador para ensamblar la parte en forma segura. (Esto también redujo el tiempo que
requerían los operadores para “acostumbrarse” a trabajar en esta forma)

401
Ejercicios

1. Se quiere evaluar la habilidad de tres inspectores de rayos


X en un aeropuerto para detectar artículos clave. Como
prueba se pusieron radios de transistores en 90 maletas,
cada inspector fue expuesto a 30 maletas conteniendo radios
mezcladas entre otras que nos los contenían. Los resultados
se resumen a continuación:
Inspectores
1 2 3

Radios detectados 27 25 22
Radios no detectados 3 5 8

¿Con un 95% de confianza, existe una diferencia entre los


inspectores?

Ho: p1 = p2 = p3; Ha: al menos una es diferente


Grados de libertad = (columnas - 1) ( filas -1)
402
Ejercicios

1. Se quiere evaluar si hay preferencia por manejar en un


carril de una autopista dependiendo de la hora del día. Los
datos se resumen a continuación:

Hora del día


Carril 1:00 3:00 5:00
Izquierdo 44 37 18
Central 28 50 72
Derecho 8 13 30

¿Con un 95% de confianza, existe una diferencia entre las


preferencias de los automovilistas dependiendo de la hora?

Ho: P1 = P2 = P3; Ha: al menos una es diferente


Grados de libertad = (columnas - 1) ( filas -1)

403
Coeficiente de Contingencia
 Coeficiente de contingencia es el grado de relación o
dependencia de las clasificaciones en la tabla de contingencias
es:

X2
C2
X2 N

 Donde N es la frecuencia total y X es el estadístico Chi


Cuadrado calculado

404
Coeficiente de Contingencia
 Para los datos del ejemplo anterior se tiene:

X2 66.22 2
C2 2  0.38
X N
2
66.22  393
2

 El valor máximo de C se obtiene de:

k 2 82
Max C    0.866
k 8
405
Correlación de atributos
 Para tablas de orden k * k, el coeficiente de correlación, r, es :

2
X
r
N (k  1)
 Donde 0<= r <= 1

406
VI.B.9 Pruebas de Hipótesis
no paramétricas

407
Pruebas no paramétricas
 Las pruebas paramétricas asumen una distribución para la
población, tal como la Normal

 Las pruebas no paramétricas no asumen una distribución


específica de la población

 Bajo los mismos tamaños de muestra la Potencia o probabilidad


de rechazar Ho cuando es falsa es mayor en las pruebas
paramétricas que en las no paramétricas

 Una ventaja de las pruebas no paramétricas es que los


resultados de la prueba son más robustos contra violación de
los supuestos

408
Prueba de Hipótesis

Variable Atributo

No Normal Tablas de
Contingencia de 

Varianza Medianas
Correlación
Correlación
Homogeneidad
Prueba de signos
de la Variación
de Levene Wilcoxon
Normal
Mann-
Whitney Variancia Medias
Kurskal-
 Pruebas de t
Wallis
Prueba-F Muestra-1
Residuos
Prueba de Mood Muestra-2
Homogeneidad distribuidos
Friedman de la Variación ANOVA
de Bartlett Una vía normalmente
Dos vías
Correlación
Regresión 409
Resumen de pruebas de Hipótesis
Datos Normales Datos No Normales
Pruebas de Variancias
Pruebas de Varianzas
X2 : Compara la variancia de una Homogeneidad de la varianza de
muestra con una variancia de un Levene : Compara dos o más
universo conocido. varianzas de muestras de la misma
población.
Prueba F : Compara dos varianzas
de muestras.

Homogeneidad de la variancia de
Bartlett: Compara dos o más
varianzas muestras de la misma
población.

410
Resumen de pruebas de Hipótesis
Datos Normales Datos No Normales
Pruebas de los Promedios Pruebas de la Mediana

Prueba t de 1 muestra : Prueba si el promedio Prueba de signos o Prueba Wilcoxon : Prueba si la


de la muestra es igual a un promedio mediana de la muestra es igual a un valor
conocido o meta conocida. conocido o a un valor a alcanzar.
Prueba t de 2 muestras : Prueba si los dos Prueba Mann-Whitney : Prueba si dos medianas
promedios de las muestras son iguales. de muestras son iguales.
ANOVA de un factor: Prueba si más de dos Prueba Kruskal-Wallis: Prueba si más de dos
promedios de las muestras son iguales. medianas de muestras son iguales. Asume que
ANOVA de dos factores : Prueba si los todas las distribuciones tienen la misma forma.
promedios de las muestras clasificadas bajo Prueba de la mediana de Mood : Otra prueba para
dos categorías, son iguales. más de dos medianas. Prueba más firme para
los valores atípicos contenidos en la información.
Correlación : Prueba la relación lineal entre dos Prueba Friedman : Prueba si las medianas de las
variables. muestras, clasificadas bajo dos categorías, son
iguales.
Regresión : Define la relación lineal entre una Correlación : Prueba la relación lineal entre dos
variable dependiente y una independiente. variables.
(Aquí la "normalidad" se aplica al valor
residual de la regresión)
411
Acciones a tomar con datos No Normales
Revise y asegúrese de que los datos no siguen una distribución normal.

• Desarrollar una Prueba de normalidad (para verificar realmente lo


anormal. Para la prueba de Bartlet el valor de p debe ser < 0.05)

• Desarrollar una Prueba de Corridas (para verificar que no existen


sucesos no aleatorios que puedan haber distorsionado la información)

• Revisar la información para detectar errores (tipográficos, etc.).


Investiguar los valores atípicos.

• Una muestra pequeña (n < 30) proveniente de un universo normal, se


mostrará algunas veces como anormal.

Intentar transformar los datos. Las transformaciones comunes incluyen:


- Raíz cuadrada de todos los datos
- Logaritmo de todos los datos
- Cuadrado de todos los datos

• Si la información es todavía anormal, entonces usar las herramientas no


paramétricas. 412
7B8. Definiciones
 Promedio : Es la media aritmética de la información. Es la suma de todos
los datos, dividida entre el número de datos de referencia.

 Mediana: Valor del punto medio de los datos, cuando se ordenan en forma
ascendente (en caso de datos pares, obtener promedio).

 Moda : Valor que se repite con más frecuencia sobre el conjunto de datos.
Ejemplo:
Se cuestionó a veinte personas sobre cuánto tiempo les tomaba estar
listas para ir a trabajar, en las mañanas. Sus respuestas (en minutos) se
muestran más adelante. ¿Cuáles son el promedio y la mediana para esta
muestra?

30, 37, 25, 35, 42, 35, 35, 47, 45, 60


39, 45, 30, 38, 35, 40, 44, 55, 47, 43 413
Un dibujo dice más que mil palabras

Promedio
Mediana

28.0 35.0 42.0 49.0 56.0 63.0


-------+---------+---------+---------+---------+---------+------ C1

Promedio = 40.35 Mediana = 39.5

El promedio puede estar influenciado considerablemente por los


valores atípicos porque, cuando se calcula un promedio, se incluyen
los valores reales de estos valores.

La mediana, por otra parte, asigna la misma importancia a todas las


observaciones, independientemente de los valores reales de los
valores atípicos, ya que es la que sencuentra en la posición media de
los valores ordenados.
414
Pruebas Alternativas comúnmente usadas
Pruebas para datos No normales Analogía con datos normales

• Prueba de Corridas : Calcula la probabilidad de • Prueba de Corridas (la misma


que un X número de puntos de referencia, esté prueba para ambos tipos de
por encima o por debajo del promedio información)
aleatoriamente.

• Prueba de signos, de 1 muestra : Prueba la • Prueba t de una muestra


probabilidad de que la mediana de la muestra,
sea igual al valor hipotético.

• Prueba Mann-Whitney : Comprueba el rango


de dos muestras, por la diferencia entre dos • Prueba t de 2 muestras
medianas del universo.

• Prueba de la Mediana de Mood : Prueba para


más de dos medianas del universo. Más robusta • ANOVA de un factor
para los valores atípicos o para los errores en la
información.

415
Prueba de Rachas
Considere los siguientes datos (que se muestran aquí en orden cronológico):
325, 210, 400, 72, 150, 145, 110, 507, 56, 120, 99, 144, 110, 110,
320, 290, 101, 0, 80, 500, 201, 50, 140, 80, 220, 180, 240, 309, 80

Es importante tener los datos registrados en orden cronológico.

Una representación gráfica de los datos se asemeja a esto:


600

500
Promedio
Primera 400

"corrida"
300

200

100

Segunda ”racha"
Racha: Un punto o una serie consecutiva de puntos que caen
en un lado del promedio.
Número total de Rachas: 12
Número total de puntos > al promedio: 11
Número total de puntos < al promedio: 18
Prueba de Rachas
Ho: Los datos son aleatorios
Ha:Los datos NO so aleatorios

Prueba de Rachas
Promedio K = 184.4483 Promedio

Número de rachas observado = 12

Número de rachas esperado = 14.6552


=> No se rechaza Ho Este es el valor p
de las Prueba de
11 observaciones por encima de K; 18 por Corridas
debajo
La prueba es significativa en p= 0.2860
No se puede rechazar Ho con valor alfa =
0.05
Ya que p > 0.05, no podemos rechazar la hipótesis nula.
Los datos son aceptados, siendo aleatorios.
Cálculos de la Prueba de Rachas
El estadístico Z cuando n > 20 se calcula como:

Z = (G - MediaG) / DesvStG

Con MediaG = 1 + (2n1*n2) / (n1 + n2)


DesvStG = Raiz [ (2n1*n2) (2n1*n2 - n1 -n2) / (n1 + n2)^2* (n1+n2 -1)

Del ejemplo anterior G = 12; n1 = 11 n2 = 18

MediaG = 14.655 DesStG = 2.4843

Z1 = (12 - 14.655) / 2.4843 = -1.0687


P(Z1) = 0.1430 y para dos colas se tiene

P(Z1) + P(Z2) = 0.2860 > Alfa crítico de 0.05, no rechazándose Ho

Si las n1 y n2 son menores a 21, entonces se consulta la tabla de


valores críticos para el número de Rachas G
418
Corrida con Minitab
 Stat > Nonparametrics > Runs Test
Variable C1, Above and below the mean

Runs Test: C1
Runs test for C1
Runs above and below K = 184.448
The observed number of runs = 12
The expected number of runs = 14.6552
11 observations above K, 18 below
P-value = 0.285
P > 0.05
No rechazar
Ho 419
Prueba de Signos de la Mediana

Ho : La mediana de la muestra es igual a la mediana de la hipótesis


Ha : Las medianas son diferentes

Ejemplo (usando los datos del ejemplo anterior):

Ho: Valor de la mediana = 115.0


Ha: Valor de la mediana diferente de 115.0

N DEBAJO IGUAL ENCIMA VALOR P MEDIANA


29 12 0 17 0.4576 144.0

Ya que p >0.05, no se puede rechazar la hipótesis nula.


No se puede probar que la mediana real y la mediana hipotética son
diferentes.

En las páginas siguientes se muestra el detalle del cálculo.


420
Cálculos de la Prueba de Signos de la Mediana

Ejemplo: Con los datos del ejemplo anterior y ordenándo de menor a


mayor se tiene: n = 29, Mediana de Ho = 115

No. Valor Signo No. Valor Signo No. Valor Signo


1 0 - 11 110 - 21 220 +
2 50 - 12 110 - 22 240 +
3 56 - 13 120 + 23 290 +
4 72 - 14 140 + 24 309 +
5 80 - 15 144 + 25 320 +
6 80 - 16 145 + 26 325 +
7 80 - 17 150 + 27 400 +
8 99 - 18 180 + 28 500 +
9 101 - 19 201 + 29 507 +
10 110 - 20 210 +

Con la mediana en 144. Si el valor contra el cual se desea


probar es 115, entonces hay 12 valores por debajo de el (-) y 17
valores por arriba (+).
421
Cálculos de la Prueba de Signos de la Mediana

El estadístico X es el el número de veces que ocurre el signo menos


frecuente, en este caso el 12 (-).

Cómo n  25, se calcula el estadístico Z para la prueba de signos con:

Z = [ (Y + 0.5) - (0.5*n) ]/ 0.5  n

En este caso Z1 = - 0.74278 y P(Z1) = 0.2288 para la cola izquierda


en forma similar P(Z2) 0-2288 para la cola derecha, por lo que la
probabilidad total es 0.4576 >> 0.05 del criterio de rechazo.

Si n hubiera sido < 25 entonces se hubiera consultado la tabla de


valores críticos para la prueba de signo.
422
Prueba de Signos de la Mediana

¿Es esto correcto?¿144 podría ser igual a 115?


Bueno, veamos una gráfica de la información

0 100 200 300 400 500

115 144
Después de todo, tal vez
esto SEA lo correcto. 423
Corrida en Minitab
 Stat > Nonparametrics > 1-Sample sign Variable C1
Confidence interval 95% Test Median 115 Alternative Not equal
Sign Test for Median: Signos
Sign test of median = 115.0 versus not
= 115.0

N Below Equal Above


P Median
Signos 29 12 0 17
0.4583 144.0
Como P > 0.05 no se rechaza Ho y la mediana es 115

424
Prueba de Signos de la Mediana
Para observaciones pareadas

Calificaciones de amas de casa a dos limpiadores de ventanas:

Ho: p = 0.5 no hay preferencia de A sobre B


Ha: p<>0.5
Ama Limpiador
Casa A B

1 10 7 ¿Hay evidencia que indique


cierta preferencia de las amas
2 7 5
de casa por lo limpiadores?
3 8 7
4 5 2
5 7 6 425
Prueba de Signos de la Mediana
Producto
Familia A B Media = 0.5*n
Desv. Estand.= 0.5*raiz(n)
1 - +
2 - + Zc = (Y – media) / Desv. Estánd.
3 + - Rechazar Ho si Zc ><Zalfa/2
4 - +
5 0 0
6 - + ¿Hay evidencia que indique
7 - + cierta preferencia por un
8 + - Producto A o B?
9 - +
10 - +
426
11 - +
Prueba de Signos de la Mediana

Media = 0.5*11 = 5.5


Desv. Estand.= 0.5*raiz(n) = 1.67

Para Zc = (8 – 5.5) / 1.67 = 1.497

Zexcel = 1.96 para alfa/2 = 0.025

Como Zc < Zexcel no se rechaza Ho o


Como p value = 0.067 > 0.025
No hay evidencia suficiente de que los
Consumidores prefieran al producto B
427
Prueba rango con signo de Wilconox
 Es la alternativa no paramétrica de la prueba paramétrica de muestras
pareadas
 Ejemplo: HO: Las poblaciones son idénticas Ha: Caso contrario
Trabaja Método Método Diferen Abs(difere Rango
dor 1 2 cias n.) Rango c/signo
1 10.2 9.5 0.7 0.7 8 8
2 9.6 9.8 -0.2 0.2 2 -2
3 9.2 8.8 0.4 0.4 3.5 3.5
4 10.6 10.1 0.5 0.5 5.5 5.5
5 9.9 10.3 -0.4 0.4 3.5 -3.5
6 10.2 9.3 0.9 0.9 10 10
7 10.6 10.5 0.1 0.1 1 1
8 10 10 0 0  Eliminar  
9 11.2 10.6 0.6 0.6 7 7
10 10.7 10.2 0.5 0.5 5.5 5.5
11 10.6 9.8 0.8 0.8 9 9
T =428
44
Prueba rango con signo de Wilconox

Distribución muestral T para poblaciones idénticas


Se aproxima a la distribución normal para n >= 10

T 0 T 
n(n  1)(2n  1)
6
En este caso n = pares eliminando las que son iguales con dif. = 0 para el
trabajador 8.

 = raiz(10 x 11 x 21/6) = 19.62


Z = (T – )/ = 44/19.62 = 2.24

Z alfa/2 = Z0.025 = 1.96

Como Zc = 2.24 > Z0.025 se rechaza Ho, los métodos son diferentes

429
Prueba en Minitab para prueba de
mediana con Wilconox
 File> Open worksheet > Exh_Stat
 Stat > Nonparametrics > 1-Sample Wilconox Achievement
Variables C1 Test Median 77 77
Altenative Not equal 88
85
Wilcoxon Signed Rank Test: Achievement
Test of median = 77.00 versus median not = 77.00 74
for Wilcoxon Estimated 75
for Wilcoxon Estimated
N Test Statistic P Median 62
Achievement 9 8 19.5 0.889 77.50 80
70
Ho: Mediana = 77 Ha: Mediana <> 77
Como P de 0.889 >> alfa de 0.05 no se rechaza Ho 83

430
Prueba de Mann-Whitney
Se llevó a cabo un estudio que analiza la frecuencia del pulso en dos
grupos de personas de edades diferentes, después de diez minutos de
ejercicios aeróbicos.

Los datos resultantes se muestran a continuación.

Edad 40-44 Edad 16-20


C1 C2
¿Tuvieron diferencias 140 130
significativas las frecuencias de 135 166
pulso de ambos grupos? 150 128
140 126
144 140
154 136
160 132
144 128
136 124
148
431
Prueba de Mann-Whitney
 Ordenando los datos y asignándoles el (rango) de su posición relativa se tiene (promediando
posiciones para el caso de que sean iguales):
Edad 40-44 Edad 16-20
C1 C2
(7) 135 (1) 124
(8.5) 136 (2) 126
(11) 140 (3.5) 128
(11) 140 (3.5) 128
(13.5) 144 (5) 130
(13.5) 144 (6) 132
(15) 148 (8.5) 136
(16) 150 (11)140
(17) 154 (15)166
(18) 160

n1 = 10 n2 = 9
Ta = 130.5 Tb = 55.5
432
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas
Ho: 1 = 2 Ha: 1  2 1, 2 = Medianas de las poblaciones
Ordenando los datos y asignándoles su posición relativa se tiene:
Ua = n1*n2 + (n1) * (n1 + 1) /2 - Ta
Ub = n1*n2 + (n2) * (n2 + 1) /2 - Tb
Ua + Ub = n1 * n2

Ua = 90 + 55 - 130.5 = 14.5 P(Ua) = 0.006 Ub = 90 + 45 - 55.5 = 79.5


El menor de los dos es Ua.
Para alfa = 0.05 el valor de Uo = 25
Como Ua < 25 se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente


existe una diferencia significativa entre los dos grupos de edad.
433
Prueba de Mann-Whitney
Ho: Las distribuciones de frecuencias relativas de las poblaciones A y B son iguales
Ha: Las distribuciones de frecuencias relativas poblacionales no son idénticas

Ua = 14.5 Ub = 79.5
Utilizando el estadístico Z y la distribución normal se tiene:
45 12.24
Z = [ (U - (n1* n2 / 2 ) / Raiz (n1 * n2 * (n1 + n2 + 1) / 12)
Con Ua y Ub se tiene:
Za = (14.5 - 45) / 12.24 = - 2.49 P(Z) = 0.0064 similar a la anterior
Zb = (79.5 -45) / 12.24 = 2.81 P(total) = 2 * 0.0064 = 0.0128 menor  = 0.05
El valor crítico de Z para alfa 0.025 por ser prueba de dos colas, es 1.96.
Como Za > Zcrítico se rechaza la Hipótesis Ho de que las medianas son iguales.

Dado que p < 0.05, rechazamos la hipótesis nula. Estadísticamente


existe una diferencia significativa entre los dos grupos de edad.
434
Prueba de Mann-Whitney
16-20 años de edad
130 166 128 126 140 136 132 128 124
140 10 -26 12 14 0 4 8 12 16
40-44 años de

135 5 -31 7 9 -5 -1 3 7 11
150 20 -16 22 24 10 14 18 22 26
140 10 -26 12 14 0 4 8 12 16
144 14 -22 16 18 4 8 12 16 20
154 24 -12 26 28 14 18 22 26 30
160 30 -6 32 34 20 24 28 32 36
edad

144 14 -22 16 18 4 8 12 16 20
136 6 -30 8 10 -4 0 4 8 12
148 18 -18 20 22 8 12 16 20 24

Diferencias entre los encabezados de


los renglones y las columnas
De esta manera, se calcula la mediana de todas estas diferencias, denominada
"punto estimado". Este punto estimado es una aproximación de la diferencia entre
las medianas de los dos grupos (ETA1 y ETA2).

Una vez ajustados los "enlaces" (eventos de un mismo valor en ambos grupos de
información), Minitab usa este punto estimado para calcular el valor p.
Corrida en Minitab
 Stat > Nonparametrics > Mann Whitney
First Sample C1 Second Sample C2 Conf. Level 95%
Alternative Not equal

Mann-Whitney Test and CI: C1, C2


N Median P>0.05
C1 10 144.00 Se rechaza Ho
C2 9 130.00
Point estimate for ETA1-ETA2 is 12.00
95.5 Percent CI for ETA1-ETA2 is (4.01,20.00)
W = 130.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.0143
The test is significant at 0.0140 (adjusted for ties)
436
Prueba de Kruskal Wallis
Ordenando los datos de ventas y asignándoles el (rango) de su posición relativa se tiene
(promediando posiciones para el caso de que sean iguales):

Zona 1 Zona 2 Zona 3


(15.5) 147 (17.5) 160 (24) 215
(17.5) 17.5 (14) 140 (8) 127
(9) 128 (21) 173 (2) 98
(19) 162 (4) 113 (15.5) 127
(12) 135 (1) 85 (23) 184
(10) 132 (7) 120 (3) 109
(22) 181 (25) 285 (20) 169
(13) 138 (5) 117
(11) 133
(6) 119

n1 = 8 n2 = 10 n3 = 7 N = n1 + n2 + n3 = 25
Ta = 118 Tb = 111.5 Tc = 95.5

437
Prueba de Kruskal Wallis

Ho: Las poblaciones A, B y C son iguales


Ha: Las poblaciones no son iguales
Ho: 1 = 2 = 3 Ha: 1  2  3 ; 1, 2, 3 = Medianas de las poblaciones

Calculando el valor del estadístico H se tiene:


H = [ 12 /( N* ( N + 1)) ] * [ Ta2 / n1 + Tb2 / n2 + Tc2 / n3 ] - 3 * ( N +1 )
H = 0.01846 * (1740.5 + 1243.225 + 1302.893 ) - 78 = 1.138

Se compara con el estadístico 2 para  = 0.05 y G.l. = k - 1 = 3-1 = 1 (k muestras)


2 crítico = 5.991 (válido siempre que las muestras tengan al menos 5 elementos)

Como H < 2 crítico, no se rechaza la Hipótesis Ho: Afirmando que no hay diferencia
entre las poblaciones

438
Corrida en Minitab
 Stat > Nonparametrics > Kruskal Wallis
Response C1 Factor C2 OK

Kruskal-Wallis Test: Datos versus Factor


Kruskal-Wallis Test on Datos
Factor N Median Ave Rank Z
Zona 1 7 138.0 14.7 0.98
Zona 2 10 126.5 11.1 -0.82
Zona 3 7 127.0 12.3 -0.10
Overall 24 12.5 P > 0.05
H = 1.08 DF = 2 P = 0.581 No se rechaza Ho
H = 1.09 DF = 2 P = 0.581 (adjusted for ties)
439
Prueba de Medianas de Mood
 Realiza prueba de hipótesis de igualdad de medias en un diseño de una
vía. La prueba es robusta contra Outliers y errores en datos y es
adecuada para análisis preliminares

 Determina si K grupos independientes han sido extraidas de la misma


población con medianas iguales o poblaciones con formas similares

 Con base en la gran mediana, anotar un signo positivo si la


observación excede la mediana o un signo menos si es menor. Los
valores que coincidan se reparten en los grupos

 Hacer una tabla de contingencia K x 2 con las frecuencias de signos


más y menos en cada grupo K

440
Prueba de Medianas de Mood
 Se determina el estadístico Chi Cuadrada con:

(O  E ) 2
 
2

E
Probar Ho: Todas las medianas son iguales
Ha: Al menos una mediana es diferente

Se compara Chi Cuadrada calculada con Chi Cuadrada de alfa para


0.05 y (reng – 1)*(Col – 1) grados de libertad

441
Corrida con Minitab
Se les da a 179 participantes una conferencia con
dibujos para ilustrar el tema. Después se les da la
prueba OTIS que mide la habilidad intelectual. Los
participantes se clasificaron por nivel educativo 0-No
prof., 1-Prof., 2-Prepa

Ho: h1 = h2 = h3 Ha: no todas las medianas son


iguales
 File > Open Worksheet > Cartoon.mtw
 Stat > Nonparametrics > Mood’s Median Test
Response Otis Factor ED Ok
442
Corrida con Minitab
Mood Median Test: Otis versus ED

Mood median test for Otis P>0.05


Chi-Square = 49.08 DF = 2 P = 0.0005 Se rechaza Ho
Individual 95.0% CIs
ED N<= N> Median Q3-Q1 ----+---------+---------+---------
+--
0 47 9 97.5 17.3 (-----*-----)
1 29 24 106.0 21.5 (------*------)
2 15 55 116.5 16.3 (----*----)
----+---------+---------+---------+--
96.0 104.0 112.0 120.0
Overall median = 107.0 443
Diseños factoriales aleatorias
bloqueados de Friedman
Esta prueba es una alternativa al ANOVA de dos vías, es
una generalización de las pruebas pareadas con
signo. La aditividad es requerida para para estimar
los efectos de los tratamientos

Ho: Los tratamientos no tienen un efecto significativo


Ha: Algunos tratamientos tienen efecto significativo

444
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados de salida:
 Se muestra el estadístico de prueba con distribución

Chi Cuadrada aproximada con gl = Tratamientos – 1.

 Si hay observaciones parecidas en uno o más


bloques, se usa el rango promedio y se muestra el
estadístico corregido

 La mediana estimada es la gran mediana más el


efecto del tratamiento

445
Diseños factoriales aleatorias
bloqueados de Friedman
Ejemplo:
 Se evalúa el efecto del tratamiento de una droga en

la actividad enzimática con tres niveles, probado en


cuatro animales

 Open the worksheet EXH_STAT.MTW.


 Stat > Nonparametrics > Friedman.
Response, seleccionar EnzymeActivity.
En Treatment, seleccionar Therapy.
En Blocks, seleccionar Litter. Click OK.

446
Diseños factoriales aleatorias
bloqueados de Friedman
Datos: EnzymeActivity Therapy Litter
0.15 1 1
0.26 1 2
0.23 1 3
0.99 1 4
0.55 2 1
0.26 2 2
-0.22 2 3
0.99 2 4
0.55 3 1
0.66 3 2
0.77 3 3
0.99 3 4 447
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
Friedman Test: EnzymeActivity versus Therapy
blocked by Litter

S = 2.38 DF = 2 P = 0.305 No rechazar Ho


S = 3.80 DF = 2 P = 0.150 (adjusted for ties)
Sum
of
Therapy N Est Median Ranks
1 4 0.2450 6.5
2 4 0.3117 7.0
3 4 0.5783 10.5
Grand median = 0.3783
448
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:
 El estadístico de prueba S tiene un valor P de 0.305 sin ajustar
para observaciones en cero y 0.150 para el valor ajustado.

 Por tanto no hay evidencia suficiente para rechazar Ho

 Las medianas estimadas asociadas con los tratamientos son la


gran mediana más los efectos estimados de los tratamientos.

 El estadístico de prueba se determina con base a los rangos en


cada bloque y totales

449
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

450
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

451
Diseños factoriales aleatorias
bloqueados de Friedman
Resultados:

452
Prueba de igualdad de
varianzas de Levene
 Se usa para probar la hipótesis nula de que las varianzas de k
múltiples poblacionales son iguales

 Las igualdad de varianzas en las muestras se denomina


homogeneidad de varianzas

 La prueba de Levene es menos sensible que la prueba de


Bartlett o la prueba F cuando se apartan de la normalidad

 La prueba de Bartlett tiene un mejor desempeño para la


distribución normal o aproximadamente normal

453
Prueba de igualdad de
varianzas de Levene
Para dos muestras el procedimiento es como sigue:

 Determinar la media

 Calcular la desviación de cada observación respecto a la


media

 Z es el cuadrado de las desviaciones respecto a la media

 Aplicar la prueba t a las dos medias de los datos

454
Rot Temp Oxygen
13 10 2
Prueba de igualdad 11 10 2

de Varianzas-Minitab 3
10
10
10
2
6
4 10 6
Se estudian tamaños de papa 7 10 6
inyectando con bacterias y
15 10 10
sujetas a diferentes
2 10 10
temperaturas. Antes del
ANOVA se verifica la 7 10 10
igualdad de varianzas 26 16 2
19 16 2
24 16 2
 Stat > ANOVA > Test for
equal variances 15 16 6
22 16 6
Response Rot
18 16 6
Factors Temp Oxigen
20 16 10
Confidence level 95%
24 16 10
8 16 10
455
Resultados

456
Resultados
Test for Equal Variances: Rot versus Temp, Oxygen
95% Bonferroni confidence intervals for standard deviations
Temp Oxygen N Lower StDev Upper
10 2 3 2.26029 5.29150 81.890
10 6 3 1.28146 3.00000 46.427
10 10 3 2.80104 6.55744 101.481
16 2 3 1.54013 3.60555 55.799
16 6 3 1.50012 3.51188 54.349
16 10 3 3.55677 8.32666 128.862
Bartlett's Test (normal distribution)

Test statistic = 2.71, p-value = 0.744 P>0.05 no rechazar Ho


Levene's Test (any continuous distribution)
Test statistic = 0.37, p-value = 0.858
457
Prueba de la concordancia del
Coeficiente de Kendall
 El coeficiente expresa el grado de asociación entre las
calificaciones múltiples realizadas por un evaluador

Ho: Las variables son independientes


Ha: Las variables están asociadas

 Kendall usa la información relacionada con las calificaciones


relativas y es sensible a la seriedad de mala clasificación

Por ejemplo para K = jueces N = Muestras = 10

Rango medio = 220 / 22 S = 1066 Gl = n-1 = 9


Chi Cuadrada crítica = X2 0.01,9 = 21.67
458
Prueba de la concordancia del
Coeficiente de Kendall
 El Estadístico Chi Cuadrada calculado es:

 Como Chi Cuadrada de alfa es menor que la calculada, los


cuatro jueces están asociados significativamente. Constituyen
un panel uniforme. No quiere decir que estén en lo correcto,
solo que responden de manera uniforme a los estímulos

459
El coeficiente de correlación de
rangos de Spearman (rs)
 El coeficiente de correlación es una medida de la asociación que
requiere que ambas variables sean medidas en al menos una
escala ordinal de manera que las muestras u observaciones a
ser analizadas pueden ser clasificadas en rangos en dos series
ordenadas
6 d 2

Ho: Las variables son independientes


rs  1 
N N
3
Ha: Las variables están asociadas

 Para el ejemplo anterior si N = 10, el coeficiente es:

6(5.5)
rs  1   1  0.03  0.97
990
460
Coeficiente de correlación de
rangos para monotonía de
preferencias
Una persona interesada en adquirir un TV asigna
rangos a modelos de cada uno de 8 fabricantes
Rango
Fab. Preferencia Precio
Di
(rango) Di cuadrada

6 36
1 7 449.50 (1)
-1 1
2 4 525.00 (5)
-1 1
3 2 479.95 (3)
4 6 499.95 (4) 2 4

5 1 580.00 (8) -7 49

6 3 549.95 (7) -4 16
7 8 469.95 (2) 6 36
8 5 532.50 (6) -1 1 461
Coeficiente de correlación de
rangos para monotonía de
preferencias
Ho: No existe asociación entre los rangos
Ha: Existe asociación entre los rangos o es positiva o negativa

El coeficiente de correlación de rangos de Spearman es:

Rs = 1 – 6*suma(di cuadrada) / (n(n cuadrada – 1))

En este caso: Rs = 1 – 6(144)/(8*(64-1) = -0.714

R0 se determina de la tabla de Valores críticos del coeficiente de


correlación del coeficiente de correlación de rangos de Spearman

Rt = 0.686

Por tanto si hay asociación significativa en las preferencias

462
Tabla de constantes
n Alfa=0.05 Alfa = 0.025
5 0.900 -
6 0.829 0.886
7 0.714 0.786
8 0.643 0.738
9 0.600 0.683
10 0.564 0.648
11 0.523 0.623
12 0.497 0.591
13 0.475 0.566
14 0.457 0.545
15 0.441 0.525
16 0.425 0.507
17 0.412 0.490
18 0.388 0.476
19 0.377 0.462
20 0.368 0.450
21 0.359 0.438
22 0.351 0.428
23 0.343 0.418
24 0.336 0.409
25 0.329 0.400
26 0.329 0.392
27 0.323 0.385
28 0.317 0.377
29 0.311 0.370
30 0.305 0.364 463
Corrida con Minitab
Para la corrida en Minitab primero se Fabric Prefe- Preci
deben determinar los rangos en ante rencia Precio o
forma manual para las variables X
y Y. 1 7 1 449
 Stat > Basic statistics > Correlation 2 4 5 525
Variables Preferencia Precio 3 2 3 479
Correlations: Preferencia, Precio 4 6 4 499
Pearson correlation of 5 1 8 580
Preferencia and Precio = -0.714 6 3 7 549
P-Value = 0.047 7 8 2 469
8 5 6 532
464
Ejemplo con Minitab
Se estudia la relación entre colágeno y
Proline en pacientes con cirrosis Paciente Colágeno Proline
 Stat > Basic statistics > Correlation
1 7.1 2.8
Variables Colágeno Proline
2 7.1 2.9
3 7.2 2.8
Correlations: Colageno, Proline
4 8.3 2.6
Pearson correlation of Colageno 5 9.4 3.5
and Proline = 0.935
6 10.5 4.6
P-Value = 0.002 7 11.4 5

465
Resumen de pruebas
no paramétricas
 Prueba de signos de 1 muestra: Prueba la igualdad de la
mediana a un valor y determina el intervalo de confianza

 Prueba de Wilconox de 1 muestra: Prueba la igualdad de la


mediana a un valor con rangos con signo y determina el
intervalo de confianza

 Comparación de dos medianas poblacionales de Mann Whitney:


Prueba la igualdad de las medianas y determina el intervalo de
confianza

466
Resumen de pruebas
no paramétricas

 Comparación de igualdad de medianas poblacionales de Kruskal


Wallis: Prueba la igualdad de las medianas en un diseño de una
vía y determina el intervalo de confianza

 Comparación de medianas poblacionales de Mood: Prueba la


igualdad de medianas con un diseño de una vía

467
468
469
VI.C Análisis del Modo y
Efecto de Falla (FMEA)

470
¿ Qué es el FMEA?
El Análisis de del Modo y Efectos de Falla es un grupo sistematizado de
actividades para:

 Reconocer y evaluar fallas potenciales y sus efectos.

 Identificar acciones que reduzcan o eliminen las


probabilidades de falla.

 Documentar los procesos con los hallazgos del análisis.

 Existe el estándar MIL-STD-1629, Procedure for Performing a Failure


Mode, Effects and Criticality Analysis
471
Propósitos del FMEA
 Mejorar la calidad, confiabilidad y seguridad de los
productos y procesos evaluados

 Reducir el tiempo y costo de re-desarrollo del producto

 Documenta y da seguimiento a acciones tomadas para


reducir el riesgo

 Soporta el desarrollo de planes de control robustos

472
Propósitos del FMEA
 Soporta el desarrollo de planes de verificación del
desarrollo de diseño robusto

 Apoya a priorizar y enfocarse en eliminar/reducir


problemas de proceso y producto y/o previene la
ocurrencia de problemas

 Mejora la satisfacción del cliente/consumidor

473
Tipos del FMEA
 AMEF de concepto (CFMEA)
 A nivel de sistema, subsistema y componente

 AMEF de diseño (DFMEA)

 AMEF de Proceso (PFMEA)

 AMEF de maquinaria (como aplicación del DFMEA)

474
Tipos de FMEAs
 FMEA de Diseño (AMEFD), su propósito es analizar como
afectan al sistema los modos de falla y minimizar los
efectos de falla en el sistema. Se usan antes de la
liberación de productos o servicios, para corregir las
deficiencias de diseño.

 FMEA de Proceso (AMEFP), su propósito es analizar como


afectan al proceso los modos de falla y minimizar los
efectos de falla en el proceso. Se usan durante la
planeación de calidad y como apoyo durante la producción
o prestación del servicio.

475
PFMEA o AMEF de Proceso

Fecha límite:
Concepto Prototipo Pre-producción /Producción

FMEAD
FMEAP

FMEAD FMEAP
Característica de Diseño Paso de Proceso
Falla Forma en que el Forma en que el proceso falla
producto o servicio falla al producir el requerimiento
que se pretende
Controles Técnicas de Diseño de Controles de Proceso
Verificación/Validación
476
Flujo del FMEA y su rol
en evitar el Modo de Falla
 DFMEA
 Es un análisis detallado de los modos de falla

potenciales relacionados con las funciones primarias y


de interfases del sistema.

 Es el documento primario para demostrar que se han


evitado errores e identifica los controles y acciones
para reducir los riesgos asociados

477
Beneficios de los tipos de FMEA
FMEA de Diseño
Soporta el proceso de diseño al reducir el riesgo de fallas
(incluyendo las salidas no intencionadas) por:

 Soporta la evaluación objetiva de diseño, incluyendo


requerimientos funcionales y alternativas de diseño

 Evaluar los diseños iniciales sobre requerimientos de


manufactura, ensamble, servicio y reciclado

 Incrementar la probabilidad de que los modos de falla


potencial y sus efectos en el sistema y operación del
producto se han considerado en el procesos de
diseño/desarrollo
478
Beneficios de los tipos de FMEA
FMEA de Diseño
 Proporcionar información adicional como apoyo en la
planeación exhaustiva de programas de diseño
eficiente, desarrollo y validación

 Desarrollo de una lista priorizada de modos de falla


potenciales de acuerdo a su efecto en el “cliente”
estableciendo un sistema de prioridades para mejoras
al diseño, desarrollo, validación, prueba y análisis

 Proporcionar un formato de problemas pendientes para


recomendar y dar seguimiento de acciones que
reduzcan el riesgo
479
Beneficios de los tipos de FMEA
FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:
 Identifica las funciones y requerimientos del proceso

 Identifica modos de falla potenciales relacionados con el


producto y proceso

 Evalúa los efectos de las fallas potenciales con el cliente

 Identifica las causas potenciales en el proceso de


manufactura

 Identifica las variables de proceso en las cuales hay que


enfocarse para reducir las fallas muy lejanas

480
Beneficios de los tipos de FMEA
FMEA de Proceso
Los beneficios de un FMEA de proceso incluyen:

 Identificar las variables del proceso centrandose en la


ocurrencia

 Reducción o detección de las condiciones de falla

 Identificar variables del proceso a las cuales enfocar el


control

 Desarrollar una lista ordenada clasificada de modos de falla


estandarizados para establecer un sistema de prioridades
481
Beneficios de los tipos de FMEA
FMEA de Proceso
 Sistema del prioridad del riesgo para consideraciones de
acciones preventivas y correctivas

 Documentar los resultados del proceso de manufactura o


proceso de ensamble

 Documenta los resultados del proceso de manufactura


o ensamble

 Identifica deficiencias del proceso para orientar a


establecer controles para reducir la ocurrencia de
productos no conformes o en métodos para mejorar su
detección
482
Beneficios de los tipos de FMEA
FMEA de Proceso
 Identifica características críticas y/o significativas
confirmadas

 Apoya en el desarrollo de Planes de Control a través de


todo el proceso de manufactura

 Identifica aspectos de preocupación en relación con la


seguridad del operador

 Retroalimenta información sobre cambios de diseño


requeridos y factibilidad de manufactura a las áreas de
diseño
483
Beneficios de los tipos de FMEA
FMEA de Proceso
 Se enfoca a modos de falla potenciales del producto
causados por deficiencias de manufactura o ensamble

 Confirma la necesidad de controles especiales en


manufactura y confirma las “Características Especiales”
designadas en el DFMEA

 Identifica modos de falla del proceso que pudieran


violar las reglamentaciones del gobierno o
comprometer la seguridad del personal, identificando
otras “Características especiales” – de Seguridad del
operador (OS) y con alto impacto (HI)
484
Salidas del FMEA de Proceso
 Una lista de modos potenciales de falla

 Una lista de Caracteríticas críticas y/o significativas

 Una lista de características relacionadas con la


seguridad del operador y con alto impacto

 Una lista de controles especiales recomendados para


las Características Especiales designadas y
consideradas en el Plan de control

485
Salidas del FMEA de Proceso
 Una lista de procesos o acciones de proceso para
reducir la Severidad, eliminar las causas de los modos
de falla del producto o reducir su tasa de ocurrencia, y
mejorar la tasa de Detección de defectos si no se
puede mejorar la capacidad del proceso

 Cambios recomendados a las hojas de proceso y


dibujos de ensamble

486
Modos de fallas vs
Mecanismos de falla

 El modo de falla es el síntoma real de la falla (altos


costos del servicio; tiempo de entrega excedido).

 Mecanismos de falla son las razones simples o


diversas que causas el modo de falla (métodos no
claros; cansancio; formatos ilegibles) o cualquier otra
razón que cause el modo de falla

487
Definiciones

Modo
Modode
deFalla
Falla

--La
Laforma
formaenenque
queun unproducto
productoooproceso
procesopuede
puedefallar
fallarpara
paracumplir
cumplir
con
conlas
lasespecificaciones
especificacionesoorequerimientos.
requerimientos.

--Normalmente
Normalmentese
seasocia
asociacon unDefecto,
conun Defecto,falla
fallaooerror.
error.

Diseño
Diseño Proceso
Proceso
Alcance
Alcanceinsuficiente
insuficiente Omisiones
Omisiones
Recursos
Recursosinadecuados
inadecuados Monto
Montoequivocado
equivocado
Servicio
Serviciono
noadecuado
adecuado Tiempo
Tiempodederespuesta
respuestaexcesivo
excesivo

488
Definiciones
Efecto
Efecto
--ElElimpacto enelelCliente
impactoen Clientecuando
cuandoelelModo
Modode
deFalla
Fallano
nose
sepreviene
previene
ninicorrige.
corrige.

--ElElcliente
clienteooelelsiguiente
siguienteproceso
procesopuede
puedeser
serafectado.
afectado.

Ejemplos:
Ejemplos: Diseño
Diseño Proceso
Proceso
Serv.
Serv.incompleto
incompleto Servicio
Serviciodeficiente
deficiente
Operación
Operaciónerrática
errática Claridad
Claridadinsuficiente
insuficiente
Causa
Causa
--Una
Unadeficiencia
deficienciaque
quegenera
generaelelModo
Modode
deFalla.
Falla.
--Las
Lascausas
causasson
sonfuentes deVariabilidad
fuentesde Variabilidadasociada
asociadaconconvariables
variables
de Entrada Claves
de Entrada Claves

Ejemplos:
Ejemplos: Diseño
Diseño Proceso
Proceso
Material
Materialincorrecto
incorrecto Error
Erroren
enservicio
servicio
Demasiado
Demasiadoesfuerzo
esfuerzo No
No cumple
cumplerequerimientos
requerimientos
489
Preparación
Preparación del
del AMEF
AMEF
 Se recomienda que sea un equipo
multidisciplinario

 El responsable del sistema, producto o proceso


dirige el equipo, así como representantes de las
áreas involucradas y otros expertos en la materia
que sea conveniente.

490
¿Cuando iniciar un FMEA?
 Al diseñar los sistemas, productos y procesos nuevos.
 Al cambiar los diseños o procesos existentes o que serán
usados en aplicaciones o ambientes nuevos.

 Después de completar la Solución de Problemas (con el fin de


evitar la incidencia del problema).

 El AMEF de diseño, después de definir las funciones del


producto, antes de que el diseño sea aprobado y entregado para
su manufactura o servicio.

 El AMEF de proceso, cuando los documentos preliminares del


producto y sus especificaciones están disponibles.
491
FMEA de Diseño - DFMEA

492
AMEF de Diseño

 El DFMEA es una técnica analítica utilizada por el


equipo de diseño para asegurar que los modos de
falla potenciales y sus causas/mecanismos asociados,
se han considerado y atendido

493
AMEF de Diseño
 El proceso inicia con un listado de lo que se espera
del diseño (intención) y que no hará el diseño

 Las necesidades y expectativas de los clientes de


determinan de fuentes tales como el QFD,
requerimientos de diseño del producto, y/o
requerimientos de manufactura/ensamble/servicio.

 Entre mejor se definan las características deseadas,


será más fácil identificar Modos de de falla
potenciales para toma de acciones correctivas /
preventivas.
494
Equipo de trabajo
 El equipo se divide en dos secciones:

 El equipo central (“core”) que participa en todas las


fases del FMEA y el equipo de soporte que apoya
conforme es requerido

 El apoyo de la alta dirección es crucial para el éxito

495
Alcance del DMEA
 El alcance se establece en el Diagrama de límites
(Boundary Diagram) por medio de consenso con el
equipo de:

 ¿Qué se va incluir? ¿Qué se va a excluir?

 Establecer los límites adecuados antes de hacer el


DFMEA evitará entrar en áreas que no se están
revisando o creando, para asegurar que el equipo
adecuado realice el análisis

496
Alcance del DMEA
 Para determinar la amplitud del alcance, se deben hacer las
decisiones siguientes:

 Determinar la estabilidad del diseño o desarrollo del proceso, a


lo mejor primero se deben aclarar y resolver asuntos pendientes
antes del DMFEA, ¿está finalizado o es un punto de control?

 ¿Cuántos atributos o características están todavía bajo discusión


o la necesidad debe determinarse?

 ¿Qué tan avanzado va el diseño o proceso para su terminación?


Tendrá cambios

497
Entradas al DFMEA
Herramientas de robustez
 Su propósito es reducir la probabilidad de campañas
de calidad, mejorar la imagen, reducir reclamaciones
de calidad e incrementar la satisfacción del cliente

 Se generan del diagrama P que identifica los cinco


factores de ruido, para ser atendidos a tiempo
haciendo al diseño insensible al ruido

498
Modelo DFMEA – Paso 1
Funciones

 Identificar todas las funciones en el alcance


 Identificar como cada una de las funciones puede fallar (Modos
de falla)

 Identificar un grupo de efectos asociados para cada modo de


falla
 Identificar el rango de severidad para cada uno de los grupos
de efectos que prioriza los modos de falla

 Si es posible recomendar acciones para eliminar los modos de


falla sin atender las “causas”
 Completar pasos 2 y 3

499
Modelo DFMEA – Paso 1
Funciones

 La función da respuesta a ¿Qué se supone que hace este


artículo?

 Las funciones son intenciones del diseño o especs. de ing. y:

 Se escriben en forma de verbo/nombre/caract. medible

 La característica Medible o SDS: Puede ser


verificada/validada; incluye parámetros adicionales o
parámetros de diseño como especificaciones de servicio,
condiciones especiales, peso, tamaño, localización y
accesibilidad o requerimientos de estándares (v. gr. EMVSS)

500
Modelo DFMEA – Paso 1
Funciones

 Las funciones representan las expectativas, necesidades y


requerimientos tanto explícitos como no explícitos de los clientes y
sistemas

 Las funciones no pueden “fallar” si no son medibles o especificadas

Ejemplos:
 Almacenar fluido, X litros sin fugas

 Controlar el flujo, X centímetros cúbicos por segundo

 Abrir con X fuerza

 Mantener la calidad del fluido durante X años bajo condiciones

de operación

501
Modelo DFMEA – Paso 1
Modos de falla potenciales

 Son las formas en las cuales un componente, subsistema o


sistema pueden potencialmente no cumplir o proporcionar la
función intencionada, pueden ser también las causas

 El Modo de falla en un sistema mayor puede ser el efecto de un


componente de menor nivel

 Listar cada uno de los modos de falla potenciales asociados con


el artículo en particular y con su función (revisar el historial de
garantías y fallas o hacer tormenta de ideas

 También se deben considerar modos de falla potenciales que


pudieran ocurrir sólo bajo ciertas condiciones (vg. Calor, frío,
humedad, polvo, etc)

502
Modelo DFMEA – Paso 1
Tipos de Modos de falla potenciales

 No funciona
 Funciona parcialmente / sobre función / degradación
con el tiempo

 Función intermitente
 A veces causado por los factores ambientales

 Función no intencionada
 Los limpiadores operan sin haber actuado el switch
 El coche va hacia atrás aún con la palanca en Drive

503
Modelo DFMEA – Paso 1
Preguntas para Modos Potenciales de falla

 ¿De que manera puede fallar este artículo para


realizar su función intencionada?

 ¿Qué puede salir mal (go wrong), a pesar de que el


artículo se fabrica de acuerdo al dibujo?

 ¿Cuándo se prueba la función, como se debería


reconocer su modo de falla?

 ¿Dónde y cómo operará el diseño?

504
Modelo DFMEA – Paso 1
Preguntas para Modos Potenciales de falla

 ¿Bajo que condiciones ambientales operará?


 ¿El artículo será usado en ensambles de más alto nivel?
 ¿Cómo interactúa/interfase con otros niveles del diseño?

 No introducir modos de fallas triviales que no pueden o no


ocurrirán

 Asumiendo la función:
 Almacenar fluido, X litros, 0 fugas, durante 10 años

 Sus modos de falla son:


 Almacenar < X, presenta fugas

505
Modelo DFMEA – Paso 1
Efectos Potenciales de falla

 Se definen como los efectos del modo de falla en la función


percibida por el cliente. Qué puede notar o experimentar ya sea
interno o final

 Establecer claramente si la función podría impactar a la


seguridad, o no cumplimiento de reglamentaciones

 Los efectos se establecen en términos de sisemas específicos,


subsistemas o componentes conforme sean analizados

 La intención es analizar los efectos de falla al nivel de experiecia


y conocimiento del equipo.

506
Modelo DFMEA – Paso 1
Efectos Potenciales de falla

 Describir las consecuencias de cada uno de los modos de falla


identificados en:
 Partes o componentes

 Ensambles del siguiente nivel

 Sistemas

 Clientes

 Reglamentaciones

 NOTA. Todos los estados de error del diagrama P deben ser


incluidos en la columna de Modos de falla o efectos del DMFEA

507
Modelo DFMEA – Paso 1
Ejemplos de Efectos Potenciales de falla

 Ruidos

 Operación errática – no operable

 Apariencia pobre – olores desagradables

 Operación inestable

 Operación intermitente

 Fugas

 Ruido de radiofrecuencia (EMC)


508
Modelo DFMEA – Paso 1
Severidad

 Es la evaluación asociada con el efecto más serio de la columna


anterior. Habrá sólo una severidad para cada modo de falla

 Para reducir la severidad es necesario hacer un cambio de


diseño

 La severidad se estima de la tabla siguiente

509
Rangos de Severidad (AMEFD)
Efecto Rango Criterio .
No 1 Sin efecto
Muy poco 2 Cliente no molesto. Poco efecto en el desempeño del componente o
servicio.
Poco 3 Cliente algo molesto. Poco efecto en el desempeño del comp. o
servicio.
Menor 4 El cliente se siente un poco fastidiado. Efecto menor en el
desempeño del componente o servicio.
Moderado 5 El cliente se siente algo insatisfecho. Efecto moderado en el
desempeño del componente o servicio.

Significativo 6 El cliente se siente algo inconforme. El desempeño del comp. o


servicio se ve afectado, pero es operable y está a salvo. Falla parcial,
pero operable.
Mayor 7 El cliente está insatisfecho. El desempeño del servicio se ve
seriamente afectado, pero es funcional y está a salvo. Sistema afectado.
Extremo 8 Cliente muy insatisfecho. Servicio inadecuado, pero a salvo. Sistema
inoperable.
Serio 9 Efecto de peligro potencial. Capaz de descontinuar el uso sin perder
tiempo, dependiendo de la falla. Se cumple con el reglamento del
gobierno en materia de riesgo.
Peligro 10 Efecto peligroso. Seguridad relacionada - falla repentina.
Incumplimiento con reglamento del gobierno. 510
Modelo DFMEA – Paso 1
Clasificación

 Cuando un modo de falla tiene un rango de severidad de 9 o


10, existe una característica crítica, se identifica como “YC” y se
inicia un FMEA de proceso

 Estas características del producto afectan su función segura y/o


cumplimiento de reglamentaciones gubernamentales y pueden
requerir condiciones especiales de manufactura, ensamble,
abastecimiento, embarque, monitoreo y/o acciones de
inspección o controles

511
Modelo DFMEA – Paso 1
Acciones recomendadas

 Eliminar el Modo de falla

 Mitigar el efecto

 Es necesario un énfasis especial en acciones posibles cuando la


severidad es 9 o 10. Para valores menores también se pueden
considerar acciones

 Para eliminar el modo de falla considerar la acción:


 Cambiar el diseño (vg. Geometría, material) si está

relaionado a una característica del producto

512
Modelo DFMEA – Paso 2
Identificar:
 Las Causas asociadas (primer nivel y raíz)

 Su tasa de ocurrencia estimada

 La designación de la característica adecuada (si


existe) a ser indicada en la columna de clasificación

 Acciones recomendadas para Severidad y Criticalidad


alta (S x O)

513
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

 La causa potencial de falla se define como un


indicador de debilidad del diseño cuya consecuencia
es el modo de falla

 Listar como sea posible, cada causa de falla y/o


mecanismo de falla para cada uno de los modos de
falla. El detalle de la descripción permitirá enfocar los
esfuerzos para atacar la causa pertinente

514
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Se puede emplear un diagrama de Ishikawa o un Árbol de falla (FTA),


preguntarse:
 ¿Qué circunstancia pudo causar que fallara el artículo para su
fúnción?
 ¿Cómo podría fallar el artículo para cumplir con las especificaciones?
 ¿Cómo pueden ser incompatibles artículos que interactúan?
 ¿Qué información desarrollada en los diagramas P y Matriz de
Interfase pueden identificar causas potenciales?
 ¿Qué puede causar que el artículo no de la función intencionada?
 ¿Qué información en el Diagrama de límites pudo haberse pasado
que pueda causar este modo de falla?
 ¿En que puede contribuir el historial de 8Ds y FMEAs a las causas
potenciales?

515
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Supuesto 1: El artículo se fabricó de acuerdo a especificaciones,


ejemplos de causas de falla:
 La especificación de Porosidad del material es muy alta
 La dureza del material especificada es muy baja

 El lubricante especificado es muy viscoso


 Torque especificado demasiado bajo

 Supuesto de confiabilidad inadecuada


 Degradación de parámetro del Componente

 Calor excesivo

516
Model DFMEA – Paso 2
Causa potencial o mecanismo de falla

Supuesto 2: El artículo puede incluir una deficiencia que causa


variabilidad introducida en el proceso de ensamble o
manufactura:

 Especificar un diseño simétrico que permita que la parte se


pueda instalar desde atrás o de arriba a abajo

 Torque incorrecto debido a que el hoyo está diseñado fuera de


posición

 Cinturón equivocado debido a que el diseño es similar a otro


que es estándar también en uso

517
Modelo DFMEA – Paso 2
Causa potencial o mecanismo de falla

Precauciones:
 El DFMA no confía en los controles del proceso para subsanar
debilidades del diseño, pero toma en cuenta sus limitaciones

 El objetivo es identificar las deficiencias del diseño que peuden


causar variación inaceptable en el proceso de manufactura o
ensamble a través de un equipo multidisciplinario

 Las causas de variación que no sean el resultado de directo de


deficiencias de diseño pueden identificarse en el DFMEA y ser
atendidas en el FMEA de Proceso

 Otro objetivo es identificar las características que mejoren la robustez


del diseño que pueda compensar variaciones en proceso

518
Modelo DFMEA – Paso 2
Ocurrencia

 Ocurrencia es la probabilidad de que una causa/mecanismo


(listado en la columna previa) ocurra durante la vida del diseño

 El rango de ocurrencia tiene un significado relativo más que sea


absoluto

 La prevención o control de las Causas / Mecanismos del modo


de falla se realiza a través de cambios de diseño o cambios de
diseño del proceso para reducir la ocurrencia

519
Modelo DFMEA – Paso 2
Estimación de la Ocurrencia

 ¿Cuál es el historial de servicio y campo experimentado con


artículos similares?
 ¿El artículo es similar al utilizado en niveles anteriores de
subsistemas?

 ¿El componente es radicalmente diferente de los anteriores?


 ¿Ha cambiado la aplicación del componente?

 ¿Se han instalado controles preventivos en el proceso?


 ¿Cuáles son los cambios en el ambiente?

 ¿Se ha realizado un análisis análítico de la predicción de


confiabilidad para estimar la tasa de ocurrencia?

520
Rangos de Ocurrencia (AMEFD)
Ocurrencia Criterios Rango Probabilidad de Falla
Remota Falla improbable. No existen fallas 1 <1 en 1,500,000 Zlt > 5
asociadas con este producto o con
un producto / Servicio casi idéntico
Muy Poca Sólo fallas aisladas asociadas con 2 1 en 150,000 Zlt > 4.5
este producto / Servicio
casi idéntico
3 1 en 30,000
Poca Fallas aisladas asociadas con
Zlt > 4
productos / Servicios similares
Moderada Este producto / Servicio ha
tenido fallas ocasionales 4 1 en 4,500 Zlt > 3.5
5 1 en 800 Zlt > 3
Alta Este producto / Servicio ha
6 1 en 150 Zlt > 2.5
fallado a menudo
7 1 en 50 Zlt > 2
Muy alta La falla es casi inevitable
8 1 en 15 Zlt > 1.5
9 1 en 6 Zlt > 1
10 >1 en 3 Zlt < 1

Nota: El criterio se basa en la probabilidad de ocurrencia de la


causa/mecanismo. Se puede basar en el desempeño de un diseño similar en
una aplicación similar.
Clasificación
 Cuando el Modo de falla/causa tien una severidad de
5 a 8 y una ocurrencia de 4 o mayor, entonces se
tiene una caracterítica significativa crítica potencial
que se identifica con “YS” y se inicia el FMEA de
proceso

 Estas características del producto afectan la función


del producto y/o son importantes para la satisfacción
del cliente y pueden requerir condiciones especiales
de manufactura, ensamble, embarque, monitoreo y/o
inspección

522
Modelo DFMEA
Paso 3
Si las causas no se pueden eliminar en paso 1 o 2, Identificar
 Controles actuales de prevención usados para establecer la
ocurrencia
 Controles actuales de detección (vg. Pruebas) usadas para
establecer la Detección
 Determinar la efectividad de los controles de Detección en
escala de 1 a 10
 El RPN inicial (Risk Priority Number).
 Acciones Recomendadas (Prevenciónn and Detección).
 Cuando ya se hayan implementado las acciones recomenddas,
se revisa el formato DFMEA en relación a la Severidad,
Ocurrencia, Detección y RPN

523
Modelo DFMEA – Paso 3
Controles de diseño actuales
 Listar las actividades terminadas para prevención,
vaidación/verificación del diseño (DV), u otras actividades que
aseguran la adecuación del diseño para el modo de falla y/o
causa / mecanismo bajo consideración

 Controles actuales (vg. Diseños falla/seguro como válvulas de


alivio, revisiones de factibilidad, CAE, Confianilidad y robustez
analítica) son los que han sido o estan usándose con los
mismos diseños o similares.

 El equipo siempre debe enfocarse a mejorar los controles de


diseño, por ejemplo la creación de nuevos sistemas de prueba
en el laboratorio, o la creación de muevos algoritmos de
modelado, etc.

524
Modelo DFMEA – Paso 3
Controles de diseño actuales
 Hay dos tipos de controles de diseño: Prevención y
detección

 De prevención:
 Previenen la ocurrencia de la causa/mecanismo o Modo
de falla/efecto reduciendo la tasa de Ocurrencia
 De detección:
 Detectan la causa/mecanismo o Modo de falla/efecto
ya sea por métodos analíticos o físicos antes que el
artículo se libere para Poducción
 Si solo se usa una columna indicarlos con P o D

525
Modelo DFMEA – Paso 3
Controles de diseño actuales
Identificación de controles de diseño
 Si una causa potencial no fue analizada, el producto
con deficiencia de diseño pasará a Producción. Una
forma de detectarlo es con su Modo de falla
resultante. Se debe tomar acción correctiva

Identificar controles de diseño como sigue:


1. Identificar y listar los métodos que puedan ser
utilizados para detectar el modo de falla, como:
1. FMEA anteriores, Planes de DV anteriores, Lista de
verificáción de robustez, Acciones de 8Ds
526
Modelo DFMEA – Paso 3
Controles de diseño actuales
2. Listar todos los controles de diseño históricos que
puedan ser suados para causas de primer nivel
listadas. Revisar reportes históricos de pruebas

3. Identificar otros métodos posibles preguntando:


¿De que manera puede la causa de este modo de falla ser
reconocida?

¿Cómo puedo descubrir que esta causa ha ocurrido?

¿De que manera este modo de falla puede ser reconocido?


¿Cómo puedo descubrir que este modo de falla ha ocurrido?
527
Modelo DFMEA – Paso 3
Detección
 Cuando se estima una tasa de Detección, considerar solo los
controles que serán usados para detectar los Modos de Falla o
sus Causas. Los controles intencionados para prevenir o reducir
la Ocurrencia de una Causa o Modo de falla son considerados al
estimar la tasa de Ocurrencia

 Si los controles de prevención no detectan deben ser calificadas


con 10

 Solo se deben considerar los métodos que son usados antes de


la liberación a Producción para estimar la tasa de Detección
 Los programas de verificación de diseño deben basarse en la
efectividad de los controles de diseño
528
Modelo DFMEA – Paso 3
Detección
Para evaluar la efectividad de cada control de diseño considerar las
siguientes categorías (de mayor a menor):

 Métodos de análisis de diseño


 Modelado y simulación probada (vg. Análisis de elementos

finitos)
 Estudios de tolerancias (vg. Tolerancias deométricas

dimensionales)
 Estudios de compatibilidad de materiales (vg. Expansión

térmica, corrosión)
 Revisión de diseño subjetiva

 Métodos de desarrollo de pruebas:


 Diseño de experimentos/ experimentos de peor caso (vg.

Ruido)
529
Modelo DFMEA – Paso 3
Detección
 Métodos de desarrollo de pruebas (cont…):
 Pruebas en muestras de pre-producción o prototipo
 Maquetas usando partes similares

 Pruebas de durabilidad (verificación de diseño)

 Número de muestras a ser probadas


 Muestra significativa estadísticamente

 Cantidad pequeña, no significativa estadísticamente

 Oportunidad de la aplicación de control de diseño


 Desde la etapa de diseño del concepto (vg. Decisión
del tema)
 Al tener prototipos de ingeneiría
 Justo antes de liberarse a Producción
530
Rangos de Detección (AMEFD)
• Rango de Probabilidad de Detección basado en la
efectividad del Sistema de Control Actual; basado en el
cumplimiento oportuno con el Plazo Fijado

1 Detectado antes del prototipo o prueba piloto

2-3 Detectado antes de entregar el diseño

4-5 Detectado antes del lanzamiento del servicio

6-7 Detectado antes de la prestación del servicio

8 Detectado antes de prestar el servicio

9 Detectado en campo, pero antes de que ocurra la falla o error

10 No detectable hasta que ocurra la falla o error en campo


DFMEA – Cálculo del riesgo
 El número de prioridad del rieso (RPN) es el producto de
Severidad (S), Ocurrencia (O) y Detección (D)

 RPN = (S) x (O) x (D) con valores entre 1 y 1000

 Puede usarse como en un Pareto para priorizar riesgos


potenciales con efectos que tengan las tasas más altas de
severidad

 Atender los aspectos con Severidad 9 o 10 y después los


efectos con Severidad alta; los de criticalidad alta (S x O) y al
final los que tienen RPNs más altos

532
DFMEA – Acciones recomendadas
Considerar acciones como las siguientes:
 Revisión del diseño de la Geometría y/o tolerancias
 Revisión de especificación de materiales
 Diseños de experimentos (con múltiples causas interactuando)
u otras técnicas de solución de problemas
 Revisión de planes de prueba
 Sistemas redundantes – dispositivos de aviso – estados de falla
(ON y OFF)

El objetivo primario de las acciones recomendadas es reducir


riesgos e incrementar la satisfacción del cliente al mejorar el
diseño.
Para reducir la severidad es necesario un cambio de diseño
533
DFMEA – Acciones tomadas
 Se identifica la organización y persona responsable para las
acciones recomendadas y la fecha de terminación

 Dar seguimiento:
 Desarrollar una lista de características especiales parasu

consideración en el DFMEA
 Dar seguimiento a todas las acciones recomendadas y

actualizar las acciones del DFMEA

 Después de que se implementa una acción, anotar una


descripción breve y la fecha de efectividad

534
DFMEA – Nivel de riesgo RPN
 Después de haber implementado las acciones
preventivas/correctivas, registrar la nueva Severidad,
Ocurrencia y Detección

 Calcular el nuevo RPN

 Si no se tomaron acciones en algunos aspectos, dejarlos en


blanco

535
DFMEA – Lista de verificación de
robustez
 Es una salida del proceso integrado de robustez:
 Resume los atributos de robustez clave y controles de
diseño

 Enlaza el DFMEA y los 5 factores de ruido del diseño al


Plan de verificación de diseño (DVP); vg., esta lista es
una entrada al DVP

 Debe ser un documento clave a revisar como parte del


proceso de revisión de diseño

536
FMEA de Proceso - PFMEA

537
PFMEA
 Equipo
 Se inicia por el Ing. responsable de la actividad, en
conjunto con un equipo de personas expertas además
de incluir personas de apoyo

 Alcance
 Define que es incluido y que es excluido

538
Entradas al PFMEA
 Diagrama de flujo del proceso
 El equipo debe desarrollar el flujo del proceso,
preguntando ¿Qué se supone que hace el proceso?;
¿Cuál es su propósito?; ¿Cuál es su función?

 El Diagrama P es una entrada opcional al PFMEA

539
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de FMEA ______(rev.) ______

Resultados de Acción
O Controles de D
Función S Causa(s)
Efecto (s) c Diseño o e R Responsable S O D R
del Producto/ Modos de Falla e Potencial(es) Acción Acción
Potencial (es) c Proceso t P y fecha límite e c e P
Paso del Potenciales v o Mecanismos Sugerida Adoptada
de falla u Actuales e N de Terminación v c t N
proceso . de falla
r c

540
Modelo del PFMEA – Paso 1
 Identificar todos los requerimientos funcionales dentro del
alcance

 Identificar los modos de falla correspondientes

 Identificar un conjunto de efectos asociados para cada modo de


falla

 Identificar la calificación de severidad para cada conjunto de


efectos que de prioridad el modo de falla

 De ser posible, tomar acciones para eliminar modos de falla sin


atender las “causas”

541
Modelo de PFMEA – Paso 1

 Requerimientos de la función del proceso


 Contiene características de ambos el producto y el
proceso

 Ejemplos
 Operación No. 20: Hacer perforación de tamaño X de
cierta profundidad
 Operación No. 22: Realizar el subensamble X al
ensamble Y

542
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
Función S Causa(s) Controles del
Efecto (s) c e R Responsable S O D R
de Modos de Falla e Potencial(es) Diseño / Acción Acción
Potencial (es) c t P y fecha límite e c e P
Componente/Paso Potenciales v de los Mecanismos Proceso Sugerida Adoptada
de falla u e N de Terminación v c t N
de proceso . de falla Actual
r c
Factura correcta

Relacione las
funciones del
diseño del
componente

Pasos del proceso


Del diagrama de flujo
Modelo de PFMEA – Paso 1

 Modos de falla potenciales


 No funciona

 Funcionamiento parcial / Sobre función / Degradación en el

tiempo
 Funcionamiento intermitente

 Función no intencionada

 Los modos de falla se pueden categorizar como sigue:


 Manufactura: Dimensional fuera de tolerancia

 Ensamble: Falta de componentes

 Recibo de materiales: Aceptar partes no conformes

 Inspección/Prueba: Aceptar partes equivocadas

544
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
Función O D
Causa(s) Controles de
del Efecto (s) D c e R Responsable S O D R
Modos de Falla Potencial(es) Diseño / Acción Acción
componente/ Potencial (es) i c t P y fecha límite e c e P
Potenciales de los Mecanismos Proceso Sugerida Adoptada
Paso del de falla v u e N de Terminación v c t N
de falla Actuales
proceso r c
Factura
correcta
Datos incorrectos Identificar modos
de falla Tipo 1
inherentes al
diseño
Modelo de PFMEA – Paso 1

 Efectos de las fallas potenciales (consecuencias en)


 Seguridad del operador
 Siguiente usuario
 Usuarios siguientes
 Máquinas / equipos
 Operación del producto final
 Cliente último
 Cumplimiento de reglamentaciones gubernamentales

546
Modelo de PFMEA - Paso 1

 Efectos de las fallas potenciales (en usuario final)


 Ruido
 Operación errática
 Inoperable
 Inestable
 Apariencia mala
 Fugas
 Excesivo esfuerzo
 Retrabajos / reparaciones
 Insatisfacción del cliente

547
Modelo de PFMEA –Paso 1

 Efectos de las fallas potenciales (en siguiente


operación)
 No se puede sujetar
 No se puede tapar
 No se puede montar
 Pone en riesgo al operador
 No se ajusta
 No conecta
 Daña al equipo
 Causa excesivo desgaste de herramentales

548
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O Controles de D
Función Causa(s)
Efecto (s) D c Diseño / e R Responsable S O D R
del componente Modos de Falla Potencial(es) Acción Acción
Potencial (es) i c Proceso t P y fecha límite e c e P
/ Paso del Potenciales oMecanismos Sugerida Adoptada
de falla v u Actuales e N de Terminación v c t N
proceso de falla
r c

Factura correcta Datos incorrectosLOCAL:


Rehacer
la factura

Describir los efectos de


MAXIMO PROXIMO modo de falla en:
Contabilidad LOCAL
equivocada
El mayor subsecuente
CON CLIENTE
Y Usuario final
Molestia
Insatisfacción

CTQs del QFD o


Matriz de Causa Efecto
CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA AMEFP

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades

Efecto Efecto en el cliente Efecto en Manufactura /Ensamble


Calif
Peligroso Calificación de severidad muy alta cuando un modo potencial de Puede exponer al peligro al operador (máquina o ensamble) .
sin aviso falla afecta la operación segura del producto y/o involucra un no sin aviso 10
cumplimiento con alguna regulación gubernamental, sin aviso

Peligroso Calificación de severidad muy alta cuando un modo potencial de Puede exponer al peligro al operador (máquina o ensamble)
con aviso falla afecta la operación segura del producto y/o involucra un no sin aviso 9
cumplimiento con alguna regulación gubernamental, con aviso

Muy alto El producto / item es inoperable ( pérdida de la función El 100% del producto puede tener que ser desechado op
primaria) reparado con un tiempo o costo infinitamente mayor 8
Alto El producto / item es operable pero con un reducido nivel de El producto tiene que ser seleccionado y un parte desechada
desempeño. Cliente muy insatisfecho o reparada en un tiempo y costo muy alto 7
Modera Producto / item operable, pero un item de confort/conveniencia Una parte del producto puede tener que ser desechado sin
do es inoperable. Cliente insatisfecho selección o reparado con un tiempo y costo alto 6
Bajo Producto / item operable, pero un item de confort/conveniencia El 100% del producto puede tener que ser retrabajado o
son operables a niveles de desempeño bajos reparado fuera de línea pero no necesariamente va al àrea 5
de retrabajo .
Muy bajo No se cumple con el ajuste, acabado o presenta ruidos y El producto puede tener que ser seleccionado, sin desecho,
rechinidos. Defecto notado por el 75% de los clientes y una parte retrabajada 4
Menor No se cumple con el ajuste, acabado o presenta ruidos y El producto puede tener que ser retrabajada, sin desecho,
rechinidos. Defecto notado por el 50% de los clientes en línea, pero fuera de la estación 3
Muy No se cumple con el ajuste, acabado o presenta ruidos, y El producto puede tener que ser retrabajado, sin desecho en
menor rechinidos. Defecto notado por clientes muy críticos (menos del la línea, en la estación 2
25%)
Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin
efecto 1
CRITERIO DE EVALUACIÓN DE SEVERIDAD SUGERIDO PARA PFMEA

Esta calificación resulta cuando un modo de falla potencial resulta en un defecto con un cliente final y/o una planta de manufactura
/ ensamble. El cliente final debe ser siempre considerado primero. Si ocurren ambos, use la mayor de las dos severidades

Efecto Efecto en el cliente Efecto en Manufactura /Ensamble


Calif
Peligroso Calificación de severidad muy alta cuando un modo potencial de Puede exponer al peligro al operador (máquina o ensamble) .
sin aviso falla afecta la operación segura del producto y/o involucra un no sin aviso 10
cumplimiento con alguna regulación gubernamental, sin aviso

Peligroso Calificación de severidad muy alta cuando un modo potencial de Puede exponer al peligro al operador (máquina o ensamble)
con aviso falla afecta la operación segura del producto y/o involucra un no sin aviso 9
cumplimiento con alguna regulación gubernamental, con aviso

Muy alto El producto / item es inoperable ( pérdida de la función El 100% del producto puede tener que ser desechado op
primaria) reparado con un tiempo o costo infinitamente mayor 8
Alto El producto / item es operable pero con un reducido nivel de El producto tiene que ser seleccionado y un parte desechada
desempeño. Cliente muy insatisfecho o reparada en un tiempo y costo muy alto 7
Modera Producto / item operable, pero un item de confort/conveniencia Una parte del producto puede tener que ser desechado sin
do es inoperable. Cliente insatisfecho selección o reparado con un tiempo y costo alto 6
Bajo Producto / item operable, pero un item de confort/conveniencia El 100% del producto puede tener que ser retrabajado o
son operables a niveles de desempeño bajos reparado fuera de línea pero no necesariamente va al àrea 5
de retrabajo .
Muy bajo No se cumple con el ajuste, acabado o presenta ruidos y El producto puede tener que ser seleccionado, sin desecho,
rechinidos. Defecto notado por el 75% de los clientes y una parte retrabajada 4
Menor No se cumple con el ajuste, acabado o presenta ruidos y El producto puede tener que ser retrabajada, sin desecho,
rechinidos. Defecto notado por el 50% de los clientes en línea, pero fuera de la estación 3
Muy No se cumple con el ajuste, acabado o presenta ruidos, y El producto puede tener que ser retrabajado, sin desecho en
menor rechinidos. Defecto notado por clientes muy críticos (menos del la línea, en la estación 2
25%)
Ninguno Sin efecto perceptible Ligero inconveniente para la operación u operador, o sin
efecto 1
Modelo de PFMEA – Paso 2

 Paso 2 identificar:
 Las causas asociadas (primer nivel y raíz)

 Su tasa de ocurrencia

 La designación apropiada de la característica indicada


en ola columna de clasificación

 Acciones recomendadas para alta severidad y


criticalidad (S x O) así como la Seguridad del operador
(OS) y errores de proceso de alto impacto (HI)

552
Modelo de PFMEA – Paso 2

Causa/Mecanismo potencial de falla


 Describe la forma de cómo puede ocurrir la falla,
descrito en términos de algo que puede ser corregido o
controlado
 Se debe dar priorioridad a rangos de prioridad de 9 o
10
Ejemplos, especificar claramente:
 Torque inadecuado (bajo o alto)
 Soldadura iandecuada (corriente, tiempo, presión)
 Lubricación inadecuada

553
Efecto(s) Potencial(es) de falla
Evaluar 3 (tres) niveles de Efectos del Modo de Falla
• Efectos Locales

– Efectos en el Área Local

– Impactos Inmediatos

• Efectos Mayores Subsecuentes


– Entre Efectos Locales y Usuario Final

• Efectos Finales
– Efecto en el Usuario Final del producto o Servicio

554
Modelo de PFMEA – Paso 2

 Suposición 1: Los materiales para la operación son


correctos
 Ajuste de herramentales a la profundidad equivocada
 Desgaste de herramentales
 Temperatura del horno muy alta
 Tiempo de curado muy corto
 Presión de aire muy baja
 Velocidad del transportador no es constante
 Jets de lavadora desconectados

555
Modelo de PFMEA – Paso 2

 Suposición 2: Los materiales para la operación tienen


variación
 Material demasiado duro / suave / quebradizo
 La Dimensión no cumple especificaciones
 El acabado superficial de la operación 10 no cumple
especificaciones
 El localizador de perforación fuera de posición correcta

556
Modelo de PFMEA – Paso 2

 Ocurrencia:
 Es la probabilidad de que una causa/mecanismo ocurra
 Se puede reducir o controlar solo a través de un
cambio de diseño
 Si la ocurrencia de la causa no puede ser estimada,
entonces estimar la tasa de falla posible

557
CRITERIO DE EVALUACIÓN DE OCURRENCIA SUGERIDO PARA AMEFP 
Probabilidad Indices Posibles de ppk Calif.
falla
Muy alta: Fallas 100 por mil piezas < 0.55 10
persistentes
50 por mil piezas > 0.55 9

Alta: Fallas frecuentes 20 por mil piezas > 0.78 8

10 por mil piezas > 0.86 7

Moderada: Fallas 5 por mil piezas > 0.94 6


ocasionales
2 por mil piezas > 1.00 5

1 por mil piezas > 1.10 4

Baja : Relativamente pocas 0.5 por mil piezas > 1.20 3


fallas
0.1 por mil piezas > 1.30 2

Remota: La falla es < 0.01 por mil piezas > 1.67 1


improbable
Modelo de PFMEA – Paso 2

 Clasificación de características especiales si:


 Afectan la función del producto final, cumplimiento con
reglamentaciones gubernamentales, seguridad de los
operadores, o la satisfacción del cliente, y

 Requieren controles especiales de manufactura,


ensamble, proveedores, embarques, monitoreo y/o
inspección o seguridad

559
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
Función S Causa(s) Controles de
Efecto (s) c e R Responsable S O D R
del componente Modos de Falla e Potencial(es) Diseño / Acción Acción
Potencial (es) c t P y fecha límite e c e P
/ Paso del Potenciales v o Mecanismos Proceso Sugerida Adoptada
de falla u e N de Terminación v c t N
proceso . de falla Actuales
r c
La abertura del
engrane propor La abertura no LOCAL:
ciona una aber- es suficiente Daño a sensor
tura de aire entre de velocidad y
diente y diente engrane

MAXIMO PROXIMO
Usar tabla para
Falla en eje 7 determinar severidad o
gravedad

CON CLIENTE
Equipo
parado
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
Función O D
S Causa(s) Controles de
del Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Diseño/ Acción Acción
Componente / Potencial (es) c t P y fecha límite e c e P
Potenciales v o Mecanismos Proceso Sugerida Adoptada
Paso del de falla u e N de Terminación v c t N
. de falla Actuales
proceso r c

Factura correcta Datos LOCAL:


equivocadso Rehacer la
factura
Rango de
probabilidades en que
MAXIMO PROXIMO la causa identificada
Contabilidad 7 3 ocurra
erronea

CON CLIENTE
Molestia
Insatisfacción
Modelo de PFMEA – Paso 3

 En el paso 3 identificar:
 Controles actuales de prevención del proceso (con
acciones de diseño o proceso) usados para establecer
la ocurrencia
 Controles actuales de detección (vg. Inspección)
usados para establecer la tasa de detección
 Efectividad de los controles de detección del proceso
en una escala de 1 a 10
 El factor de riesgo RPN inicial
 Acciones recomendadas (Prevención y Detección)

562
Identificar Causa(s) Potencial(es) de la Falla

• Causas relacionadas con el diseño - Características del


servicio o Pasos del proceso
– Diseño de formatos

– Asignación de recursos

– Equipos planeados

• Causas que no pueden ser Entradas de Diseño,


tales como:
– Ambiente, Clima, Fenómenos naturales

• Mecanismos de Falla
– Rendimiento, tiempo de entrega, información completa

563
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
S Causa(s) Controles de
Función Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Diseño/Proces Acción Acción
de Potencial (es) c t P y fecha límite e c e P
Potenciales v de los Mecanismos o Actuales Sugerida Adoptada
Artículo de falla u e N de Terminación v c t N
. de falla
r c

Factura correcta Datos incorrectosLOCAL:


Rehacer la Identificar causas
factura
de diseño, y
mecanismos de
MAXIMO PROXIMO falla que pueden
Contabilidad 7
erronea ser señalados para
los modos de falla
CON CLIENTE
Molestia
identificada.
Insatisfacción
Causas potenciales
De Diagrama de Ishikawa
Diagrama de árbol o
Diagrama de relaciones
Modelo de PFMEA – Paso 3

 Controles de proceso actuales:


 Son una descripción de los controles ya sea para
prevenir o para detectar la ocurrencia de los
Modos/causas de falla

 Consideraciones
 Incrementar la probabilidad de detección es costosa y
no efectiva
 A veces se requiere un cambio en el diseño para
apoyar la detección
 El incremento del control de calidad o frecuencia de
inspección sólo debe utilizarse como medida temporal
 Se debe hacer énfasis en la prevención de los defectos
565
Identificar Controles de Diseño o de
Proceso Actuales
• Verificación/ Validación de actividades de Diseño o
control de proceso usadas para evitar la causa,
detectar falla anticipadamente, y/o reducir impacto:

Cálculos, Análisis, Prototipo de Prueba, Pruebas piloto


Poka Yokes, planes de control, listas de verificación

• Primera Línea de Defensa - Evitar o eliminar causas de falla o error

• Segunda Línea de Defensa - Identificar o detectar fallas o errores


Anticipadamente

• Tercera Línea de Defensa - Reducir impactos/consecuencias de falla o


errores
566
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
Función O D
S Causa(s) Controles de
del Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Diseño / Acción Acción
Componente / Potencial (es) c t P y fecha límite e c e P
Potenciales v o Mecanismos Proceso Sugerida Adoptada
Paso del de falla u e N de Terminación v c t N
. de falla Actuales
proceso r c

Factura correcta Datos correctos LOCAL:


Rehacer la
factura
¿Cuál es el método de
control actual que usa
MAXIMO PROXIMO ingeniería para evitar el
Contabilidad 7 3 modo de falla?
erronea

CON CLIENTE
Molestia
Insatisfacción
Modelo de PFMEA – Paso 3

Seleccionar un rango en la tabla de detección


Si se usa inspección automática al 100% considerar:
 La condición del gages
 La calibración del gage
 La variación del sistema de medición del gage
 Probabilidad de falla del gage
 Probabilidad de que el sistema del gage sea punteado
Si se usa inspección visual al 100% considerar:
 Es efectiva entre un 80 a 100% dependiendo del proc.
 El número de personas que pueden observar el modo
de falla potencialmente
 La naturaleza del modo de falla - ¿es claro o confuso?
568
CRITERIO DE EVALUACIÓN DE DETECCION SUGERIDO PARA AMEFP 
Detecciòn Criterio Tipos de Métodos de seguridad de Rangos de Calif
Inspección Detección
    A B C  
 
Casi
imposible
Certeza absoluta de no detección     X No se puede detectar o no es verificada 10
Muy Los controles probablemente no     X El control es logrado solamente con
remota detectarán
9
verificaciones indirectas o al azar
Remota Los controles tienen poca     X El control es logrado solamente con
oportunidad de detección
8
inspección visual
Muy baja Los controles tienen poca     X El control es logrado solamente con 7
oportunidad de detección doble inspección visual
Baja Los controles pueden detectar   X X El control es logrado con métodos gráficos con
el CEP
6
Moderada Los controles pueden detectar   X   El control se basa en mediciones por variables después de que las
partes dejan la estación, o en dispositivos Pasa NO pasa realizado en 5
el 100% de las partes después de que las partes han dejado la
estación

Moderada Los controles tienen una buena X X   Detección de error en operaciones subsiguientes, o medición

mente oportunidad para detectar


realizada en el ajuste y verificación de primera pieza ( solo para 4
causas de ajuste)
Alta
Los controles tienen una buena Detección del error en la estación o detección del error en
Alta
oportunidad para detectar
X X   operaciones subsiguientes por filtros multiples de aceptación: 3
suministro, instalación, verificación. No puede aceptar parte
discrepante

Detección del error en la estación (medición automática


Muy Alta Controles casi seguros para
detectar
X X  
con dispositivo de paro automático). No puede pasar la 2
parte discrepante

Muy Alta Controles seguros para detectar X     No se pueden hacer partes discrepantes porque el item ha
pasado a prueba de errores dado el diseño del 1
proceso/producto

Tipos de inspección: A) A prueba de error B) Medición automatizada C) Inspección visual/manual  


ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
Función O D
S Causa(s) Controles de
del Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Diseño / Acción Acción
Componente / Potencial (es) c t P y fecha límite e c e P
Potenciales v o Mecanismos Proceso Sugerida Adoptada
Paso del de falla u e N de Terminación v c t N
. de falla Actuales
proceso r c

Factura correcta Datos incorrectosLOCAL:


Rehacer la
factura

¿Cuál es la probabilidad
MAXIMO PROXIMO
de detectar la causa de
Contabilidad 7 3 5
falla?
erronea

CON CLIENTE
Molestia
Insatisfacción
Modelo de PFMEA – Paso 3

 Número de prioridad de riesgo


 Se calcula como RPN = (S) x (O) x (D)

 Acciones recomendadas
 Se deben dirigir primero a las de valores altos de
Severidad (9 o 10) o RPNs, después continuar con las
demás
 Las acciones se deben orientar a prevenir los defectos
a través de la eliminación o reducción de las causas o
modos de falla

571
Calcular RPN (Número de Prioridad de
Riesgo)

Producto de Severidad, Ocurrencia, y Detección

RPN / Gravedad usada para identificar principales CTQs

Severidad mayor o igual a 8


RPN mayor a 150

572
Planear Acciones

Requeridas para todos los CTQs

 Listar todas las acciones sugeridas, qué persona


es la responsable y fecha de terminación.
 Describir la acción adoptada y sus resultados.
 Recalcular número de prioridad de riesgo .

Reducir el riesgo general del diseño


573
Modelo de PFMEA – Paso 3

 Acciones tomadas
 Identificar al responsable de las acciones
recomendadas y la fecha estimada de terminación
 Después de terminar una acción, dar una descripción
breve de la acción real y fecha de efectividad

 Responsabilidad y fechas de terminación


 Desarrollar una lista de características especiales
proporcionándola al diseñador para modificar el DFMEA
 Dar seguimiento a las acciones recomendadas y
actualizar las últimas columnas del FMEA

574
Modelo de PFMEA – Paso 3

 RPN resultante
 Después de implementadas las acciones
recomendadas, estimar de nuevo los rangos de
Severidad, Ocurrencia y Detección y calcular el nuevo
RPN. Si no se tomaron acciones dejarlo en blanco.

 Salidas del PFMEA


 Hay una relación directa del PFMEA a el Plan de
Control del proceso

575
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
S Causa(s)
Función Efecto (s) c e R Responsable S O D R
Modos de Falla e Potencial(es) Controles de Acción Acción
de Potencial (es) c t P y fecha límite e c e P
Potenciales v de los Mecanismos Diseño Actual Sugerida Adoptada
Artículo de falla u e N de Terminación v c t N
. de falla
r c

Factura Datos LOCAL:


incorrecta incorrectos Rehacer
la factura

Riesgo = Severidad x
MAXIMO PROXIMO Ocurrencia x Detección
Contabilidad 7 3 5 105
erronea

CON CLIENTE
Molestia
Insatisfacción
Causas probables a
atacar primero
ANALISIS DEL MODO Y EFECTO DE FALLA
AMEF de Diseño / Proceso
Componente ______________________ Responsable del Diseño ____________ AMEF Número _________________
Ensamble ________________ Preparó _______________ Pagina _______de _______
Equipo de Trabajo ___________ FECHA (orig.) de AMEF ______(rev.) ______

Resultados de Acción
O D
Función S Causa(s) Controles de
Efecto (s) c e R Responsable S O D R
del componente Modos de Falla e Potencial(es) Diseño / Acción Acción
Potencial (es) c t P y fecha límite e c e P
/ Paso del Potenciales v o Mecanismos Prcoeso Sugerida Adoptada
de falla u e N de Terminación v c t N
proceso . de falla Actuales
r c

Factura correcta Datos LOCAL:


erroneos Rehacer la
factura

MAXIMO PROXIMO
Contabilidad 7 3 5 105
erronea

CON CLIENTE
Molestia
Insatisfacción Usar RPN para identificar
acciones futuras. Una vez que
se lleva a cabo la acción,
recalcular el RPN.
Herramientas para el FMEA

578
Herramientas
 Diagramas de límites
 Diagramas de flujo de proceso
 Matriz de características
 Tormenta de ideas
 Árboles de funciones
 Lista de efectos: FMEA de diseño
 Lista de efectos: FMEA de proceso
 Diagrama de Ishikawa
 Tecnica de preguntas

579
Herramientas
 Análisis de árbol de fallas (FTA)
 Análisis del modo de falla (FMA)
 Diseño de experimentos (DOE)
 Proceso de solución de problemas de 8Ds
 Planes de Control
 Planeación dinámica de control (DCP)
 Despliegue de la función de calidad (QFD)
 Análisis de valor/ Ingeniería del valor (VA/VE)
 REDPEPR
 FMEA Express
 FMEA del software

580
Diagrama de límites
 Diagramas de límites de funciones
 Salida del análisis de funciones para la fase de
concepto CFMEA, ilustran funciones en vez de partes

 Diagramas de límites Hardware/funcional


 Dividen al sistema en elementos más pequeños desde
un punto de vista funcional. Muestran relaciones
físicas, se usan en los DFMEAs.

581
Nombres de verbos útiles

582
Tormenta de ideas

 Seleccionar el problema a tratar.


 Pedir a todos los miembros del equipo generen ideas para la solución
del problema, las cuales se anotan en el pizarrón sin importar que tan
buenas o malas sean estas.
 Ninguna idea es evaluada o criticada antes de considerar todos los
pensamientos concernientes al problema.
 Aliente todo tipo de ideas, ya que al hacerlo pueden surgir cosas muy
interesantes, que motivan a los participantes a generar más ideas.
 Apruebe la naturalidad y el buen humor con informalidad, en este
punto el objetivo es tener mayor cantidad de ideas
 Se les otorga a los participantes la facultad de modificar o mejorar las
sugerencias de otros.
 Una vez que se tengan un gran número de ideas el facilitador procede
a agrupar y seleccionar las mejores ideas por medio del consenso del
grupo
 Las mejores ideas son discutidas y analizadas con el fin del proponer
una solución.

583
Herramientas para el FMEA
 Árbol de funciones
 Ayuda a que los requerimientos del cliente no
expresados explícitamente sobre el producto o proceso
se cumplan

 Es conveniente describir las funciones de un producto o


proceso por un verbo – pronombre medible, por
ejemplo:
 Calentar el interior a XºC
 Enfriar a los ocupantes a XºC
 Eliminar la niebla del parabrisas en X segundos

584
Técnica de preguntas
 Hacer una oración con el modo de falla, causa y efecto y ver si
la oración tiene sentido. Un modo de falla es debido a una
causa, el modo de falla podría resultar en efectos, por ejemplo:
 MODO DE FALLA: No ajustan los faros delanteros
 P: ¿Qué podría ocasionar esta falla?

 R: La luz desalineada -> Efecto

 P: ¿A que se puede deber esta falla?

 R: Cuerda grande en tornillo de ajuste -> Causa

El “No ajuste de faros delanteros” se debe a “Cuerda


grande en tornillo de ajuste”. El “desajuste de los
faros” ocasiona “haces de luz desalineados”

585
Técnica de preguntas
Paso 3 Paso 1
¿Qué lo causa? Paso 2
Modo de falla ¿Qué efecto tiene?

586
Análisis de árbol de fallas (FTA)
 Es una técnica analítica deductiva que usa un árbol para
mostrar las relaciones causa efecto entre un evento indeseable
(falla) y las diversas causas que contribuyen. Se usan símbolos
lógicos para interconectar las ramas

 Después de hacer el FTA e identificadas las causas raíz, se


pueden determinar las acciones preventivas o los controles
necesarios

 Otra aplicación es determinar las probabilidades de las causas


que contribuyen a la falla y propagarlas hacia adelante

587
Análisis del Modo de Falla (FMA)
 Es un enfoque sistemático disciplinado para
cuantificar el modo de falla, tasa de falla, y causa
raíz de fallas o tasas de reparación conocidas (el
FMEA para las desconocidas)

 Se basa en información histórica de garantías, datos


de campo, datos de servicios, y/o datos de procesos

 Se usa para identificar la operación, modos de falla,


tasas de falla y parámetros críticos de diseño de
hardware o procesos. También permite identificar
acciones correctivas para causas raíz actuales
588
Diseño de experimentos (DOE)
 Es un método para definir los arreglos en cuales se puedas
realizar experimentos, donde se cambian de manera controlada
las variables independientes de acuerdo a un plan definido y se
determinan los efectos

 Para pruebas de confiabilidad el DOE usa un enfoque estadístico


para diseñar pruebas para identificar los factores primarios que
causas eventos indeseables

 Se usan para identificar causas raíz de modos de falla, cuando


varios factores pueden estar contribuyendo o cuando estos
factores están interrelacionados y se desean conocer los efectos
de sus interacciones
589
Método de 8 disciplinas (8Ds)
 Es un método de solución de problemas orientado a
equipos de trabajo, las disciplinas o pasos son:
 Preparar el proceso
 Establecer el equipo
 Describir el problema
 Desarrollar las acciones de contención o contingentes
 Diagnosticar el problema (definir y verificar causa raíz)
 Seleccionar y verificar acciones correctivas
permanentes (PCAs) para causas raíz y puntos de
escape
 Implementar y validar PCAs
 Reconocer contribuciones del equipo y los miembros
590
Planes de control
 Es una descripción escrita del sistema para controlar
el proceso de producción

 Lista todos los parámetros del proceso y


características de las partes características de las
partes que requiere acciones específicas de calidad

 El plan de control contiene todaslas características


críticas y significativas
 Hay planes de control a nivel de manufactura de:
Prototipos, producción piloto (capacidad de procesos)
y de producción
591
Planeación dinámica de control (DCP)
Es un procesos que liga las herramientas de calidad
para construir planes de control robustos a través de
un equipo

1. Lanzamiento – definir los requerimientos de recursos

2. Estructura del equipo central y de soporte

3. Bitácora de preguntas

592
Planeación dinámica de control (DCP)
4. Información de soporte (ES, DFMEAs, DVP&R, PFMEA, etc.)

5. Diagrama de flujo y carácterísticas de enlace

6. Pre lanzamiento o controles preliminares

7. PFMEA

8. Plan de control

9. Desarrollar ilustraciones e instrucciones

10. Implementar y mantener

593
Despliegue de la función de calidad
(QFD)
 El QFD es un método estructurado en el cual los
requerimientos del cliente son traducidos en requerimientos
técnicos para cada una de las etapas del desarrollo del
producto y producción

 El QFD es entrada al FMEA de diseño o al FMEA de concepto.


Los datos se anotan en el FMEA como medidas en la columna
de función

 La necesidad de obtener datos de QFD pueden ser también


una salida del FMEA de concepto

594
Análisis del valor / Ingeniería del
valor (VA/VE)
 Son metodologías usadas comúnmente para despliegue del valor. La
Ingeniería del valor se realiza antes de comprometer el herramental. El
análisis del valor (VA) se realiza después del herramentado. Ambas
técnicas usan la fórmula:

Valor = Función (primaria o secundaria) / Costo


 Los datos de VA/VE pueden ser entradas al FMEA de diseño o de
proceso en columna de Función como funciones primaria y secundaria.
También pueden ser causas, controles o acciones recomendadas

 La metodología VA debe ser incluida en la revisión de FMEAs actuales


como apoyo para evaluar riesgos y beneficios cuando se analizan
varias propuestas

595
REDPEPR (Robust Engineering
Design Product Enhacement Process)
Es una herramienta que proporciona a los equipos de
Diseño:
 Un proceso paso a paso para aplicar el RED
 Las herramientas necesarias para completar el diagrama P, listas
de verificación de confiabilidad y robustez (RRCL) y la matriz de
demostración de confiabilidad y robustez (RRDM)
 Preguntas y tips para guiar al equipo en el proceso
 Capacidad para generar reportes en Excel
 Un proceso para mejorar la comunicación con el equipo de
ingeneiría
El Web site donde se encuentra el software es www.redpepr.ford.com

596
Aplicaciones del FMEA

Express
Ambiental
De máquinas

597
FMEA Express
Es un proceso que aplica técnicas de FMEA
simultaneamente tanto a los aspectos de diseño
como a los de manufactura de un proyecto:

Consiste de cuatro fases:


 Preparación: Se forma un equipo directivo para definir el
alcance del proyecto, equipo de trabajo multidisciplinario,
colección de información y documentos de modos de falla
conocidos, causas, efectos y controles

598
FMEA Express
 Desarrollo del FMEA: El equipo de trabajo multidisciplianrio
completa el FMEA utilizando formatos y definiciones estándar

 Posterior a la tarea: El facilitador y el equipo directivo


generan un reporte final y un plan de seguimiento. El líder del
equipo de FMEA es responsable de monitorear el avance

 Auditoría de calidad: Después de una verificación de


calidad, se proporciona un certificado de cumplimiento

Software para el FMEA: www.quality.ford.com/cpar/fmea/

599
E-FMEA ambiental

600
E-FMEA ambiental

601
Matriz de requerimientos ambientales
con criterios múltiples
 Para cada alternativa de diseño resumir la siguiente
información
 Uso de substancias prohibidas o de uso restringido
 Tipo y cantidad de residuos (refleja el nivel de materiales
utilizados)
 Consumo de energía por componente
 Consumo de agua por componente
 Otros objetivos ambientales

602
E-FMEA
Ejemplos de acciones recomendadas (hacer una revisión
previa de efectos secundarios en la vida del
producto):
 Sistemas de conexión alternos
 Reciclar

 Rutas alternas de disposición de residuos


 Uso de materiales naturales

 Revisar rutas de transporte


 Reducir trayectorias de proceso
 Optimizar el consumo de agua y energía

603
E-FMEA
Salidas del FMEA ambiental:
 Recomendaciones de materiales

 Recomendaciones de diseño (vg. Tipo de enlace)

 Recomendaciones de proceso (vg. Potencial de


ahorro de energía)

 Recomendación para rutas de disposición

604
MFMEA – FMEA de maquinaria

605
FMEA de maquinaria
 Su propósito es que a través de un equipo se asegure que los
modos de falla y sus causas/mecanismos asociados se hayan
atendido

 Soporta el proceso de diseño en:


 Apoyar en la evaluación objetiva de las funciones del

equipo, requerimientos de diseño y alternativas de diseño

 Incrementar la probabilidad de que los modos de falla y sus


efectos en la maquinaria se han considerado en el proceso
de diseño y desarrollo

606
FMEA de maquinaria

 Proporcionar información adicional como apoyo a la


planeación de todos los programas de diseño, prueba y
desarrollo

 Desarrollar una lista de modos de falla potenciales en


base a su efecto con el cliente, estableciendo
prioridades para mejoras al diseño y desarrollo

 Proporcionar documentación para referencia futura para


el análisis de problemas de campo, evaluando cambios
de diseño y desarrollo de maquinaria.

607
FMEA de maquinaria
 Ejemplos de descripción de funciones
 Proceso de partes – 120 tareas / hora

 Cabezal del índice – MTBF > 200 Hrs

 Control del flujo hidráulico – 8p cl/seg.

 Sistema de posición – Ángulo de rotación de 30º

 Hacer un barreno – Rendimiento a la primera 99.9%

608
FMEA de maquinaria
 Efectos potenciales como consecuencias de falla de subsistemas
en relación a seguridad y “Las 7 grandes pérdidas”
 Falla – pérdidas resultado de una pérdida funcional o

reducción de la función sobre una parte del equipo


requiriendo intervención de mantenimiento

 Preparación y ajustes – pérdidas que son resultado de


procedimientos de preparación tal como herramentado,
cambio de modelo o cambio de molde. Los ajustes incluyen
el tiempo muerto usado para ajustar el equipo para evitar
defectos y bajo rendimiento, requiriendo intervención del
operador o ajustador

609
FMEA de maquinaria
 Tiempo de espera y paros menores – pérdidas
resultado de interrupciones menores al flujo del proceso
(como atoramiento de microswitch) requiriendo
intervención del operador. El tiempo de espera sólo se
puede resolver revisando el sistema / línea completa

 Capacidad reducida – pérdidas que resultan de la


diferencia entre el ciclo de tiempo ideal del equipo y su
tiempo de ciclo real. El tiempo de ciclo ideal se
determina por: a) velocidad original; b) condiciones
óptimas y c) tiempo máximo de ciclo logrado con
maquinaria similar
610
FMEA de maquinaria
 Pérdidas en el arranque – pérdidas que ocurren
durante los primeros pasos del proceso productivo
después de paros largos (fines de semana, días de
azueto, o entre turnos), resultando en rendimiento
reducido o incremento de desperdicio y rechazos

 Partes defectivas – pérdidas que resultan de la


generación de defectos que producen retrabajo,
reaparaciones, y/o partes no útiles

 Herramentales – pérdidas que resultan de fallas en


el herramental, rotura, deterioración o desgaste (vg.
Herramientas de corte, tips de soldadura, etc.)
611
FMEA de maquinaria
Criterios de Severidad

612
FMEA de maquinaria
 Causas potenciales, se asume que la maquinaria se
fabricó, instaló, usó, y se dispuso de acuerdo a sus
especificaciones, preguntarse para identificar causas
potenciales lo siguiente:
 ¿Cuáles son las circunstancias que pueden orientar al
componente, subsistema y sistema a no cumplir sus
requerimientos funcionales / de desempeño?

 ¿A qué grado pueden los componentes, subsistemas y


sistemas que interactúan ser compatibles?

 ¿Qué especificaciones garantizan compatibilidad?


613
FMEA de maquinaria
Criterios de Ocurrencia

614
FMEA de maquinaria
Criterios de Detección

615
Herramientas de la
Fase de Análisis

Identificación de causas potenciales


Cartas Multivari y Análisis de Regresión
Intervalos de confianza y Pruebas de Hipótesis

616
Identificación de causas
potenciales

Tormenta de ideas
Diagrama de Ishikawa
Diagrama de Relaciones
Diagrama de Árbol
Verificación de causas raíz

617
Tormenta de ideas
 Técnica para generar ideas creativas cuando la mejor
solución no es obvia.

 Reunir a un equipo de trabajo (4 a 10 miembros) en un


lugar adecuado

 El problema a analizar debe estar siempre visible

 Generar y registrar en el diagrama de Ishikawa un gran


número de ideas, sin juzgarlas, ni criticarlas

 Motivar a que todos participen con la misma oportunidad

618
Tormenta de ideas
 Permite obtener ideas de los participantes

619
Diagrama de Ishikawa
 Anotar el problema en el cuadro de la derecha

 Anotar en rotafolio las ideas sobre las posibles causas


asignándolas a las ramas correspondientes a:
 Medio ambiente

 Mediciones

 Materia Prima

 Maquinaria

 Personal y

 Métodos

o
 Las diferentes etapas del proceso de manufactura o

servicio
620
Diagrama de Ishikawa
Medio
ambiente Métodos Personal
Frecuencia Falta de
Rotación de
Clima personal
de visitas supervi
húmedo Falta de
ción
motivación
Posición de Ausentismo
Distancia de exhibidores
la agencia al
Elaboración ¿Qué
changarro de pedidos produce
bajas ventas
Clientes con Calidad del de
ventas bajas Seguimiento producto Tortillinas
Malos
semanal Tía Rosa?
Conocimiento
itinerarios
de los Tipo de
Descompostura mínimos por exhibidor
del camión ruta
repartidor

Maquinaría Medición Materiales


Diagrama de relaciones Perdida de mercado
debido a la
competencia
No hay flujo
efectivo de mat. Influencia de la Compra de material
Por falta de situación econ del para el desarrollo de
programación país nuevos productos por
de acuerdo parte inv..... Y desarrollo’’’
No hay coordinación
a pedidos entre marketing
Falta de operaciones
No hay control coordinación al fincar
de inv..... En proc. pedidos entre
Constantes
Falta de prog. De marketing y la op.
cancelaciones
la op. En base a No hay coordinación
de pedidos
los pedidos entre la operación y las unidades
de marketing
Programación del negocio
Las un. Reciben
deficiente
ordenes de dos
deptos diferentes
Capacidad
instalada Falta de coordinación
desconocida entre el enlace de compras
Altos Duplicidad Demasiados deptos
de cada unidad con compras
Falta de control de inventarios de funciones de inv..... Y desarrollo
corporativo
inventarios en
Compras
compras
aprovecha
Falta de com..... Entre
ofertas No hay com..... Entre
las dif. áreas de
las UN y la oper.
la empresa
Marketing no
Mala prog. De tiene en cuenta
ordenes de compra cap de p.

No hay com..... Entre compras


con la op. general
Influencia directa de
marketing sobre
compras
Falta de comunicación
entre las unidades
del negocio
622
¿Que nos puede provocar Variación de Velocidad
Durante el ciclo de cambio en la sección del Embobinadores?

13/0 2/1
Bandas de
Dancer transmisión
2/4 Taco generador 1/1 Causas a validar
del motor Empaques de arrastre

0/4 Poleas guías 0/3


Presión de aire de trabajo

1/2 Presión del 5/2


Drive principal
dancer

5/1 Mal guiado 4/1


Voltaje del motor

1/4 Sensor de velocidad


de línea 1/5Ejes principales
Entradas Causa
Salidas Efecto
1/4 Sensor
1/5Poleas de transmisión
circunferencial
What Data Needs to be Collected to understand
the sources of variation in a key measure ?
Interrelationship Diagraph
Allows a team to identify & classify the cause and effect relationships that exist among variables
Business Planning Process
Means not Driver
clearly
defined
Plan not
In = 3 Out = 2 integrated
Communica-
tion issues In = 2 Out = 4
within the
group
In = 1 Out = 3 Fast new
product
introductions
stretch
resources
In = 1 Out = 2

No strong
commitment
to the group
In = 2 Out = 0

Capacity
may not
meet needs

Planning In = 5 Out = 1
approach not
standardized Outcome
In = 0 Out = 5

External Lack of
Driver factors impact time and
implemen- resources
tation
In = 5 Out = 0
In = 0 Out = 2
Diagrama de árbol o sistemático

Meta Medio
Meta Medio
Meta Medio
Segundo Tercer Cuarto
Primer nivel nivel nivel
nivel
Medios
Medios
Medios

Medios
o planes

Meta u
objetivo

Medios
o planes

625
Diagrama de Arbol- Aplicación Sistema SMED
¿Cómo? ¿Cuándo?
Filmar la preparación 5- 12 - Mar-04
Preparación
para el SMED
Analizar el video 10 y 17 –Mar-04

Describir las tareas 17- Mar-04

¿Objetivo? Separar las tareas 17- Mar-04


Fase 1: Separación
de la preparación Elaborar lista de chequeo 2- Mar-04
Implantar el interna de la externa
Sistema Realizar chequeo de
24- Mar-04
funciones
SMED
Producto DJ Analizar el transporte de
24- Mar-04
2702 herramientas y materiales
Analizar las funciones y
¿Qué? Fase 2: Conversión propósito de c/operación
12 - Abr- 04
de preparación
Convertir tareas de prepa-
interna en externa ración interna a externas
15 –Abr - 04
Elaboramos un
Diagrama de Arbol Realización de operaciones
5 –May -04
en paralelo.
para poder
analizar nuestro Fase 3: Refinamiento
Uso de sujeciones
problema siguiendo de todos los aspectos funcionales.
19– May -04

el sistema SMED. de la preparación.


Eliminación de ajustes 12- May -04
19
Verificación de posibles causas
 Para cada causa probable , el equipo deberá
por medio del diagrama 5Ws – 1H:
 Llevar a cabo una tormenta de ideas para
verificar la causa.
 Seleccionar la manera que:
 represente la causa de forma efectiva, y
 sea fácil y rápida de aplicar.

627
Calendario de las actividades

¿qué? ¿por qué? ¿cómo? ¿cuándo ¿dónde ¿quién?


? ?
1 1.1 Por variación de 1.1.1 Tomar dimensiones de ensamble entre Abril ’04 1804 J. R.
Tacogenerador voltaje durante el coples. Embob.
de motor ciclo de cambio 1.1.2 Verificar estado actual y
embobinador especificaciones de escobillas.
1.1.3 tomar valores de voltaje de salida
durante el ciclo de cambio.
2 Sensor 2.1 Por que nos 2.1.1 Tomar dimensiones de la distancia Abril ’04 1804 U. P.
circular y de genera una varión en entre poleas y sensores. Embob.
velocidad de la señal de referencia 2.1.2 Tomar valores de voltaje de salida de
linea. hacia el control de los sensores.
velocidad del motor
2.1.3 Verificar estado de rodamientos de
embobinador poleas.
3 Ejes 3.1 Por vibración 3.1.1 Tomar lecturas de vibración en Abril’04 1804 F. F.
principales de excesiva durante el alojamientos de rodamientos Embob.
transmisión. ciclo de cambio 3.1.2 Comparar valores de vibraciones con
lecturas anteriores.
3.1.3 Analizar valor lecturas de vibración
tomadas.

4 Poleas de 4.1 Puede generar 4.1.1 Verificar alineación, entre poleas de Abril’04 1804 J. R.
transmisión de vibración excesiva ejes principales y polea de transmisión del Embob. U. P.
ejes durante el ciclo de motor.
embobinadores cambio. 4.1.2 Tomar dimensiones de poleas(dientes
. de transmisión).
4.1.3 Tomar dimensiones de bandas (dientes
de transmisión)
4.1.4 Verificar valor de tensión de bandas. 628
Resumen de la validación de las causas

# de Causa
Resultados Causa
Causas Raíz

1 Ensamble de ojillos, bloques y X


SI ES CAUSA RAIZ
contrapesos no adecuados en
aspas.
2 Amortiguadores dañados. X
SI ES CAUSA RAIZ
3 Desgaste de bujes en los
carretes. NO ES CAUSA RAIZ
4 Fabricación y reemplazo de
NO ES CAUSA RAIZ
ejes y poleas no adecuados en
ensamble de aspas.
Desalineamiento de poleas y
5 bandas de transmisión de SI ES CAUSA RAIZ X
aspas.
Método de Balanceo no
6 adecuado.
SI ES CAUSA RAIZ X
7 Desalineación de pinolas en NO ES CAUSA RAIZ
cuna.
VI.D Métodos de análisis
adicionales

630
Métodos adicionales de análisis
1. Análisis de brecha

2. Análisis de causa raíz

3. Análisis del Muda

631
VI.D.1 Análisis de brecha

632
 El análisis de brecha (Gap Analysis) es una
herramienta de evaluación para comparar el
desempeño actual de la organización, a un
desempeño potencial deseado.

 Identifica la diferencia de lo que es y lo que debería


ser

633
Análisis de brecha
 Se pueden redirigir los esfuerzos a objetivos como:
 Permanecer en el negocio
 Mantener o incrementar la participación del mercado
 Mejorar el clima laboral
 Igualar o exceder a Benchmarks
 Igualar o exceder a la competencia
 Reducir tiempos de ciclo
 Lograr certificaciones
 Mejorar la productividad
 Mejorar los niveles de calidad

634
Análisis de brecha
 Se requieren tres categorías de información
 ¿Dónde estamos?
 ¿Dónde queremos ir?
 ¿Cómo vamos a medir los resultados?

635
Planeación de escenarios
 Al elaborar planes estratégicos, los directivos pueden
confiarse o ser orgullosos de aceptar cambios. Por lo
que se sugiere considerar escenarios del mejor y del
peor caso, para evitar errores en la toma de
decisiones

 Los escenarios permiten imaginar el desempeño


futuro de la organización ante riesgos, para tomar las
mejores decisiones y atender estos eventos. Aunque
algunos elementos sean desconocidos

636
Planeación de escenarios
 El proceso de planeación es como sigue:
 Seleccionar al personal que pueda dar muchas
perspectivas
 Desarrollar una lista de cambios percibidos, sociales,
técnicos y económicos
 Agrupar estas percepciones en patrones relacionados
 Desarrollar una lista de las mejores percepciones
(prioridades)

637
Planeación de escenarios
 El proceso de planeación es como sigue:
 Desarrollar un escenario grueso del futuro basado en
estas prioridades
 Determinar como afectan los escenarios a la
organización
 Determinar los cursos de acción potenciales a tomar
 Monitorear, evaluar, y revisar los escenarios

638
Planeación de escenarios
 Por lo común se perciben de 6 – 10 amenazas u
oportunidades en 2 o 3 escenarios desarrollados.
Evitar las siguientes trampas:

 No utilizar un facilitador experimentado

 Considerar escenarios como pronósticos

 Hacer escenarios simplistas

 Limitar el impacto global de los escenarios

639
Planeación de escenarios
 Evitar las siguientes trampas…..:
 No incluir a un equipo directivo en el proceso

 Tratar los escenarios solo como actividad informativa

 Limitar el estímulo imaginativo en el diseño del


escenario

 No desarrollar escenarios para área de impacto clave


del negocio

640
Planeación Hoshin
 Es una herramienta de ejecución, usada para
organizar y desplegar planes estratégicos

 Hoshin traduce la visión de la empresa en resultados


medibles dramáticos y rupturas estratégicas

 Hoshin se enfoca a identificar los pocos logros vitales


de ruptura

641
Planeación Hoshin
 Tiene seis objetivos:
 Alinear las metas organizacionales

 Enfocarse en las pocas brechas vitales estratégicas

 Trabajar con otros para cerrar las brechas

 Especificar los métodos para lograr los objetivos

 Hacer visible el enlace entre planes locales

 Mejora continua del proceso de planeación


642
Otras técnicas de análisis clave
 Benchmarking

 Análisis FODA

 Análisis PEST

 Las cinco fuerzas competitivas de Porter

643
Evaluación organizacional
 Análisis funcional con datos de colección:
 Entrevistas cara a cara
 Selección de muestra apropiada
 Entradas de grupo de enfoque
 Observaciones de visitas a la planta
 Datos colectados de fuentes de la industria

 Se divide a la organización en áreas funcionales clave


 Liderazgo, prácticas de negocio, análisis financiero,
mercadotecnia, gestión de la calidad, diseño y
desarrollo, manufactura, salud y seguridad, etc…

644
Evaluación organizacional
 Se deben analizar los resultados y presentarlos a la
dirección, quien debe promover e implementar
planes de acción claros

 Normalmente el consultor colecta y resume la


información en categorías principales para su revisión
por la dirección. Quienes deben generar e
implementar las soluciones y guiar al éxito

645
Métricas organizacionales
 Se establecen metas de desempeño organizacional y
sus métricas en las áreas de:
 Utilidades
 Tiempos de ciclo
 Recursos
 Respuestas del mercado

 Por cada meta organizacional mayor deben


desarrollarse métricas, con unidades y métodos de
medición.

646
Métricas organizacionales
Para los anteriores, las métricas pueden ser:
 Utilidades a corto y largo plazo

 Valor de acciones, inversión de capital, costos


personales, comparaciones competitivas, ROI, ventas$

 Tiempos de ciclo
 Tiempos de ciclo actuales
 Benchmarks internos
 Benchmarks externos
 Reducción en tiempos de ciclo

647
Métricas organizacionales
 Recursos
 No. De proyectos de mejora, ROI de proyectos, estudios de

capacidad de procesos, reducciones de variabilidad, costos


de calidad con relación a una base, porcentaje de defectos
con relación a alguna base

 Respuestas del mercado


 Encuestas con clientes

 Análisis de devoluciones

 Desarrollo de nuevos productos

 Retención de clientes

 Pérdidas con clientes

 Tasas de cortesías e instalaciones


648
Métricas organizacionales
Las métricas permiten medir los avances en relación a
las metas organizacionales

 De acuerdo a Juran se debe tomar en cuenta lo


siguiente:
 Las métricas deben tener un significado estándar
 Deben apoyar el proceso de toma de decisiones
 Deben proporcionar información valiosa
 Debe ser fácil de instalar
 Si son valiosas, deben usarse en todo
 Las métricas se basan en la retroalimentación con
base en clientes, proveedores, o internas
649
VI.D.2 Análisis de causa raíz

650
Análisis de causa raíz

 Un equipo tiene la responsabilidad de determinar la


causa raíz de una deficiencia y corregirla. Pueden
tomar varios pasos:

 Situación (presa con fuga)


 Acción inmediata (desahogarla)
 Acción intermedia (reparar la presa)
 Acción en la causa raíz (identificar que causó la fuga
para evitar su recurrencia y reconstruir la presa)

651
Análisis de causa raíz

Se pueden utilizar las siguientes herramientas:


 Herramientas subjetivas:

 Preguntar por qué cinco veces, tormenta de ideas,

 análisis de flujo de proceso, PHVA, grupo nominal,

 observación de operación, diagrama de causa efecto,

 técnicas de consenso, seis sombreros de pensamiento,


 equipos de trabajo, FMEA, FTA


652
Análisis de causa raíz

Se pueden utilizar las siguientes herramientas:


 Herramientas analíticas:

 Colección y análisis de datos

 Análisis de Pareto, análisis de regresión, hoja de


verificación

 Análisis de matriz de datos


 Análisis de capacidad de procesos, división de variación

 Subgrupos de datos, experimentos simples, DOE


 Pruebas analíticas, cartas de control
653
Análisis de causa raíz

Ante una acción correctiva permanente, la dirección


debe determinar si:

 El análisis de causa raíz ha identificado el impacto


completo del problema

 La acción correctiva es efectiva para eliminar o


prevenir la recurrencia

 La acción correctiva es realista y sostenible


654
Los 5 Por qués
 Se hace la pregunta ¿Por qué? Cinco veces
 ¿Por qué? Nos faltaron partes por máquina dañada
 ¿Por qué? La máquina no ha tenido mantenimiento en
los últimos 3 meses
 ¿Por qué? El departamento de mantenimiento se ha
reducido a 6 personas de 8
 ¿Por qué? Se pasó del presupuesto, les quitaron el
tiempo extra y dos personas
 ¿Por qué? La empresa no ha tenido los resultados
esperados y el director ha hecho recortes para salvar la
situación, teme por su puesto

655
5Ws y 1H
 El método de las 5Ws y 1H se resume al preguntar
¿quién?, ¿qué?, ¿cuándo?, ¿dónde?, ¿por qué? Y
¿cómo?.

 Pueden usarse las ramas del diagrama de causa


efecto

656
Diagrama de causa efecto
 Rompe el problema en partes más pequeñas
 Muestra muchas causas potenciales gráficamente
 Muestra como interactúan las causas
 Sigue las reglas de la tormenta de ideas
 Las sesiones tienen tres partes:
 Tormenta de ideas
 Dar prioridades (identificar las tres causas principales)
 Desarrollo de un plan de acción

657
Diagrama de Pareto
 Sirve para identificar problemas u oportunidades
prioritarias o mayores

 De acuerdo a Juran permite identificar “los pocos


vitales” de los “muchos triviales”

 El principio de Pareto sugiere que unas cuantas


categorías de problemas (20% aprox.) presentan la
mayor oportunidad para la mejora (80% aprox.)

658
Método de las 8 disciplinas - Ford
 El método de Ford para el análisis de causa raíz es:
D1. Establecer el equipo
D2. Describir el problema
D3. Desarrollar una acción de contención
D4. Identificar la causa raíz
D5. Desarrollar alternativas de solución
D6. Implementar una acción correctiva permanente
D7. Prevenir la recurrencia
D8. Reconocer al equipo y las contribuciones individuales

659
Análisis de árbol de falla - FTA
 FTA es un método sistemático deductivo, para definir
un evento singular específico e indeseable, y
determinar todas las posibles razones (fallas) que
pueden hacer que ocurra el evento

 Se utiliza el las primeras fases del diseño como


herramienta para impulsar modificaciones iniciales de
diseño.

660
Análisis de árbol de falla - FTA
 Otras áreas de su aplicación son:
 Análisis funcional de sistemas complejos
 Evaluación de requerimientos de seguridad,
 confiabilidad,
 defectos de diseño,
 riesgos de peligro,
 acciones correctivas,
 simplificación de mantenimiento y detección de falla,
 eliminación lógica de causas de falla

661
Análisis de árbol de falla - FTA
 Se prefiere el FTA en vez del FMEA cuando:
 La seguridad el personal es importante
 Se pueden identificar un número pequeño de eventos
superiores
 Hay alto potencial de falla
 El problema es cuantificar la evaluación del riesgo
 La funcionalidad del producto es altamente compleja
 El producto no es reaprables

662
Análisis de árbol de falla - FTA
 Se prefiere el FMEA en vez del FTA cuando:
 Los eventos superiores no se pueden definir
explícitamente
 Son factibles múltiples perfiles potencialmente exitosos
 La identificación de todos los modos de falla es
importante
 La funcionalidad del producto tiene poca intervención
externa

663
Análisis de árbol de falla - FTA
 Símbolos de compuertas lógicas para determinar la
confiabilidad del sistema. Hay símbolos de eventos y
símbolos de compuertas

 Símbolos de eventos

Evento superior, falla a nivel sistema o evento


indeseable

Evento básico, evento falla de más bajo nivel


a estudiar

Evento de falla, evento de falla de bajo nivel. Puede recibir


entradas o proporcionar salidas a una compuerta lógica

664
Análisis de árbol de falla - FTA
 Símbolos de compuertas lógicas

“AND”. El evento de salida ocurre solo


Si ocurren todos los eventos de entrada
Simultaneamente

“OR”. El evento de salida ocurre si


Ocurre alguno de los eventos de
La entrada

665
Análisis de árbol de falla - FTA
 Ejemplo: se asume que falla el sistema superior

666
Análisis de árbol de falla - FTA
 La probabilidad de falla del sistema es 5.02%. Se
indica que el teclado es prioritario (0.20), después la
CPU (0.015) y el monitor (0.015)

667
VI.D.3 Análisis del Muda

668
Análisis de Muda
 Las actividades que no agregan valor se clasifican
como Muda, de acuerdo a Imai son:
 Sobreproducción
 Inventarios
 Reparaciones / rechazos
 Movimientos
 Transportes
 Re – Procesos
 Esperas

669
Sobreproducción
 Se produce más en cierto momento, por:
 Producir más de lo necesario por el siguiente proceso
 Producir antes de lo requerido por el siguiente proceso
 Producir más rápido de lo requerido por el siguiente
proceso
 Sus consecuencias son:
 Espacio extra en las instalaciones del cliente
 Materias primas adicionales en uso
 Utilización de energéticos y transportes adicionales
 Costos de programación adicionales

670
Inventario en exceso
 Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
 Espacio en piso, Transporte, Montacargas
 Sistemas de transportadores
 Interés sobre el costo de los materiales

 Puede verse afectado por:


 El polvo, deterioro, obsolescencia
 Humedad (oxidación), daño durante el manejo

671
Inventario en exceso
 Las partes, materias primas, inventario en proceso,
refacciones y productos terminados forman el
inventario, el inventario es Muda ya que requiere:
 Espacio en piso, Transporte, Montacargas
 Sistemas de transportadores
 Interés sobre el costo de los materiales

 Puede verse afectado por:


 El polvo, deterioro, obsolescencia
 Humedad (oxidación), daño durante el manejo

672
Reparaciones / defectos
 Las reparaciones o el retrabajo de partes defectivas
significa un segundo intento de producirlas bien. Se
rompe el Takt Time

 Puede haber desperdicio de materiales o productos no


recuperable

 Si hay defectos, no puede implementarse el flujo de


una pieza
 Los cambios de diseño también son Muda

673
Movimientos
 Los movimientos adicionales del personal son Muda.
Caminar mucho, cargar pesado, agacharse, estirarse
mucho, repetir movimientos, etc.

 El lugar de trabajo debe diseñarse ergonómicamente,


analizando cada estación de trabajo

 La ergonomía puede causar daños y producción


perdida

674
Movimientos
 Algunas reglas de la ergonomía incluyen:
 Enfatizar la seguridad todas las veces
 Adecuar el empelado a la tarea
 Cambiar el lugar de trabajo para que se adecue al
empleado
 Mantener posiciones neutrales del cuerpo
 Rediseñar las herramientas para reducir esfuerzo y
daños
 Variar las tareas con rotación de puestos
 Hacer que la máquina sirva al ser humano

675
Reprocesos
 Consiste de pasos adicionales en el proceso de
manufactura, por ejemplo:
 Remoción de rebabas
 Maquinado de partes mal moldeadas
 Agregar procesos de manejo adicionales
 Realizar procesos de inspección
 Repetir cambios al producto innecesarios
 Mantener copias adicionales de información

676
Transportes
 Todo transporte es Muda excepto la entrega al
cliente. Incluye:
 Uso de montacargas
 Uso de transportadores
 Uso de movedores de pallets y camiones

 Puede ser causado por:


 Deficiente distribución de planta o de celdas
 Tiempos de espera largos, áreas grandes de
almacenaje, o problemas de programación

677
Esperas
 Ocurre cuando un operador está listo para realizar su
operación, pero permanece ocioso, por falla de
máquina, falta de partes, paros de línea, etc. El Muda
de espera puede ser por:
 Operadores ociosos
 Fallas de maquinaria
 Tiempos de ajuste y preparación largos
 Tareas no programadas a tiempo
 Flujo de materiales en lotes
 Juntas largas e innecesarias

678
Mudas adicionales
 Otros mudas adicionales a los 7 desperdicios son:
 Recursos mal utilizados
 Recursos poco utilizados
 Actividades de conteo
 Búsqueda de herramientas o partes
 Sistemas múltiples
 Manos múltiples
 Aprobaciones innecesarias
 Fallas de máquinas
 Envío de producto defectivo al cliente o mal servicio

679
Salidas de la Fase de Análisis
 Causas raíz validadas

 Guía de oportunidades de mejora

680
Preguntas ejemplo
1. En un sentido amplio, cuantas de las siguientes causas de
variación en estudios multi vari pueden incluir elementos de
proceso relacionados con el tiempo:
I. Posicional
II. Cilíndrica
III. Temporal
a. I y II c. II y III
b. I y III d. I, II y III

2. En un estudio de análisis de regresión con dos variables, ¿que


representa el término Beta 1?:
a. La pendiente de la línea
b. La interacción de la medición
c. La intersección en el eje X
d. La intersección en el eje Y
3. Se hace un estudio entre la velocidad de coches y su consumo
de gasolina. El coeficiente de correlación es de 0.35. Después
se encontró que el velocímetro está equivocado y debió haber
marcado 5 km. De más. Se recalcula el coeficiente de
correlación, que debe dar:
a. 0.30 b. 0.35 c. 0.40 d. -0.35 681
Preguntas ejemplo
4. La siguiente ecuación es:
a. La covarianza de X y Y
b. El coeficiente de correlación de X y Y
c. El coeficiente de determinación de X y Y
d. La varianza del producto de X y Y

5. Según la figura, ¿Cuál de las afirmaciones siguientes es falsa?

I. El coeficiente de correlación es negativo


II. El coeficiente de determinación es positivo
III. El coeficiente de determinación es menor que el coeficiente de
correlación
a. Sólo I c. Sólo III
b. Sólo II d. II y III
682
Preguntas ejemplo
6. Un problema de correlación:
a. Se resuelve estimado el valor de la variable
dependiente para varios valores de la variable
independiente
b. Considera la variación conjunta de las dos
mediciones, ninguna de las cuales es restringida por
el experimentador
c. Es un caso donde la distribución relevante debe ser
geométrica
d. Se resuelve al asumir que las variables son normales
e independientemente distribuidas con media cero y
varianza “s”

683
Preguntas ejemplo
7. Una muestra aleatoria de tamaño n se toma de una gran población con
desviación estándar de 1.0”. El tamaño de muestra se determina de
manera que haya un 0.05 de probabilidad de riesgo de exceder 0.1” de
error de tolerancia al usar la media de la muestra para estimar la Mu.
¿Cuál de los siguientes valores es el más cercano al tamaño de muestra
requerido?

a. 365 b. 40 c. 200 d. 100

8. La diferencia entre poner alfa de 0.05 y alfa igual a 0.01 en una prueba
de hipótesis es:
a. Con alfa de 0.05 se tiene mayor tendencia a cometer un error tipo I
b. Con alfa de 0.05 se tiene más posibilidad de riesgo de cometer un error
tipo II
c. Con alfa de 0.05 es una prueba más “conservadora” de la hipótesis nula
Ho
d. Con alfa de 0.05 se tiene menos posibilidad de cometer un error tipo I

9. Si un tamaño de muestra de 16 tiene un promedio de 12 y una


desviación estándar de 3, estimar el intervalo de confianza para un
nivel de confianza del 95% para la población (asumir una distribución
normal)

684
Preguntas ejemplo
10. En una muestra aleatoria de 900 vehículos, 80% tienen frenos
ABS. ¿Cuál es el intervalo del 95% para el porcentaje de
vehículos con frenos ABS?
a. 0.778 – 0.821 c. 0.639 – 0.964
b. 0.771 – 0.829 d. 0.774 – 0.826

11. Determinar si los siguientes dos tipos de misiles tienen


diferencias significativas en sus varianzas a un nivel del 5%:
Misil A: 61 lecturas Varianza = 1.347 km2.
Misil B: 31 lecturas Varianza = 2.237 km2.
a. Hay diferencia significativa ya que Fcalc < Ftablas
b. No hay diferencia significativa por que Fcalc < Ftablas
c. Hay diferencia significativa por que Fcalc > Ftablas
d. No hay diferencia significativa pro que Facla > Ftablas

12. El valor crítico para t, cuando se hace una prueba t de dos


colas, con muestras de 13 y alfa de 0.05 es:
a. 1.782 c. 2.064
b. 2.179 d. 1.711
Preguntas ejemplo
13. Tres personas en entrenamiento se les proporciona el mismo lote de
50 piezas y se les pide que las clasifiquen como buenas o defectuosas,
con los resultados siguientes:
Persona
A B C Total
Defec tivos 17 30 25 72
Buenos 33 20 25 78
Total 50 50 50 150

Para determinar si hay o no hay diferencia en la habilidad de las tres


personas para clasificar adecuadamente las partes, ¿cuál de los
siguiente es (son) verdadero?
I. El valor calculado de Chi cuadrada es de 6.9
II. Para un nivel de significancia de 0.05, el valor crítico de Chi cuadrada
es de 5.99
III. Como el valor calaculado de Chi cuadrada en mayor a 5.99, se rechaza
la hipótesis nula
a. Sólo I c. Sólo II
b. I y II d. I, II y III

14. Un análisis de varianza de dos vías tiene r niveles para una variable y c
niveles para la otra, con dos obseraciones por celda. Los grados de
libertad para la interacción son:
a. 2 (r ) (c ) b. (r-1) (c-1) c. rc – 1 d. 2 (r -1) (c – 1)
Preguntas ejemplo
15. Los supuestos básicos del análisis de varianza oncluyen:
I. Las observaciones vienen de poblaciones normales
II. Las observaciones vienen de poblaciones con vaianzas iguales
III. Las observaciones vienen de poblaciones con medias iguales
a. I y II c. II y III
b. I y III d. I, II y III

16. El valor teórico esperado para una celda en la tabla de


contingencia se calcula como:
Preguntas ejemplo
17. ¿Cuál de las siguientes afirmaciones son verdaderas en relación a
las pruebas no paramétricas?
I. Tienen mayor eficiencia que sus equivalentes pruebas paramétricas
II. Pueden ser aplicadas a estudios de correlación
III. Requieren supuestos acerca de la forma oi naturaleza de las
poblaciones involucradas
IV. Requieren cálculos que son más difíciles que sus equivalentes
pruebas paramétricas
a. Sólo II c. II y IV
b. I y III d. I, II y III

También podría gustarte