Exemplo de Medição Sistema Análise Resumo: 3. Encontre o Intervalo Das Médias Das Peças, R - R
Exemplo de Medição Sistema Análise Resumo: 3. Encontre o Intervalo Das Médias Das Peças, R - R
Exemplo de Medição Sistema Análise Resumo: 3. Encontre o Intervalo Das Médias Das Peças, R - R
é mostrado para ter adequado discriminação e para ser estábulo, preciso, linear (ver
abaixo), e consist- barraca com respeito para repetibilidade e reprodutibilidade. Se o
parte a parte padrão desvia- ção é para ser estimado de o medição sistema estudar
dados, o seguindo procedimentos São seguidos:
1. Trama o média para cada papel (entre todos avaliadores) sobre um médias
ao controle gráfico, como mostrado em o erro de reprodutibilidade método
alternativo.
2. confirme que no ao menos 50% de o médias cair fora o ao controle limites. Se
não, encontrar um melhor sistema de medição para este processo.
3. Encontre o intervalo das médias das peças, R p .
4. Calcular p R p / d , o parte a parte padrão desvio. O valor de d é
2 2
encontrado em Mesa 11 em o Apêndice usando m o número de peças e g 1,
desde lá é apenas um R Cálculo.
5. O total processo padrão desvio é encontrado como 2 2.
t
m
Uma vez o acima cálculos ter estive feito, o geral medição sistema pode ser
avaliado.
1. O %EV 100 ( e / T )%
2. O %DE 100 ( o / T )%
3. O por cento repetibilidade e reprodutibilidade (R&R) é 100 ( m / t )%.
4. O número de distinto dados categorias que pode ser criada com esse medir-
sistema de mento é 1,41 (PV/R&R).
t 80.5
2m 2p (0.44)2 (8.96)2 8,97
Uma vez o acima cálculos ter estive feito, o geral medição sistema pode ser
avaliado.
m 0,44
100 % 100 4,91%
t 8,97
4. O número de distinto dados categorias que pode ser criada com esse medir-
sistema de mento é 1,41 (PV/R&R)
46,15
1.41 28.67 28
2.27
Como o número mínimo de categorias é cinco, a análise indica que esse medição
sistema é mais que adequado para processo análise ou processo ao controle.
Saída
O Minitab produz saída abundante, incluindo seis gráficos separados, várias tabelas,
etc. Grande parte da saída é idêntica ao que foi discutido anteriormente neste capítulo
e não vai ser mostrado aqui.
Mesa 9.3 shows o análise de variância para o R&R estudar. Em o ANOVA o
EM para repetibilidade (0,212) é usado como o denominador ou erro prazo para
calculando o F -ratio de o Operador PartNum interação; 0,269/0,212 1.27. O F -
ratio para o Operador efeito é encontrado por usando o Operador PartNum
interação EM prazo como o denominador, 0,061/0,269 0,22. O F -razões são usado
para calcular o P valores, que mostram a probabilidade de que a variação observada
para a linha de origem possa ser devido para chance. Por convenção, a P valor
menos que 0,05 é o crítico valor para decidir- afirmando que uma fonte de variação é
“significativa”, isto é, maior que zero. Por exemplo, o valor P para a linha PartNum é
0, indicando que a variação entre peças é quase certamente não zero. Os valores P para
Operador (0,66) e Operador PartNum interação (0,34) são maiores que 0,05, então
concluímos que as diferenças contabilizadas para por esses fontes poder ser zero. Se
o Operador prazo era significativo (P < 0,05) nós seria concluir que lá eram
estatisticamente significativo diferenças entre operadores, alertando um investigação
em subjacente causas. Se o interação termo foi significativo, poderíamos concluir
que um operador obteve resultados diferentes resultados com alguns, mas não todos,
peças.
Fonte DF SS EM F P
PartNum 4 1301.18 325.294 1208.15 0
Operador 1 0,06 0,061 0,22 0,6602
Operador*PartNum 4 1.08 0,269 1.27 0,34317
Repetibilidade 10 2.12 0,212
Total 19 1304.43
80
Percent
60
40
20
0
Calibrar R&R
Repita a parte a parte
reprodução
Linearidade
Linearidade pode ser determinado por escolhendo peças ou padrões que cobrir todos
ou maioria de o operativo faixa de o medição instrumento. Viés é determinado no
cada apontar em o faixa e uma análise de regressão linear é realizada.
Linearidade é definiram como o declive vezes o processo variância ou o declive
vezes o para mim- erância, qualquer que seja é maior. A espalhar diagrama deve
também ser traçado de o dados.
as médias foram calculadas para cada peça conforme mostrado na Fig. 9.14. O viés da
peça foi calculado atrasado por subtraindo o papel referência valor de o papel média.
Uma análise de regressão linear foi realizada. Na regressão, x é a referência valor e
y é o viés. os resultados são mostrado na Fig. 9.15.
Os valores de P indicam que o resultado é estatisticamente significativo, ou seja, há
realmente aliado a viés em o calibrar. O declive de o linha é 0,132, e o interceptar é
0,74. R 2 0,98, indicando que o direto linha explica sobre 98% de o variação em o viés
leituras. O resultados podem ser resumidos da seguinte forma:
0,0
Ref. Valor
4 6 8 10
–1,0
2
interceptar
x 0,74
0,13 2 5 .61
decli
ve
Neste caso, este é o ponto de menor viés. Maior viés existe à medida que você
avança de este valor.
Esta informação é resumida graficamente na Fig. 9.16.
Um problema com esta análise é que o dado para cada peça é uma média de 12 medições, não
medidas individuais. Se pudéssemos obter as 60 medições reais, o valor- P provavelmente seria
diferente porque o erro padrão seria baseado em 60 medições em vez de 5. No Por outro lado, as
medições individuais também seriam mais variáveis, de modo que a magnitude exata do diferença é
impossível determinar sem os dados brutos.
F IGURA 9.17 MinitabName calibrar linearidade diálogo caixa.
Nome do
Linearidade do medidor medidor: Data Calibrar
análise de estudar: linearidade 0,792
Reportado por: Linearidad
e:
Tolerância: % Linearidade: 13.200
Diversos: R ao quadrado: 0,978
Calibrar viés
0,5 Viés: –0,052
% Viés: 0,867
Por cento de
processo
Bias
0,0 variação
14
12
10
Percent
8
6
–0,5
4
2
2 3456 7 8 9 10 0
Viés de Linearidade
Mestre papel medição
muito o mesmo caminho como nós Avalie variável medição sistemas. Muito menos
trabalhar tem estive feito sobre avaliando atributo medição sistemas. O propostas
oferecido em esse livro são aqueles Eu tenho encontrado para ser útil para meu
empregadores e clientes. O Ideias são não papel de qualquer padrão e você são
encorajado para pensar sobre eles criticamente antes adoção eles. EU também incluir
um exemplo de do Minitab atributo calibrar R&R análise.
Operacional Definições
Um operacional definição é definiram como a requerimento que inclui a significa de
medir- mento. “Solda de alta qualidade” é um requisito que deve ser
operacionalizado por um definição de o que "alto qualidade solda" significa. Esse
poder incluir verbal descrições, poder de ampliação, fotografias, espécimes de
comparação física e muito mais critério.
A B C D E F G H EU
1 Pape Padrão InspA InspB InspC Data Tempo Reprodutível Preciso
l
2 1 1 1 1 1 Hoje Manhã 1 1
3 1 1 0 1 1 Hoje Tarde 0 0
4 2 0 0 0 0 Hoje Manhã 1 1
5 2 0 0 0 1 Hoje Tarde 0 0
6 1 1 1 1 1 Dura Manhã 1 1
r
Sema
na
7 1 1 1 1 0 Dura Tarde 0 0
r
Sema
na
8 2 0 0 0 1 Dura Manhã 0 0
r
Sema
na
9 2 0 0 0 0 Dura Tarde 1 1
r
Sema
na
inspetor A B C
Precisão 87,5% 100,0% 62,5%
1010 100
1 2 0,50
4 4
Geral Estabilidade
Estabilidade é calculado para cada de o acima Métricas separadamente, como
mostrando em Mesa 9.12.
Measur ement Systems Evaluation 319
Estabili
Estabilidade de... Operacional Definição de Estabilidade
dade
Resulta
do
Repetibilidade Padrão desvio de o seis repetibilidades (0,5, 1, 0,5, 1, 1, 1) 0,41
Reprodutibilidad Padrão desvio de o média repetibilidades. Para dados em 0,00
e Mesa 9.9, STDEV [(MÉDIA (H2:H5), MÉDIA (H6:H9)]
Precisão Padrão desvio de o média precisões. Para dados em 0,00
Mesa 9.9, STDEV [MÉDIA (2:5), MÉDIA (6:9)]
Viés Média de viés sobre o 2 semanas 0,0
Interpretação de Resultados
1. O sistema geral parece ser imparcial e preciso. No entanto, a avaliação ção de
Individual inspetores indicam que há sala para melhoria.
2. Os resultados da análise de precisão individual indicam que o inspetor C tem
um problema com precisão, consulte Tabela 9.10.
3. Os resultados do R&R (em pares) indicam que o inspetor C tem um problema
com ambos repetibilidade e reprodutibilidade, ver Mesa 9.11.
4. O repetibilidade números são não muito estábulo (Mesa 9.12). comparando o
diagnóstico elementos onais de Hoje com os da Semana Passada na Tabela
9.11, vemos que os inspetores A e C tendiam a obter resultados diferentes nas
diferentes semanas. Outro- sábio o sistema parece ser relativamente estável.
5. A reprodutibilidade dos inspetores A e B não é perfeita. Algum benefício
pode ser obtido de olhar para razões para o diferença.
6. Desde inspetor B's resultados são mais preciso e Repetivel, estudo dela poder
levar à descoberta de melhores práticas.
F IGURA 9.21 Atributo calibrar R&R diálogo caixa e dados disposição dentro de avaliador análise.
Precisão Análise
O Minitab avalia a precisão observando com que frequência todas as classificações de
um avaliador para a dado papel concordar com o padrão. Figura 9.24 shows o
resultados para nosso exemplo. Como antes, MinitabName combina o resultados para
ambos dias. O trama de esses resultados é mostrando na Fig. 9.25.
MinitabName também visual no se ou não lá é a distinto padrão em o
desentendimentos com o padrão. Isto faz esse por contando o número de vezes o
avaliador classificado um item como a 1 quando o padrão disse isto era a 0 (o 1/0 Por
cento coluna), como muitas vezes o avaliador classificado um item como a 0 quando
isto era a 1 (o 0/1 Por cento coluna), e como muitas vezes o
Avaliação acordo Data de estudar:
Reportado por:
Nome do produto:
Avaliador vs Padrão Diversos:
100
[+, × ] 95,0% Cl
Por cento
Percent
50
0
InspA InspB InspC
Avaliador
Data de estudar:
Avaliação acordo Reportado por:
Nome do produto:
Avaliador vs Padrão Diversos:
50
0
InspA InspB InspC
Avaliador
318
Measur ement Systems Evaluation 319
F IGURA 9.28 MinitabName avaliação contra padrão acordo entre todos avaliadores.
avaliador classificações eram misturado, isto é, é não Repetivel (o # Misturado Por cento
coluna). O resultados são mostrando em Figo. 9.26. O resultados indicar que lá é não
consistente viés, definiram como consistentemente colocando a unidade em o mesmo
errado categoria. O problema, como era mostrando em o anterior análise, é que
avaliadores A e C são não Repetivel.
1. Defeitos
2. Superprodução
3. Os inventários (em processo ou finalizado bens)
321
322 Cha pte r T e n
4. Desnecessário em processamento
5. Circulação desnecessária de pessoas
6. Transporte desnecessário de mercadorias
7. Esperando
Womack e jones (1996) adicionado outro tipo de mudança :
8. Projetar bens e serviços que não atendem às necessidades dos clientes
Valor é o que clientes querer ou precisar, e são disposto e capaz para pagar para.
Desperdício é qualquer atividade que consome recursos, mas não cria valor para o
cliente, portanto, desperdício atividades são chamadas de “sem valor agregado”.
Diferenciar entre os dois pode não ser fácil, especialmente para novo produtos ou
Serviços, mas isto deve ser feito. Para existir produtos usar foco grupos, pesquisas, e
outro métodos descrito em esse texto. Para novo produtos, considerar o DFSS
métodos. Maioria importante, FAZER NÃO CONFIAR SOBRE INTERNO FONTES! A
maioria das empresas começa com o que já sabe e parte daí, ajustando sua oferta
existente de alguma forma. A entrada do cliente envolve perguntar avaliam o que
gostam ou não na oferta existente ou o que gostariam de ver adicionado ou alterado.
O resultado é uma mudança incremental que pode ou não abordar o que o clientes são
realmente depois. O definição de valor deve começar com o produtor e cliente
analisando valor em conjunto e desafiando velhas crenças.
Considere uma equipe com a tarefa de reduzir defeitos em gôndolas de
supermercado. O número um problema era "soldar dentes,” a doença causado quando
colchetes eram soldado para o prateleiras. A ótimo negócio de esforço foi em
inspecionando prateleiras para esse doença, correr- testes de laboratório para
determinar o impacto dos dentes de solda na durabilidade do prateleiras,
retrabalhando prateleiras que tinham mossas de solda, etc. Os custos da sucata eram
muito altos. Quando a equipe se reuniu com os clientes para tentar definir
operacionalmente mossas de solda inaceitáveis eles fizeram uma descoberta incrível:
os clientes não sabiam o que eram mossas de solda! Até mais estranho, quando
mostrando prateleiras com não soldar amolgadelas e aqueles com "extremo" soldar
amassados, clientes não poderia Cuidado menos. No entanto, clientes fez Cuidado
sobre o forma de o frente de o prateleiras. Eles desejado legal, direto olhando
prateleira frentes que visto fluxo- alinhados quando alinhados em longos corredores
de supermercados. Eles não estavam nada felizes com o que estava sendo entregue.
Ninguém dentro da empresa sabia que isso era importante para os clientes. tomers, e
sem esforços estavam em andamento melhorar este aspecto do produtos.
Se o gerente do supermercado fosse solicitado a definir valor, é provável que ele
não o fizesse. diga "Prateleiras com frentes retas que se alinham". Em vez disso, ele
pode dizer “Prateleiras que olhar bom para meu clientes quando eles olhar abaixo o
corredor." O importância de obtivermos- ouvir a voz do cliente e usar essa voz para
conduzir os processos de negócios foi discutido nos Caps. 2 e 3. Essas lições vitais do
Seis Sigma precisam ser integradas Magro como bem.
Com seu definição de valor em mão, você pode agora começar para Avalie qual
ativ- vínculos agregam valor e quais atividades são muda . Os resultados costumam
ser surpreendentes. Em alguns casos maioria Atividades são não valor adicionado.
Para exemplo, um Seis Sigma equipe trabalhando sobre melhorando comprar ordem
(PO) ciclo tempo (definiram como o tempo de recebendo a solicitar para a PO para o
tempo o solicitante recebido o PO) conduzido a pequeno teste. Eles feito a lista de
todos o pessoas cujo assinatura era necessário para PO aprovação. Então o equipe
mem- bers (com o aprovação de o diretor de comprando) carregado na mão 10 POs
Analyze Phase 323
através o processo. Cada comprando agente era para tratar o equipe membros
solicitar como deles número 1 prioridade, caindo todo outro atividade até isto era
concluído. O equipe descoberto que
324 Cha pte r T e n
isto pegou um média de sobre 6 horas para processo a PO. O média em processamento
tempo em o real mundo era 6 semanas. assumindo a 40 horas semana de trabalho, o
valor adicionado tempo contabilizado por apenas 2,5% do tempo total que um PO
esteve no sistema. Os 97,5% restantes foram muda . Mesmo isso não é toda a extensão do
muda . Durante as caminhadas, a equipe também começou para pergunta por que
alguns de o aprovações eram necessário. Em alguns casos, tal como POs para padrão
hardware ou básico suprimentos, o solicitante poderia ser empoderado para lugar o
ordem. Muitos POs poderia ser eliminado completamente com automático puxar
encomenda sistemas (ver Indivíduo. 11 para mais sobre puxar sistemas). O valor
adicionado parte de o comprar ordem
aprovação processo era pequeno de fato.
O impacto imediato de tais descobertas é o medo. Imagine-se como o diretor de
compras ou um agente de compras. Junto vem uma equipe com dados que indicam
que a maior parte do seu departamento não agrega valor. É de se admirar que os
agentes de mudança sejam tão muitas vezes falar sobre "resistência para mudar"?
Quem não iria resistir mudar quando que mudar você está perdendo seu emprego?
No entanto, este é frequentemente o caso e a liderança precisa enfrentar esse realidade
e para plano para isto. Eles ter a responsabilidade para o acionistas que dita que
reduzam o muda . Eles têm a responsabilidade de produzir valor para os clientes. Mas
eles também ter a responsabilidade para o funcionários para tratar eles com justiça. A
menos que todos o liderar- ership faz isto claro que justo tratamento é garantido, você
pode esperar forte resistência de pessoas ameaçadas pela mudança.
O departamento de compras precisa repensar o valor que agregam, ou seja, o seu
mis- sion. Se o trabalho deles não é embaralhar papéis burocráticos, então o que é?
Talvez seja melhor definido como a melhoria da integração da cadeia de
abastecimento com o resto do valor fluxo (consulte a seção a seguir para uma
discussão sobre o fluxo de valor). isso pode envolver olhando no como fornecedores
pode ajuda projeto mais fácil de produzir peças, como eles pode entregar exatamente
no lugar certo e na hora certa, o que eles podem fazer para ajudar seus clientes a terem
sucesso, etc. Isso é mais fácil de fazer na empresa de processo, onde os principais
processos de negócios controlam a definição do trabalho (consulte o Capítulo 2). No
final o transformado “comprando departamento" vai provavelmente olhar muito
diferente que isto fez no o início. Mas se as pessoas sentirem que a administração
tratou a todos de forma justa, as chances são moral vai melhorar mesmo enquanto
muda é eliminado. Depois tudo, quem quer ser muda ?
O bom notícias é que quando Magro organizações redefinir valor, eles muitas
vezes encontrar que eles ter descoberto o chave para encontrando mais clientes (e
mais vendas) muito rapidamente. O aumento da demanda muitas vezes supera a taxa
na qual os recursos são convertidos de muda para valor criação. Embora esse não é
garantido, isto acontece muitas vezes suficiente para pró- vide a medir de conforto
para funcionários, especialmente se eles ver isto acontecendo em deles ter
organização. Eles ainda podem precisar adquirir novas habilidades para fazer um tipo
diferente de trabalho, mas eles geralmente são capazes de se adaptar a isso.
Ao tentar identificar o muda, pode ser útil pensar em certas categorias de
desperdício. Um prático mnemônico é CLOSEDMITTS (Spencer, 1999) (Mesa 10.1).
2725 27251363
Acesso macs e verdadeiro
procurar para Modificar Procurar para e
do cliente ?modificar informações do pedido
info/verificar/modificar
Ordem modificação pedido 40s 5s 55s falsos
545 verdadeiro
13 63
5450 5450
E-mail Abrir E-mail Modificar ordem entrar
pedido e ler e/ou cliente informações? comentários em
resposta MACS
0s
17s Não MACS
5s Falso 31s
5450 2725
1363
2725
Busca Verdadeira
Pesquisar
solução? IBIS/SNIPPET 272 Verdadeiro Copie e cole trecho
banco Abrir em branco
tecnologia modelo em TECS e
de e-mail Acesso personalizar resposta
22s
apoiar
5s Falso 5450 5s fragmento banco
2725
Select 1362 59s
é
pré-formatados False
modelo pré-formatado 0s manual de tipo falso
resposta em TECS
disponível? modelo e
personalizar e customizar
resposta
5s Verdadeiro 55s
13 1s
5450 545054505450
Cpoy & colar 5450
Digite a resposta em das faixas novamente
comentários em Word/Executar Web prévia Fim
e enviar e-mail
verificação ortográfica/cópia TECS &
colar voltar em TECS 0s
23s 28s18s23s
o valor fluxo, isso é muda . Baseado sobre o vezes mostrando para cada atividade e o
caminho para um determinado problema de suporte, algo entre 38 e 49% do tempo
total é usado para atividades de valor agregado.
Infelizmente, em muitos casos, todas as etapas sem valor agregado não podem ser
imediatas. imediatamente eliminado. As etapas desnecessárias e sem valor agregado
que podem ser eliminadas sem consequência para o negócios ou o cliente são às vezes
referido para como Tipo II muda . A alguns de o passos envolver gravação Informação
que pode ser usado em o futuro para fazer isto mais rápido e mais fácil para encontrar
o certo respostas. Esse é um exemplo de a sem valor tarefa adicional que se faz
necessária, com base nas políticas internas. Às vezes referido como tarefas de valor
agregado de negócios (BVA), uma vez que podem ser justificadas como necessárias
para os negócios operações de segurança, essas tarefas não podem ser eliminadas
imediatamente sem consequências. Outro exemplos de típica BVA Atividades incluir
maioria qualidade funções, tal como inspecionar ções, auditorias e SPC, bem como
aprovações de gestão relacionadas. Estas funções apenas existem devido a níveis de
qualidade baixos: os clientes não estariam dispostos a pagar por eles se eles tinham
fornecedores alternativos que podiam garantir a qualidade perfeita sem o custo e risco
dessas atividades. Em alguns casos, as atividades da BVA estão relacionadas a
regulamentações, como em o Produção de produtos farmacêuticos. Nesses casos, no
ao menos alguns o BVA Atividades podem ser reduzidos quando justificados como
desnecessários por análise suficiente. Muitas vezes, BVA atividades são excelentes
alvos para redução significativa de custos através da melhoria do processo mento e
redesenhar. De curso, em o ausência de processo melhoria e processo rede- sinal, a
necessidade do negócio ainda existe.
disponível trabalhar
Takt tempo =
tempo
cliente obrigatório volume (10.1)
Trabalhar tempo faz não incluir almoços, rompe, ou outro processo tempo de
inatividade. Geralmente,
Takt tempo é usado para criar curto prazo (diário, semanalmente) trabalhar horários.
Isso significa que cada célula de trabalho e operação tem que mover o valor de um
sistema de trabalhe a cada 10 dias de trabalho, nem menos nem mais. Por exemplo, se
uma média satélite requer 10 baterias, então a operação da bateria precisa produzir
uma bateria por dia de trabalho, se um satélite precisa de 1.000 placas de circuito,
então 100 placas precisam ser com- preenchido todos os dias de trabalho.
Se a média histórica do processo for de 20 satélites por ano, então o tempo para
produzir um satélite é de 13 dias úteis, substancialmente aquém do Takt time de 10
dias. Neste caso, esforços precisar para foco sobre melhorando ciclo tempo. Sobre o
outro mão, se o histórico média é 30 satélites por ano, então Produção tempo é apenas
328 Cha pte r T e n
8.67 dias por satélite e foco deve ser sobre aumentando vendas e reduzindo recursos
para o nível ditado por cliente demanda.
Analyze Phase 329
Espaguete Gráficos
Atual estado físico fluxo de trabalho é muitas vezes retratado em gráficos de espaguete .
A gráfico de espaguete é a mapa de o caminho levado por a específico produtos como
isto viagens abaixo o valor fluxo em a produção em massa organização, assim
chamado porque o produtos rota tipicamente visual como a placa de espaguete. Para
criar a espaguete gráfico, como o um mostrando sobre o esquerda em Figo. 10.2, diga
a uma pessoa para “ser a parte” e caminhar fisicamente pelo processo como a parte
passaria por isso. Às vezes, uma peça viaja quilômetros na configuração original do
processo. ção, e apenas alguns metros no layout Lean. O layout Lean é mostrado à
direita em Figo. 10.2. O diferença Entre o atual estado layout e o Magro layout é muda
.
Ao estabelecer metas para um processo de estado futuro, muitas vezes é útil
expandir a mente. Uma maneira de se inspirar é identificar o melhor desempenho
absoluto da classe para um especial atividade. Para exemplo, o rápido lubrificante
juntas' alegar para excepcional valor é que eles pode pegar você em e fora em 15
minutos ou menos, muito mais rápido que o canto "serviço estação" qual muitas vezes
pegou a casal de horas ou mais. Mas considerar o poço equipe de a Nascar equipe de
corrida, que pode realizar manutenção em um carro tão rápido (14 segundos ou
menos) que faça com que seu Quickie Lube local pareça estar trabalhando em um
rastreamento. E durante aqueles 14 segundos eles fazer a ótimo negócio mais que
mudar o carro de fluidos. Eles gás isto acima, lavar o janelas, mudar todos de o pneus,
etc. (Figo. 10.3). Lá são muitos Publicados exemplos de Magro conquistas que pode
servir para educar e inspirar. No o CAMI fábrica operado por GM e Suzuki, máquina
mudança tempo era reduzido de 36 horas para 6 minutos.
Boxplots
Um boxplot exibe estatísticas resumidas para um conjunto de distribuições. É uma
trama do século 25, 50º, e 75º percentis, também como valores longe de o resto.
Figura 10.6 shows um anotado esboço de a boxplot. O mais baixo limite de o caixa
é o percentil 25. Tukey refere-se às “dobradiças” dos percentis 25 e 75. Observe que o
50º percentil é o mediana de o geral dados definir, o dia 25 percentil é o mediana de
aqueles valores abaixo o mediana, e o 75º percentil é o mediana de aqueles valores
acima da mediana. A linha horizontal dentro da caixa representa a mediana.
Cinquenta por- cento dos casos estão incluídos dentro da caixa. O comprimento da
caixa corresponde ao inter- quartil gama, que é o diferença entre o 25 e percentis 75.
O boxplot inclui duas categorias de casos com valores periféricos. Casos com val-
ues que são mais que 3 comprimentos de caixa de o superior ou mais baixo borda de o
caixa são chamado Valores extremos. No boxplot, eles são designados com um
asterisco ( ). Casos com valores que estão entre 1,5 e 3 comprimentos de caixa da
borda superior ou inferior da caixa são chamados de outliers e são designados com
um círculo. O maior e o menor observado valores que não são outliers também são
mostrados. Linhas são desenhadas das extremidades da caixa até esses valores. (Essas
linhas às vezes são chamadas de bigodes e o enredo é então chamado de enredo de
caixa e bigodes.)
Apesar de sua simplicidade, o boxplot contém uma quantidade impressionante de
informações. De a mediana você pode determinar o centro tendência ou localização.
334 Cha pte r T e n
Do comprimento
PROCESSO CONJUNTO
Altura PRÉ-
baixa defletor doença AQUECIME
NTO
SOLDA Temp. variando Armazenar
Temp. alto CONTAMINAÇÃO DA
Cabeça desigual
ACENO Contaminado Inconsistente PLACA Soldabilidade
Solda conta.
Excessivo ajustamento Manuseio Contaminado
FLUXO
Aceno desigual
Excessivo cabeça baixa COMPONENTES
Alto
TRANSPORT soprar Substituição intervalo
Plugue instalação Liderar corte & agarrar
ADOR desligado Não ativo Seleção Instalação
VELOCID
ADE
Inconsistente
circuitos também BOARD MÁSCARAS
fechar para lábio chaveta orientação Fita aplicativo
FIXTURE
Localização em placa Direção entre aceno No
multi estágio flutuante solder
dispositivo sobre aceno in hole
elétrico Chão plantar
deforma
Oxidado do
PROJETO DE FABRICAÇÃO
336 C h a Fp IGURA
t e r 10.4
T e n Causa e efeito diagrama.
330 Cha pte r T e n
Causa A
Causa A
Subcausa
Causa B
75º percentil
dia 25 percentil
caixa
abaixo o percentil 25 (outliers)
F IGURA 10.6 anotado boxplot.
Valores com mais de 3 comprimentos
de caixa abaixo o dia 25 percentil
(extremos)
60000
50000
40000
30000
20000
10000
0
N= 22713627413256
Cle Office Security College Exempt MBA Tech
rica trainee officer trainee employee trainee nical
l
Emprego categoria
estatístico Inferência
Esta seção discute o conceito básico de inferência estatística. O leitor também deve
consulte o glossário no Apêndice para obter informações adicionais. Estatística
inferencial pertencem à classe enumerativa dos métodos estatísticos. Todas as
declarações feitas nesta seção ção são válido apenas para estábulo processos, que é,
processos em estatístico ao controle. Embora maioria formulários de Seis Sigma são
analítico, lá são vezes quando enumerativo Estatisticas provar útil. O termo inferência
é definido como (1) o ato ou processo de derivar conclusões de premissas conhecidas
ou assumidas como verdadeiras, ou (2) o ato de raciocinar de conhecimento factual ou
evidência. A estatística inferencial fornece informações que são usado em o processo
de inferência. Como pode ser visto de o definições, inferência envolve dois domínios:
as premissas e a evidência ou conhecimento factual. Além disso, há Existem duas
estruturas conceituais para abordar questões de premissas em inferência: o baseado
em design abordagem baseada em modelos.
Como discutido por Koch e Gillings (1983), a estatístico análise cujo apenas
presumir- ções são aleatório seleção de unidades ou aleatório alocação de unidades
para experimental condi- ções resultados em baseado em design inferências ; ou,
equivalentemente, baseado em randomização inferências. O objetivo é para estrutura
amostragem tal que o amostrado população tem o mesmo
Analyze Phase 333
qui-quadrado
Muitas características encontradas no Seis Sigma têm características normais ou
aproximadamente normais. distribuições. Pode-se mostrar que, nesses casos, a
distribuição das variáveis amostrais nces tem a forma (exceto por uma constante) de
uma distribuição qui-quadrada, simbolizada por 2 . Tabelas ter estive construído
dando abscissa valores para selecionado ordenadas de o cumu- lativo 2 distribuição.
Uma dessas tabelas é dada em Apêndice 4.
O 2 distribuição varia com o quantidade , qual para nosso propósitos é igual
para o amostra tamanho menos 1. Para cada valor de lá é a diferente 2 distribuição.
Equação (10.3) dá o pdf para o 2 .
2 ) / 2
f ( 2) e 2/ 2
( 2) (
334 Cha pte r T e n
(10.3)
2 /2 2
2 !
Analyze Phase 335
0,20
0,15
f (x)
0,10
0,05
0,00
0 246810
y 2
Exemplo
O uso de 2 é ilustrado neste exemplo para encontrar a probabilidade de que a
variância de um amostra de n itens de um universo normal especificado será igual ou
superior a um determinado valor s 2 ; calculamos 2 ( n −1) s 2 / 2 . Agora, vamos
supor que amostramos n = 10 itens de um processo com 2 25 e desejar para
determinar o probabilidade que o amostra variância vai exceder 50. Então
( n 1) s 2 9(50)
25 18
2
excel usa graus de liberdade em vez de que o amostra tamanho em isso é cálculos;
graus de liberdade é o tamanho da amostra menos um, conforme mostrado na caixa
Deg_freedom na Fig. 10.9. O Fórmula resultado aproximar o fundo de o tela dá o
desejado probabilidade.
F IGURA 10.10 Exemplo de encontrando inverso qui-quadrado probabilidade usando Microsoft Excel.
Analyze Phase 337
T do aluno Distribuição
A estatística t é comumente usada para testar hipóteses sobre médias, coeficientes de
regressão cientistas e uma ampla variedade de outras estatísticas usadas na
engenharia de qualidade. “Estudante” era o pseudônimo de WS Gosset, cujo precisar
para quantificar o resultados de pequeno escala experiência- imentos motivado ele
para desenvolver e tabular o probabilidade integrante de o razão qual agora é
conhecido como o t estatística e é mostrado na Eq. (10.4).
x (10.4)
t s / n
F Distribuição
Suponha que temos duas amostras aleatórias retiradas de uma população normal.1
Seja
s 2 o variância da primeira amostra
1
e s 2 a variância da segunda amostra. Os dois sa-
ples não precisam ter o mesmo tamanho de amostra. A estatística F dado por
2
F s1
(10.5)
s22
tem a amostragem distribuição chamado o F distribuição . Lá são dois amostra
variações envolvido e dois conjuntos de graus de liberdade, n 1 1 em o numerador e
n 2 1 em o
Normal distribution
n=
t distribution for
n = 10
t Distribution
for n = 2
1,0
0,8 F(2, 2)
0,6
0,4
0,2
0,0
0 24 6
8 10
F
8
7
6
F(10, 10)
5
4
3
2
1
0
0 8 10
2 4 6
F
F IGURA 10.12 F distribuições.
estimativas de o Significar
Para aleatório amostras com substituição, o amostragem distribuição de x tem a
significar e _ a padrão desvio igual para / n . Para grande amostras o amostragem
distribuição de x é aproximadamente normal e normal mesas pode ser usado para
encontrar o probabilidade que a sam- média geral estará dentro de uma determinada
distância de .
Para exemplo, em 95% de o amostras nós vai observar a significar dentro de 1,96 / n
de n
. Em outro palavras, em 95% de o amostras o intervalo de x 1,96 / para x 1,96 /
n
vai incluir . Esse intervalo é chamado a “95% confiança intervalo para estimando
.” Isto é geralmente mostrado usando símbolos de desigualdade:
F IGURA 10.13 Exemplo de encontrando o confiança intervalo quando sigma é conhecido usando
Microsoft
Excel.
Isto pode-se ver que este intervalo é mais largo do que o obtido para . O t / 2
valor encontrado para 15 df é 2.131 (ver Mesa 3 em o Apêndice), qual é maior que Z /2
1,96 acima.
F IGURA 10.14 Exemplo de encontrando o confiança intervalo quando sigma é desconhecido usando
Microsoft
Excel.
Hipótese teste
estatístico inferência geralmente envolve quatro passos:
x 28 cc
s 6 cc
H 0 : 30 cc (a hipótese nula )
H 1 : não é igual a 30 cc (o hipótese alternativa )
0,05 ( Tipo EU erro ou nível de
significado ) Crítico região: −2.064 t 0
2.064
Estatística de teste: t −1,67.
Como t está dentro da região crítica, não rejeite H 0 e aceite a hipótese de que a
média do lote é de 30 cc para os dados em questão.
s1 2 100
F 2, numerador df 24, denominador df = 9
s22 50
( n 1) s 2 24 (0,0022) 2
2 29.04
2 (0,002) 2
O Apêndice 4 fornece, na coluna 0,05 (uma vez que estamos construindo uma
configuração unilateral intervalo de dence) e o df 24 linhas, o valor crítico 2 36.42.
Desde o nosso calculado valor de 2 for menor que 36,42, usamos a máquina. O leitor
deve reconhecer que todos de esses exercícios envolvido a número de premissas, para
exemplo, que nós "saber" que o melhor máquina tem a padrão desvio de 0,0022. Em
realidade, esse conhecimento deve ser confirmado por um gráfico de controle estável.
Reamostragem (Bootstrapping)
A número de críticas ter estive criado a respeito de o métodos usado para estimativa e
testando hipóteses:
dispersão trama
6.5
6.0
5.5
Weight
5,0
4.5
4.0
70 7580859095
Dias
F IGURA 10.15 Concluído espalhar diagrama. ( De Pyzdek (1990), Pág. 68. Direitos autorais ©
1990 por Qualidade Publicando. )
Manter um olho fora para o efeito de variáveis você não Avalie. Muitas vezes,
um incon- trollado variável vai limpar fora o efeito de seu x variável. Isto é
também possível que uma variável descontrolada estará causando o efeito e
você confundirá o X variável que você está controlando como a verdadeira
causa. Este problema é muito menos provável para ocorrer se você escolher x
níveis no aleatório. Um exemplo de esse é nosso pêssegos. Isto é possível que
qualquer número de variáveis tenha mudado constantemente ao longo do
período de tempo investigado. É possível que essas variáveis, e não a variável
independente capazes, são responsáveis pelo ganho de peso (por exemplo, o
fertilizante foi adicionado periodicamente durante o período de tempo
investigado?).
Cuidado com os dados do “acaso”! Dados de ocorrência são dados que foram
coletados lecionados no passado com um propósito diferente da construção de
um diagrama de dispersão. Como pouco ou nenhum controle foi exercido
sobre variáveis importantes, você pode achar quase nada. Os dados de
ocorrência devem ser usados apenas para obter ideias para investigação,
nunca para chegar a conclusões definitivas. Um problema comum com acaso
dados é que o variável que é verdadeiramente importante é não gravado. Por
exemplo, os registros podem mostrar uma correlação entre o defeito taxa e a
mudança. No entanto, talvez a verdadeira causa dos defeitos seja o ambiente
temperatura, que também muda com a mudança.
Se houver mais de uma fonte possível para a variável dependente, tente usar
diferente plotagem símbolos para cada fonte. Para exemplo, se o Pomar
gerente sabia que alguns pêssegos foram retirados de árvores perto de uma
rodovia movimentada, ele poderia use um símbolo diferente para esses
pêssegos. Ele pode encontrar uma interação, ou seja, talvez os pêssegos das
árvores perto da rodovia tenham uma taxa de crescimento diferente que
aqueles de árvores profundas dentro do pomar.
Embora seja possível fazer análises avançadas sem plotar a dispersão
diagrama, isso geralmente é uma prática ruim. Isso perde o enorme
aprendizado oportunidade fornecidos pela análise gráfica dos dados.
Correlação e Regressão
Análise de correlação (o estudo da força das relações lineares entre as variáveis
habilidades) e análise de regressão (modelar a relação entre um ou mais variáveis
dependentes e uma variável dependente) são atividades de considerável importância
em Seis Sigma. Um problema de regressão considera as distribuições de frequência de
uma variável. capaz quando outro é mantido fixo em cada um dos vários níveis. Um
problema de correlação siders o articulação variação de dois variáveis, nenhum de
qual é restrito por o experimentador. Correlação e regressão análises são projetado
para ajudar o analista no estudo de causa e efeito. Claro, as estatísticas não podem
por si só estabelecer a causa e efeito. Provar causa e efeito requer uma compreensão
científica sólida do situação em questão. Os métodos estatísticos descritos nesta seção
ajudam o analista a realizando esse tarefa.
Linear modelos
Um modelo linear é simplesmente uma expressão de um tipo de associação entre duas
variáveis, x e y . Uma relação linear significa simplesmente que uma mudança de um
determinado tamanho em x produz uma proporcional mudança em y . Os modelos
lineares têm a forma:
346 Cha pte r T e n
y a bx (10.6)
Analyze Phase 347
25
20 Y = 1 + 2X
15
Y
10 2
1
Intercept = 1
0
0 246810
x
onde a e b são constantes. O equação simplesmente diz que quando x mudanças por um
unidade,
y vai mudar por b unidades. Esse relação pode ser mostrando graficamente.
Na Fig. 10.17, a 1 e b = 2. O termo a é chamado de intercepto e b é chamado de
declive. Quando x 0, y é igual ao intercepto, a Fig. 10.17 representa um ajuste linear
perfeito, para Por exemplo, se x for conhecido, podemos determinar y exatamente.
Claro, ajustes perfeitos são virtualmente desconhecido quando real dados são usado.
Em prática nós deve negócio com erro em x e y . Esses problemas são discutidos
abaixo.
Muitos tipos de associações são não lineares, mas podem ser convertidas em
lineares para facilidade de análise, conforme descrito mais adiante neste capítulo.
Ao realizar análises de regressão e correlação, podemos distinguir dois principais
tipos de variáveis. Um tipo nós chamar preditor variáveis ou independente variáveis ; o
outro, variáveis de resposta ou variáveis dependentes . Por variáveis independentes
preditoras, geralmente variáveis médias que podem ser definidas para uma variável
desejada (por exemplo, temperatura do forno) ou outro pegar valores que pode ser
observado mas não controlada (por exemplo, ao ar livre ambiente úmido- idade).
Como a resultado de mudanças que são deliberadamente feito, ou simplesmente
pegar lugar em o previsão Para variáveis, um efeito é transmitido para as variáveis de
resposta (por exemplo, o tamanho do grão de um material composto). Geralmente
estamos interessados em descobrir como as mudanças no pré- ditador variáveis afetar
o valores de o resposta variáveis. Idealmente, nós ter esperança que a pequeno
número de variáveis preditoras “explicará” quase toda a variação na resposta
variáveis.
Em prática, isto é às vezes difícil para empate a claro distinção entre independente
e dependente variáveis. Em muitos casos isto depende sobre o objetivo de o
investigador. Por exemplo, um analista pode tratar a temperatura ambiente como uma
variável preditora no estudo da qualidade da tinta e como variável de resposta em um
estudo de salas limpas tardes. No entanto, o definições acima são útil em
planejamento Seis Sigma estudos.
348 Cha pte r T e n
Outra ideia importante para estudar causa e efeito é a do espaço de dados do
estudar. O espaço de dados de um estudo refere-se à região delimitada pelo intervalo
do inde- pendente variáveis sob estudar. Em em geral, previsões baseado sobre
valores fora o dados
Analyze Phase 349
Point outside
the data space
Data
space
espaço estudado, chamadas extrapolações , são pouco mais que especulações e não
aconselhadas. A Figura 10.18 ilustra o conceito de espaço de dados para duas
variáveis independentes. Defini- ing o dados espaço pode ser bastante complicado
quando grande números de independente variáveis são envolvido.
Embora a análise numérica de dados forneça informações valiosas, ela deve
sempre ser suplementado com gráfico análise como bem. dispersão diagramas são um
muito suplemento útil para análise de regressão e correlação. A Figura 10.19 ilustra o
valor de complementar a análise numérica com diagramas de dispersão.
Em outras palavras, embora os diagramas de dispersão mostrem claramente
quatro processos distintos, a análise estatística não. No Seis Sigma, a análise numérica
sozinha não é suficiente.
y a bx (10.7)
347
348 Cha pte r T e n
Y )
(X i X )(Y (10.8)
ib
2
(XiX )
(10.9)
a Y bX
250
240
230
220
210 Regressão de
peso sobre altura
200
Weight in pounds
190
180
170
160
150
140
130
120 Regressão de
110 altura sobre peso
100
60 7080
Altura em polegadas
Analyze Phase 349
F IGURA 10.21 mínimos quadrados linhas de peso contra altura e altura contra peso.
350 Cha pte r T e n
Esses exemplos mostram como uma única variável independente é usada para
modelar o resposta de a dependente variável. Esse é conhecido como simples linear
regressão . Isto é também pos- capaz de modelar a variável dependente em termos de
duas ou mais variáveis independentes; isso é conhecido como regressão linear múltipla .
O modelo matemático para múltiplos lineares regressão tem adicional termos para o
adicional independente variáveis. Equação (10.10) shows um modelo linear quando
existem duas variáveis independentes.
‸
e a b 1x 1 b 2x 2 (10.10)
Correlação Análise
Como mencionado anteriormente, um problema de correlação considera a variação
conjunta de duas variáveis. possibilidades, nenhuma das quais é restringida pelo
experimentador. Ao contrário da análise de regressão, que considera o efeito da(s)
variável(is) independente(s) sobre uma variável dependente, cor- relação análise é
preocupado com o articulação variação de um independente variável com outro. Em
um problema de correlação, o analista tem duas medidas para cada indivíduo. ual
item em o amostra. Diferente a regressão estudar onde o analista controles o valores
de o x variáveis, correlação estudos geralmente envolver espontâneo variação em o
vari- capazes ser estudado. Correlação métodos para determinando o força de o linear
rela- relacionamento entre duas ou mais variáveis estão entre os métodos estatísticos
mais amplamente aplicados. técnicas. Existem métodos mais avançados para estudar
situações com mais de dois variáveis (por exemplo, análise canônica, análise fatorial,
análise de componentes principais, etc.), no entanto, com exceção da regressão
múltipla, nossa discussão se concentrará no associação linear de duas variáveis ao
mesmo tempo.
Em maioria casos, o medir de correlação usado por analistas é o estatística r , às
vezes referido para como Pearson's momento do produto correlação . Geralmente x e y são
assumiu para ter a distribuição normal bivariada. Sob esta suposição, r é uma
estatística amostral que estima companheiros o população correlação parâmetro r .
Um interpretação de r é baseado sobre o linear regressão modelo descrito mais cedo,
nomeadamente que r 2 é o proporção de o total variabilidade em o y dados qual pode
ser explicado por o linear regressão modelo. O equação para r é:
s xy n xy x y
r (10.12)
s xs y n x2 x2 n y 2 2
y
e, de curso, r 2 é simplesmente o quadrado de r . r é limitado no −1 e 1. Quando o
presumir- ções segurar, o significado de r é testado pelo regressão ANOVA.
A interpretação de r pode se tornar bastante complicada, então os gráficos de
dispersão sempre devem ser usados (consulte acima). Quando o relação entre x e y é
não linear, o “explicativo poder" de r é difícil para interpretar em preciso termos e
deve ser discutido com ótimo Cuidado. Enquanto isto é fácil para ver o valor de muito
alto correlações tal como r 0:99, isto é não então fácil para empate conclusões de
mais baixo valores de r , até quando eles são estatisticamente significativo (ou seja,
eles são significativamente diferente que 0,0). Para exemplo, r 0,5 faz não significar o
dados mostrar metade como muito agrupamento como a perfeito linha reta ajustar.
Em facto, r 0 faz não significar que lá é não relação entre o x e y dados, como Figo.
10.23 shows. Quando r > 0, y tende para aumentar quando x aumenta. Quando r < 0, y
tende para diminuir quando x aumenta.
Embora r = 0, a relação entre x e y é perfeita, embora não linear. No outro extremo,
r = 1, uma “correlação perfeita”, não significa que haja uma causa e efeito relação entre
x e y . Para exemplo, ambos x e y poder ser determinado por uma terceira variável, z .
Em tais situações, z é descrito como uma variável à espreita que “esconde” em o fundo,
desconhecido para o experimentador. à espreita variáveis são atrás alguns de o infame
bobagem associações, tal como o Associação entre professores pagar e licor vendas (a
variável à espreita é a prosperidade geral).
352 Cha pte r T e n
É possível avaliar a associação de x e y removendo o efeito da variável oculta. Esse pode ser feito
usando análise de regressão e computando coeficientes de correlação parciais. Este avançado
procedimento é descrito na maioria dos textos sobre regressão análise.
Analyze Phase 353
11,0
10.5
Y 10,0
9.5
9,0
0,0 0,51,0
1,5 2,0
x
Projetado experimentos
Projetado experimentos jogar um importante papel em qualidade melhoria. Enquanto
o confi- intervalos de confiança e testes de hipóteses discutidos anteriormente são
limitados a comparações entre uma amostra e requisitos ou entre duas amostras, o
experimentos projetados usarão técnicas de ANOVA (análise de variância) para
particionar o variação em a resposta entre o potencial fontes de variação. Esse seção
vai introduzir os conceitos básicos envolvidos e irá contrastar o design
estatisticamente experimente a abordagem “um fator de cada vez” (OFAT) usada
tradicionalmente. Também brevemente discutidos são os conceitos envolvidos nos
métodos de Taguchi, métodos estatísticos nomeado depois deles criador, dr. Genichi
Taguchi.
Terminologia
Muito de o cedo trabalhar sobre o projeto de experimentos envolvido agrícola
estudos. O a linguagem do design experimental ainda reflete essas origens. A área
experimental foi literalmente um pedaço de chão. Um bloco era um pedaço menor de
solo com propriedades. Um lote era ainda menor e servia como a unidade básica do
projeto. Enquanto o trama era plantado, fertilizado e colhido, isto poderia ser dividir
simplesmente por desenho a linha. A tratamento era na verdade um tratamento, como
a aplicação de fertilizante. Infelizmente para o analista Seis Sigma, esses termos ainda
fazem parte da linguagem dos experimentos. O analista deve fazer o seu melhor para
entender a experiência de melhoria de qualidade usando estes termos. Natrella (1963)
recomenda a seguindo:
Experimental área pode ser pensamento de como o escopo de o planejado
experimentar. Para nós, a bloquear pode ser a grupo de resultados de a especial
operador, ou de a especial máquina, ou em um determinado dia - qualquer
agrupamento natural planejado que deve servir para fazer resultados de um bloquear
mais parecido que resultados de diferente blocos. Para nós, a tratamento é o fator que
está sendo investigado (material, condição ambiental, etc.) em um único fator tor
experimentar. Em fatorial experimentos (onde diversos variáveis são ser investigado
ao mesmo tempo) falamos de uma combinação de tratamento e queremos dizer o
prescrito níveis dos fatores a serem aplicados a uma unidade experimental. Para nós,
um rendimento é uma medida resultado e, felizmente, em química às vezes será um
colheita.
Definições
A projetado experimentar é um experimentar onde um ou mais fatores, chamado
independente variáveis que se acredita terem um efeito sobre o resultado
experimental são identificadas e manipulado de acordo com para a predeterminado
plano. Dados coletado de a projetado experiência- eu quis dizer pode ser analisado
estatisticamente para determinar o efeito de o independente variáveis, ou
combinações de mais de uma variável independente. Um plano experimental deve
também incluem disposições para lidar com variáveis estranhas, isto é, variáveis não
identificados explicitamente como variáveis independentes.
Variável de resposta—A variável que está sendo investigada, também chamada de
variável dependente capaz , às vezes chamado simplesmente resposta .
primário variáveis—O controlável variáveis acreditava maioria provável para ter
um efeito. Estes podem ser quantitativos, como temperatura, pressão ou velocidade,
ou podem ser qualitativo tal como vendedor, Produção método, e operador.
Analyze Phase 355
Variáveis de fundo—Variáveis, identificadas pelos projetistas do experimento,
qual poderia ter um efeito mas qualquer não pode ou deve não ser deliberadamente
manipulado
356 Cha pte r T e n
B-Alta
B-Alta Soprar
Soprar
Características do projeto
Bons experimentos não acontecem simplesmente, eles são resultado de um
planejamento cuidadoso. Um bem experimental plano depende (Natrella 1963):
O propósito do experimento
Físico restrições sobre o processo de tirando Medidas
Restrições imposto por limitações de tempo, dinheiro, material, e pessoal
O analista deve explicar claramente por que o experimentar é ser feito, por que o
experimentar mental tratamentos eram selecionado, e como o concluído experimentar
vai concluir o afirmou Objetivos. O experimental plano deve ser em escrita e isto deve
ser endossado por todos chave participantes. O plano vai incluir a declaração de o
Objetivos de o experimentar mento, os tratamentos experimentais a serem aplicados,
o tamanho do experimento, o tempo quadro, e a apresentação discussão de o métodos
para ser usado para analisar o resultados. Dois vigarista- conceitos são de especial
interesse para o Seis Sigma analista: replicação e Randomization.
Replicação — A coleção de mais que um observação para o mesmo definir de
experiência- imental condições. Replicação permite o experimentador para estimativa
experimental erro. Se variação existe quando todos experimental condições são
mantido constante, o causa deve ser algo outro que o variáveis ser controlada por o
experimentador. Experimental erro pode ser estimado sem replicando o inteiro
Analyze Phase 357
experimentar. Se a processo tem estive
358 Cha pte r T e n
tipos de Projeto
Os experimentos podem ser projetados para atender a uma ampla variedade de
objetivos experimentais. Um pouco de o mais comum tipos de projetos experimentais
são definidos aqui.
Modelo de efeitos fixos: Um modelo experimental onde todos os níveis de fator
possíveis são estudado. Por exemplo, se houver três materiais diferentes, todos os três
serão incluídos no experimentar.
Modelo de efeitos aleatórios: Um modelo experimental onde os níveis de fatores
avaliados comeu por o experimentar representar a amostra de todos possível níveis.
Para exemplo, se nós ter três materiais diferentes, mas use apenas dois materiais no
experimentar.
Misturado modelo: Um modelo experimental com ambos fixos e efeitos aleatórios.
Design completamente aleatório: Um plano experimental onde a ordem em que o
experimento é realizado é completamente aleatório, por exemplo,
Desde cada material parece exatamente uma vez por limpeza tanque carregar nós
dizer o projeto é equilibrado . O material totais ou médias pode ser comparado
diretamente. O leitor deve ser consciente que estatístico desenhos existir para lidar
mais complicado “desequilibrado desenhos”.
quadrado latino desenhos: Projetos onde cada tratamento parece uma vez e
apenas uma vez em cada linha e coluna. A quadrado latino plano é útil quando isto é
necessário ou desejável para permitir para dois específico fontes de não
homogeneidade em o condições afetando teste resultados. Tais projetos foram
originalmente aplicados em experimentos agrícolas quando os dois fontes de não
homogeneidade foram as duas direções no campo e o “quadrado” foi literalmente um
pedaço quadrado de chão. Seu uso foi estendido para muitas outras aplicações ções
onde há duas fontes de não homogeneidade que podem afetar Resultados para
exemplo, máquinas, posições, operadores, corre, e dias. A terceiro variável é então
associado com os outros dois de uma forma prescrita. O uso de quadrados latinos é
restrito por duas condições:
Um fator ANOVA
O exemplo a seguir será usado para ilustrar a interpretação de um único fator análise
de variação. Com a ampla disponibilidade de computadores, poucas pessoas
realmente ally executar tais cálculos complexos à mão. A análise abaixo foi feita
usando o Microsoft Excel. Métodos estatísticos comumente usados, como regressão e
ANOVA estão incluídos na maioria planilhas de ponta.
Os resultados codificados na Tabela 10.3 foram obtidos a partir de um único fator,
completamente randômico. experimento domizado, no qual as saídas de produção de
três máquinas (A, B e C) eram para ser comparado.
Posição número
Corr (1) (2) (3) (4)
er
1 A B C D
2 B C D A
3 C D A B
Analyze Phase 361
4 D A B C
A B C
4 2 −3
8 0 1
5 1 −2
7 2 −1
6 4 0
RESUMO
Grupos Contar Soma Média variância
A 5 30.000 6.000 2.500
B 5 9.000 1.800 2.200
C 5 −5.000 −1.000 2.500
ANOVA
Fonte de Variação SS df EM F P -valor F crítico
Entre grupos 124.133 2 62.067 25.861 0,000 3.885
Dentro de grupos 28.800 12 2.400
Total 152.933 14
Procedimento ANOVA
ANOVA produto como segue:
A tabela ANOVA mostra que, para esses dados, o F calculado é 62,067/2,4 = 25.861
e F crítico em 0,05 com numerador df 2 e denominador df = 12 é 3,885. Desde
25,861 > 3,885 rejeitamos a hipótese nula e concluímos que as máquinas produzem
diferente resultados. Observação que todos nós saber é que no ao menos o dois
extremo máquinas (A e C) são diferente. O ANOVA não _ dizer nós se A e B ou B e C
são significativamente dif- diferente. Existem métodos que podem fazer essa
determinação, como os contrastes . O o leitor é encaminhado para um texto sobre
planejamento de experimentos, por exemplo, Montgomery (1984) para informações
adicionais.
Total N Soma de
quadrados
Tratamento A 4, 8, 5, 7, 6 30 5 190
Tratamento B 2, 0, 1, 2, 4 9 5 25
Tratamento C −3, 1, −2, −1, 0 −5 5 15
Totais 34 15 230
(34) 2
Total soma de quadrado 230 152.933
15
Soma de quadrados de erro soma total dos quadrados − soma dos quadrados do tratamento
152.933 − 124.133 28.8
Referindo-se para o crítico valor é na verdade desnecessário; o P -valor de 0,000 indica que o
364 Cha pte r T e n
probabilidade de obtendo um O valor F tão grande quanto o calculado é menor que 1 em 1.000.
Analyze Phase 365
Microsoft Excel. Para detalhado matemático fundo sobre esses métodos, o leitor é
referiu-se a qualquer um dos muitos bons livros sobre o assunto (por exemplo, Box et
al., 1978; Hicks, 1993; Montgomery, 1996). CORÇA PC, a cheio de recursos comercial
Programas para projeto e analis- sis de experimentos está disponível em
http://www.qualityamerica.com. Uma análise estatística O pacote shareware ysis para
sistemas operacionais Windows pode ser baixado em
http://www.dagonet.com/scalc.htm. MINITAB inclui CORÇA capacidades.
RESUMO SAÍDA
ANOVA
Fonte de
variação SS df EM F valor P F crítico
Linhas 68 3 22.666667 8.242424 0,015043179 4.757055
colunas 122.1666667 2 61.083333 22.21212 0,001684751 5.143249
Erro 16.5 6 2,75
Total 206.6666667 11
MESA _ 10.6 Limpeza Experimentar Bidirecional ANOVA Saída de Microsoft excel (Dois Fatores sem
Replicação)
RESUMO SAÍDA
Alto pressão Med pressão Baixo pressão Total
Alto temperatura
Contar 5 5 5 15
Soma 172 148 110 430
Média 34.4 29.6 22 28.66667
variância 50,8 3.3 11.5 46.66667
Med temperatura
Contar 5 5 5 15
Soma 165 117 125 407
Média 33 23.4 25 27.13333
variância 11.5 117.3 15 59.98095
Baixo temperatura
Contar 5 5 5 15
Soma 177 119 111 407
Média 35.4 23.8 22.2 27.13333
variância 11.3 5.7 4.7 43.26667
Total
Contar 15 15 15
Soma 514 384 346
Média 34.26666667 25.6 23.06666667
variância 22.06666667 44.68571429 10.92380952
ANOVA
Fonte de
variação SS df EM F valor P F crítico
Amostra 23.5111111 2 11.7555556 0,45781 0,6363 3.259444
colunas 1034.84444 2 517.422222 20.1506 1.34E-06 3.259444
Interação 139.555556 4 34.8888889 1.35872 0,267501 2.633534
Dentro de 924,4 36 25.6777778
Total 2122.31111 44
MESA _ 10.8 Fotoresistente Experimentar Bidirecional ANOVA Saída de Microsoft excel (Dois fatores com
Replicação)
EU IA A B C
(1) − − −
a − −
b − −
ab −
c − −
ac −
bc −
abc
Observe que a tabela começa com todos os fatores em seu nível baixo. Em seguida,
o primeiro fator é alto e todos os outros são baixos. Quando um fator é alto, ele é
mostrado na coluna ID, caso contrário sábio não é. Por exemplo, sempre que a
aparece, indica que o fator A está em seu máximo nível. Para completo o mesa você
simplesmente observação que como cada fator é adicionado para o mesa isto é
"multiplicado" por cada precedente linha. Por isso, quando b é adicionado isto é
multiplicado por um , dando o linha ab . Quando c é adicionado isto é multiplicado
por, em ordem, um , b , e ab , dando o permanecer- linhas na tabela. (Como exercício, o
leitor deve adicionar um quarto fator D ao tabela acima. Dica: o resultado será uma
tabela com mais oito linhas.) Depois que os dados estiverem padrão ordem, adicionar
a coluna para o dados e um adicional coluna para cada variável, para Por exemplo,
para nossas três variáveis, adicionaremos quatro colunas.
EU IA A B C Dados 1 2 3
(1) − − −
a − −
b − −
ab −
c − −
ac −
bc −
364 Cha pte r T e n
abc
Analyze Phase 365
EU IA A B C Dados 1 2 3
(1) − − − 2 7 21 17
a − − 5 28 38 15
b − 15 29 5 55
ab − 13 9 10 1
c − − 12 3 35 59
e − 17 2 20 5
bc − 2 5 1 15
abc 7 5 0 1
EU IA 1º 2º Soma 1 2 3 Efeito df SS EM F
Razão
1 22 19 41 86 167 288 18 média
a 21 24 45 81 121 20 2.5 1 25h00 25h00 3,64
b 20 18 38 58 9 0 0 1 0,00 0,00 0,00
ab 21 22 43 63 11 4 0,5 1 1,00 1,00 0,15
c 12 15 27 4 5 46 5,75 1 132,25 132,25 19.24
ac 12 19 31 5 5 2 0,25 1 0,25 0,25 0,04
bc 13 15 28 4 1 10 1.25 1 6.25 6.25 0,91
abc 20 15 35 7 3 2 0,25 1 0,25 0,25 0,04
Erro 8 55,00 6.88
Total 141 147 15 220,00
366 Cha pte r T e n
Esta informação foi usada para criar um projeto experimental usando um software
Analyze Phase 367
estatístico louça pacote. Lá são muitos pacotes sobre o mercado que executar
semelhante análises para o um mostrado aqui.
368 Cha pte r T e n
Correr A B C D E F G H Resposta
1 − − − − 65
2 − − − − 85
3 − − − − 58
4 − − − − 57
5 − − − − − − − − 63
6 75
7 − − − − 77
8 − − − − 60
9 − − − − 67
10 − − − − 56
11 − − − − 63
12 − − − − 81
13 − − − − 73
14 − − − − 87
15 − − − − 75
16 − − − − 84
Desde esse é apenas para ser a triagem experimentar, o equipe era não interessado
em obtivermos- estimativas de interações de fatores. O foco era identificar efeitos
principais importantes. O Programas permite seleção de entre diversos projetos. O
Preto Cinto decidiu sobre o projeto que estimaria os principais efeitos com o menor
número de testes unidades. Esse projeto envolvido testando 16 unidades. O dados
matriz produzido por o computador é mostrado na Tabela 10.9. A ordem de execução
foi aleatória pelo computador. Se o experimentar não pode ser conduzido em que
especial ordem, o computador Programas seria permitir que os dados sejam
executados em blocos e ajustar a análise de acordo. O programa também nos diz que o
projeto é de resolução IV, o que significa que os principais efeitos são não confundidos
entre si ou quaisquer interações de dois fatores.
Na Tabela 10.9 o “–” indica que a variável é executada em seu nível baixo,
enquanto um “ ” sinal indica que ele deve ser executado em seu nível alto. Por
exemplo, a unidade para a execução 16 foi processado do seguinte modo:
Pré-cozimento Não
pré-aquecer tempo 10 segundos
pré-aquecer temperatura 200 F
Distância de pré-aquecer elemento para quadro superfície 50 cm
Velocidade da linha 3 fpm
Solda temperatura 495 F
Analyze Phase 369
1,0
0,5
Normal score
0,0
–0,5
–1,0
–1,5
–1 012
Padronizado residual
Tecnicamente, a Poisson modelo seria ser o correto escolha aqui. No entanto, usar de a normal
modelo, qual o análise assume, é razoavelmente preciso para defeito conta de esse magnitude. O
equipe também avaliado o variação, mais especificamente, o registro de o variância. O variações no
cada fator combinação fez não diferir significativamente e não são mostrados aqui.
370 Cha pte r T e n
1,5 B
1,0
0,5
Normal score
0,0
–0,5
–1,0
–1,5 D
–15 –10–505
Padronizado efeito
A equipe se reuniu para discutir esses resultados. Eles decidiram definir todos os
fatores que não foram encontrado estatisticamente significativo para os níveis que
custam menos para operar, e fac- tores B e D no deles pontos médios. O processo
seria ser monitorou no esses configurações para um tempo para determinar se os
resultados eram semelhantes ao que a equipe esperava com base em a análise
experimental. Enquanto isso era feito, outra série de experimentos ser planejado para
explorar ainda mais os efeitos significativos descobertos pela experiência de triagem
eu quis dizer.
Com base no experimento de triagem, o modelo linear para estimar a taxa de
defeitos era encontrado de os coeficientes em Tabela 10.10 a ser
Exemplo
Considere um teste ANOVA unidirecional da hipótese de que quatro populações têm
igual significa. A amostra de n 5 é levado de cada população cujo histórico padrão
devi- ação é 2.0. Se estivermos interessados em detectar uma diferença de 3 unidades
nas médias, o o software pode estimar o poder do teste depois de completar o poder e
o tamanho da amostra para ANOVA unidirecional diálogo caixa como:
Número de níveis: 4
Tamanhos de amostra: 5
valores de o máximo diferença entre significa: 3
Padrão desvio: 2
Significado nível (no Diálogo de opções) : 0,05
Você tem dados discretos, mas precisa de dados contínuos Em alguns casos, no entanto,
o tipo de dados assuntos. Para exemplo, se discreto dados são traçado sobre ao controle
gráficos pretendido para continua- dados, os cálculos do limite de controle estarão
incorretos. Executar testes e outros não paramétrico testes vai também ser afetado por
esse. O problema de “discretizado” dados é muitas vezes causado pelo
arredondamento dos dados para poucas casas decimais quando eles são registrados.
Esse o arredondamento pode ser causado por humanos ou pode ser um programa de
computador que não está gravando ou exibindo dígitos suficientes. A solução simples
é gravar mais dígitos. O problema pode ser causada por um sistema de medição
inadequado. Esta situação pode ser identificada por uma análise do sistema de
medição (ver Cap. 9). O problema pode ser facilmente detectado por criando um
gráfico de pontos dos dados.
Você Ter Contínuo Dados Mas Precisar Discreto Dados vamos dizer você querer para
determinar se a experiência do operador tem um impacto sobre os defeitos. Uma
maneira de analisar isso é usar um técnica como análise de regressão para regredir X
anos de experiência em Y defeitos. Outra seria realizar uma análise qui-quadrado
dos defeitos por nível de experiência. Para fazer esse você precisar para colocar o
operadores em discreto categorias, então analisar o defeitos em cada categoria. Isso
pode ser feito “discretizando” a variável de experiência. Para exemplo, você pode
criar o seguinte categorias discretas:
Independência Suposição
A independência estatística significa que dois valores não estão relacionados entre si.
em outro palavras, sabendo o que um valor fornece não Informação como para o que
o outro valor é. Se você jogar dois dados e eu disser que um deles é um 4, essa
informação não ajudá-lo a prever o valor do outro dado. Muitas técnicas estatísticas
assumem que os dados são independentes. Por exemplo, se um modelo de regressão
ajusta os dados adequadamente, então o resíduos vai ser independente. Ao controle
gráficos presumir que o Individual os valores dos dados são independentes; ou seja,
saber o diâmetro do pistão 100 não ajuda me prediz o diâmetro do pistão 101, nem me
diz qual o diâmetro do pistão 99 foi. Se eu não tiver independência, os resultados da
minha análise estarão errados. Eu vou acreditam que o modelo se ajusta aos dados
quando isso não acontece. vou adulterar o controlado processos.
A independência pode ser testada de várias maneiras. Se os dados estiverem
normais (testando o normalidade suposição é discutido abaixo) então o correr testes
descrito para ao controle gráficos pode ser usado.
A espalhar trama pode também ser usado. Deixar y Xt - 1 e trama x contra Y. _
Você vai ver aleatório padrões se os dados forem independentes. Softwares como o
Minitab oferecem várias formas de examinando a independência em dados de séries
temporais. Nota: falta de independência nas séries temporais dados é chamado
autocorrelação .
Se você não tem independência, você tem várias opções. Em muitos casos, o
melhor curso de ação é identificar o motivo pelo qual os dados não são independentes
e corrigir o causa subjacente. Se os resíduos não forem independentes, adicione
termos ao modelo. Se o processo está flutuando, adicione ajustes de compensação.
Se corrigir a causa raiz não for uma opção viável, uma alternativa é usar uma
estatística técnica que responde pela falta de independência. Por exemplo, o controle
EWMA gráfico ou a tempo Series análise que pode modelo autocorrelacionado dados.
Outro é para modificar o técnica para trabalhar com seu autocorrelacionado dados, tal
como usando inclinado ao controle lim- está na carta de controle. Se os dados forem
cíclicos, você pode criar dados não correlacionados usando um amostragem intervalo
igual para o ciclo comprimento. Para exemplo, você pode criar a ao controle gráfico
comparando o desempenho nas manhãs de segunda-feira.
Normalidade Suposição
estatístico técnicas tal como testes t , testes Z , ANOVA, e muitos outros presumir que o
dados são no ao menos aproximadamente normal. Esse suposição é facilmente testado
usando Programas. Lá são dois abordagens para testar normalidade: gráfica e
estatístico.
F IGURA 10.28 Histogramas com normal curvas para diferente amostra tamanhos.
No entanto, isto tem o desvantagem de ser não gráfico. Esse viola o três regras de
dados análise:
1. Trama os dados
2. Trama os dados
3. Trama os dados
O que para Fazer Se o Dados não são Normal Quando dados são não normal, o seguindo
passos são geralmente perseguido:
para exemplo, e o curva encaixa o dados bem lá, então Continuar para usar o
nem- mal modelo apesar de o facto que o P -valor é menos que 0,05. Ou se o
modelo encaixa o meio de o distribuição bem e isso é seu foco, ir com isto. Da
mesma maneira, se você tem uma amostra muito grande, você pode obter
valores- P maiores que 0,05 mesmo embora o modelo pareça se encaixar bem
em todos os lugares . Eu trabalho com clientes que analise rotineiramente
conjuntos de dados de 100.000 registros. Amostras deste tamanho
sinalizarão funcionalmente e economicamente sem importância Partidas de
normalidade como “estatisticamente significativo”, mas não vale a pena gastar
tempo ou dinheiro para fazer qualquer coisa sobre isso.
Transformar os dados — Muitas vezes é possível tornar os dados normais
executando uma operação matemática sobre os dados. Por exemplo, se a
distribuição de dados tiver caudas muito longas para o lado alto, tirar o
logaritmo geralmente cria dados que são distribuído normalmente. O recurso
de gráfico de controle do Minitab oferece o padrão Box-Cox malizando poder
transformação que funciona com muitos dados distribuições encontrado em
Seis Sigma trabalhar. O desvantagem para transformando é que dados ter
para ser devolvida para o original medição escala antes ser apresentado para
não- Pessoal técnico. Algumas estatísticas não podem ser retornadas
diretamente ao seu original unidades; para exemplo, se você usar o registro
transformar então você não pode encontrar o significar de o original dados
por tirando o inverso registro de o significar de o transformado dados.
Usar médias — As médias são um tipo especial de transformação porque as
médias de subgrupos sempre tratar para ser normalmente distribuído, até se
o subjacente
Analyze Phase 37
7
dados não são. Às vezes, os tamanhos dos subgrupos necessários para atingir
a normalidade podem ser bem pequeno.
Ajustar outro estatístico distribuição —A normal distribuição não é o apenas jogo
em cidade. Tente ajustar outras curvas aos dados, como a Weibull ou a
exponencial. cial. Maioria Estatisticas pacotes, tal como Minitab, ter o
habilidade para fazer esse. Se você ter a jeito para programação planilhas,
você pode usar do Excel solucionador adicionar em para avaliar o ajuste de
várias distribuições.
Usar a não paramétrico técnica —Ali são estatístico métodos, chamado não-
métodos paramétricos, que não fazem nenhuma suposição sobre o subjacente
distribuição dos dados. Em vez de avaliar as diferenças de parâmetros como
média ou variância, métodos não paramétricos usam outras comparações. Por
exemplo, se as observações forem pareadas, elas podem ser comparadas
diretamente com veja se o depois é diferente do antes. Ou o método pode
examinar o padrão de pontos acima e abaixo o mediana para ver se o antes e
depois val- ues são espalhados aleatoriamente nas duas regiões. Ou as
classificações podem ser analisadas. Não paramétrico estatístico métodos são
discutido mais tarde em esse capítulo.
1
teste de Bartlett
Teste estatística:
2
6.233
Valor P : 0,182
4 de Levene teste
0,5 1.01.52.0
12
10
Y6
0
0 1234
x
x x a b
Y a bX x
Y
Y ab x registro Y x registro registro b
a
Y você bx registro Y x registro b registro e
a
Y aX b registro Y registro x registro b
a
Y a bX n
Y xn a b
onde n é conhecido
Causa de Rejeição
Areia Corrida Mudan Derrub Corebreak Quebrad Outro Total
errada ça ar o
Semana 1 97 8 18 8 23 21 5 180
Semana 2 120 15 12 13 21 17 15 213
Semana 3 82 4 0 12 38 25 19 180
Total 299 27 30 33 82 63 39 573
Frequência esperado =
linha soma coluna soma
fe = geral soma
Para por exemplo, para a semana 1, o frequência esperada de rejeitos de areia é (180
299)/573
93,93. O tabela abaixo mostra o frequência esperada para o restante do células.
x2
(Frequência esperado Frequência observado) 2
sobre todos células Frequência esperado
Em seguida, escolha um valor para ; vamos usar 0,10 para este exemplo. Os
graus de liberdade para o teste X 2 são ( k − 1)( m − 1) 12. Referindo-se ao Apêndice 4,
382 Cha pte r T e n
encontramos a crítica cal valor de X 2 18h55 para nosso valores. Desde nosso
calculado valor de X 2 excede o crítico valor, nós concluir que o semanas diferir com
respeito para proporções de vários tipos de defeituosos.
Analyze Phase 38
3
Variável de resposta
e Regressão Número de
Logística Tipo Categorias de Características de Exemplos
resposta resposta
Binário 2 Dois níveis Vai/não vai,
passar/ falhar,
compra/não
compra comprar,
sim não,
recupera/morre,
masculino feminino
Ordinal 3 ou mais Natural encomenda Insatisfeito/
de o níveis neutro/satisfeito,
nenhum/leve/grave,
fino/médio/grosso
Nominal 3 ou mais Não natural encomenda Preto branco/
de o níveis Hispânico, preto
cabelo/ cabelo
castanho/loiro
cabelo,
ensolarado/chuvoso
/ nublado
logística Regressão
A regressão logística, como a regressão de mínimos quadrados, investiga a relação
entre uma variável de resposta e um ou mais preditores. No entanto, a regressão
linear é usada quando as variáveis de resposta são contínuas, enquanto técnicas de
regressão logística são usadas com variáveis de resposta categóricas. Veremos três
tipos diferentes de logística regressão, baseado sobre o tipo de resposta variável ser
analisado (ver Mesa 10.12).
O básico ideia atrás logística regressão é muito simples, como mostrando em Figo.
10.32. x é uma “causa” hipotética de uma resposta. X pode ser contínuo ou categórico.
Y é um evento que nós são interessado em e isto deve ser categórico. a modelo pode
ter múltiplo X , mas apenas um resposta variável. Para exemplo, Y poder ser se a
perspectiva comprado a revista ou não, e Xs poder ser o idade e corrida de o prospect.
O modelo seria produzir a predição de o probabilidade de a revista ser comprado
baseado sobre o idade
Proportion responding
384 Cha pte r T e n
x
O logit
Figura 10.32 ilustra a direto modelagem de o proporção respondendo contra a
previsão tor variável. O problema é que, no mundo real, o padrão de resposta pode
assumir um largo variedade de formulários e a simples modelo de o proporção
respondendo como a função de preditores não é flexível suficiente para pegar sobre
todos de o vários formas. O solução para esse é usar uma função matemática,
chamada logit, que permite desenvolver modelos versáteis. A fórmula para o logit é
mostrada na Eq. (10.12). Embora pareça intimidante, é realmente muito semelhante à
equação de uma regressão linear. Notar que e é criado para a poder que é apenas a
linear função de o Xs. Em facto, o poder prazo é apenas o múltiplo linear regressão
modelo. No entanto, onde linear regressão pode apenas modelo linha reta funções, o
Logit leva sobre a largo variedade de curva formas como o estimativas dos
parâmetros variam. A Figura 10.33 mostra curvas logit para alguns valores de , com
mantido constante em 0 (alterando resultaria ao deslocar as curvas para a
esquerda ou para a direita).
1x1 x 2⋯
P(x) e 2
(10.13)
n xn
1x1 x 2
1e 2
⋯ n xn
Chances Índices
Quando o link logit é usado (é o padrão na maioria dos pacotes de software, incluindo
Minitab), a regressão logística avalia as chances de algum evento de interesse
acontecer contra o chances de isto não acontecendo. Esse é feito através da chances . _
"Chances" e probabilidade laços são semelhante, mas não idêntico. Em a padrão área
coberta de cartões lá são 13 diferente cartão
0,6
P(x)
0,5
0,4
0,3
0,2
0,1
0
–10 –8 –6 –4 –20 2 4 68
x
386 Cha pte r T e n
valores, ás, rei, rainha, e então sobre. O chances de a aleatoriamente selecionado cartão
ser um ás é 12 para 1, ou seja, há 12 nonaces para 1 ace. A probabilidade de selecionar
um ás é de 1 em 13, ou seja, existem 13 escolhas das quais 1 é um ás. Na maioria das
análises estatísticas usadas em Six Sigma trabalhar nós usar probabilidades, mas
logística regressão usa chances para isso é cálculos.
Considerar a Seis Sigma projeto envolvendo a Rede site. O meta de o projeto é
para fazer mais fácil para os clientes encontrarem o que procuram. Uma pesquisa foi
aplicada a pessoas Quem visitado o Rede site e o resultados em Mesa 10.13 eram
obtido. O Preto Cinto quer para saber se o projeto mudar tive um impacto sobre o
clientes habilidade para encontrar uma resposta à sua pergunta.
A razão de chances para esses dados é calculada da seguinte forma:
Pode-se ver que as chances do cliente encontrar a resposta parecem ser de 91%.
melhor com o novo design do que com o antigo. No entanto, para interpretar este
resultado corretamente devemos saber se essa melhora é estatisticamente significativa.
Podemos determinar- meu isso usando regressão logística binária.
Observação: outro caminho para analisar esses dados é para usar qui-quadrado.
logística regressão, em Adição para fornecendo a preditivo modelo, vai às vezes
trabalhar quando qui-quadrado analis- irmã não vai.
Na linha WhenCode, temos três colunas adicionais: odds ratio, 95% confi- limite
inferior do intervalo de confiança e limite superior do intervalo de confiança de 95%.
A razão de chances é o 1,91 que calculamos diretamente anteriormente. O intervalo de
confiança de 95% na razão de chances vai de 1,07 a 3,40. Se a mudança de projeto não
fez diferença, o valor esperado de a razão de chances seria 1,00. Como o intervalo não
inclui 1,00, concluímos (em 95% confiança) que o projeto mudar feito a diferença. Esse
conclusão é confirmado pelo valor P de 0,029 para o teste de que todas as inclinações
são iguais (o teste de inclinações iguais é equivalente para testar a hipótese nula de
que a mudança de design não teve efeito).
Se tivéssemos um termo de covariável (um X em uma escala contínua), o Minitab
teria per- formado a bondade de ajustar teste por dividindo o dados em 10 grupos e
realizando a chi- quadrado análise da tabela resultante.
Em seguida, o Minitab compara as probabilidades previstas com as respostas
reais. O os dados são comparados aos pares, preditos: encontrados e não encontrados
versus reais: encontrados e não encontrado. A par é “concordante” se real e categorias
previstas são o mesmo, “dis- cordante” se eles são diferente, e "ligado" de outra forma.
Mesa 10.14 shows o classificações para o nosso exemplo.
O total número de encontrado vezes não encontrado pares é 76 215 16340. O
total num- número de pares concordantes é 169 26 4394. O número total de pares
discordantes é 50 46 2300. Os restantes 16340 − 4394 − 2300 9646 pares são
empates. O modelo corretamente discriminado entre e classificado o concordante
pares, ou 27%. Isto incorretamente classi- satisfeito os pares discordantes, ou 14%.
Somers' D, Goodman-Kruskal Gama, e Kendall's tau-a são resumos de o mesa
de concordante e discordante pares. O números ter o mesmo numerador: o número
de concordante pares menos o número de discordante pares. Os denominadores
são o número total de pares com D de Somers, o número total de pares, exceto
empates com Goodman-Kruskal Gamma, e o número de todos os possíveis
observação pares para Kendall's Tau-a. Esses medidas maioria provável mentira
entre 0 e 1 onde valores maiores indicam uma melhor capacidade preditiva do
modelo. Os três as medidas resumidas de ajuste variam entre 0,05 e 0,31. Isso não é
especialmente impressionante sive, mas o P -valor e o concordância/discordância
análise indicar que isso é melhorar que aleatoriamente adivinhação.
Conclusão
A principal conclusão é encontrada na razão de chances e no valor- P . O novo design
é melhor que o original projeto. O medíocre previsibilidade de o modelo indica que
há mais para encontrando o correto responder que o diferente rede projetos. Em esse
caso isto seria provavelmente pagar para continuar olhando para caminhos para
melhorar o processo, apenas 36% de o cus- tomers encontre o correto resposta (um
processo sigma que é menos que zero!).
Clientes eram pediu que escolha um de a seguir respostas para cada pergunta:
O resultados são mostrando em Mesa 10.15. Mesa 10.16 presentes o primeiro papel
de o MinitabName planilha para os dados - observe que esta é a mesma informação
da Tabela 10.15, apenas reorganizado. Lá é um linha para cada combinação de
respostas para Q3 e Q17.
do Minitab diálogo caixa para esse exemplo é mostrando em Figo. 10.36. O
armazenar diálogo caixa permite que você diga ao Minitab para calcular as
probabilidades para as várias respostas. eu também recomendar dizendo
MinitabName para calcular o número de ocorrências então que você pode cruzar
verifique suas frequências com as do Minitab para garantir que você tenha os dados
corretos formatar. Quando você dizer MinitabName para loja resultados, o Informação
é colocada em novo colunas
Frequência
Mesa
Q17 Resposta
Q3 RESPOSTA 1 2 3 4 5
1 7 6 7 12 9
2 5 2 8 18 3
3 4 2 20 42 10
4 7 5 24 231 119
384 Cha pte r T e n
5 0 2 14 136 303
em sua planilha ativa, não na janela da sessão. Observe as entradas de dados para o
resposta, frequência, modelo, e fatores.
do Minitab sessão janela saída é mostrando em Figo. 10.37. Para simplicidade
apenas papel de o saída é mostrando. O qualidade de ajuste Estatisticas (concordância,
discordância, etc) ter estive omitido, mas o interpretação é o mesmo como para binário
logística regressão. MinitabName precisa para designar um dos valores de resposta
como o evento de referência. A menos que você especificamente escolher a referência
evento, MinitabName define o referência evento baseado sobre o dados tipo:
0,6
0,5
Probability
0,4
0,3
0,2
0,1
0
Q17 = 1 Q17 = 2 Q17 = 3T17 = 4T17 = 5
Geral Resposta Sat
Q3 = 1 Q3 = 2 Q3 = 3 Q3 = 4 Q3 = 5
das categorias de resposta. Também pode ser usado para avaliar se a linha paralela
suposição de logística ordinal regressão é razoável.
T
objetivo primário da fase de Melhoria ou Projeto do DMAIC/DMADV é
implementar o novo sistema. A primeira consideração é priorizar os vários
oportunidades, se mais que um proposta existe. Uma vez a preferido
abordagem tem
determinado, o novo projeto de processo ou produto é definido e as configurações
ideais estabelecida. Esse novo projeto pode então ser avaliado para riscos e potencial
falha modos. Se qualquer de esses passos exigir mudanças em anterior premissas,
então passos deve ser repetido para avaliar adequadamente a nova proposta.
393
394 Cha pte r Ele v e n
F IGURA 11.1 Matriz de categorias para pares comparações. ( Criado usando Especialista Escolha
2000 Programas, www.expertchoice.com .
para ele, ou se os dois atributos são de igual importância. Na Fig. 11.1 este cliente
indica que “fácil de aprender” é moderadamente a fortemente preferido em relação a
“fácil de usar rapidamente depois de aprender” e o software colocou um 4 na célula
comparando esses dois atributos. (O escala vai de −9 para 9, com "igual" ser
identificado como um 1.) Os atributos restantes são comparados um a um,
resultando na matriz mostrando em Figo. 11.2.
O sombreado bares sobre o atributo rótulos fornecer a visual mostrar de o
rela- importância de cada item principal para o cliente. Numericamente, a importância
pesos são:
Esses relativo importância pesos pode ser usado em QFD e DFSS como bem como
em o AHP processos que nós são ilustrando aqui. Em nosso alocação de esforço, nós vai
querer para enfatizar aqueles atributos com alto importância pesos sobre aqueles com
mais baixo pesos.
Embora a análise seja mais fácil com um software especial, você pode obter uma boa aproximação
usando um planilha. Ver Apêndice 17 para detalhes.
The Impr o v e / D e s i g n Phase 397
grande impacto no cliente. “Fácil de usar rapidamente depois que aprendi” tem um
impacto baixo. "Fácil para aprender" é dominado por um item: o do utilizador
400 Cha pte r Ele v e n
interface. Esses pesos vai ser usado para avaliar diferentes conceitos de atualização
propostos. Cada conceito será avaliado em cada item de subcategoria e atribuído um
valor dependendo de quão bem ele aborda o item. Os valores serão multiplicados
pelos pesos globais para chegar a uma pontuação geral para o conceito. As pontuações
podem ser ordenadas para fornecer uma lista que você, o proprietário do processo,
pode usar ao tomar decisões de financiamento. Ou, de forma mais proativa, as
informações podem ser usado para desenvolver um conceito que enfatiza as
demandas mais importantes do cliente. A Tabela 11.2 mostra parte de uma tabela que
avalia conceitos usando os pesos globais. O classificação numérica usada na tabela é 0
sem impacto, 1 pequeno impacto, 3 moderado impacto, 5 alto impacto. Como
os pesos globais soma 1 (100%), o mais alto possível
398
The Impr o v e / D e s i g n Phase 401
Razoavelme
Plano Ótimo, nte Preço Funci
Cliente Download Livre Livre Bom Avançado ona
Impacto Intuitivo On- Download Investiment Hotlinks Internet Autoajuda Document Técnico Bem Interativo
Item Pontuaçã Interface line Declarações o para Planilha Patches Técnico o- tação Apoiar no Tutorial
o Pagam Informação Assistênci 56K
ento a
de
contas
Peso Global 18,0% 15,5% 8,6% 8,6% 7,9% 7,8% 6,7% 5,3% 4,4% 3,2% 3,1%
Conceit A 3.57 3 5 1 1 3 3 4 5 5 5 5
o
Conceit B 2,99 1 1 1 3 3 5 5 5 5 5 5
o
Conceit C 4.15 5 5 5 5 5 5 3 3 1 3 3
o
Conceit D 3.36 3 3 3 3 3 3 3 5 5 5 5
o
Conceit E 2.30 5 0 0 0 5 5 1 1 0 1 1
o