Probabilidade e Estatistica Probabilidade e Estatistica
Probabilidade e Estatistica Probabilidade e Estatistica
Probabilidade e Estatistica Probabilidade e Estatistica
de pela aplicao eficiente dos mtodos cientficos. Essa resoluo pode ser o refinamento de um produto ou de um processo j existente, seja pela elaborao do projeto de um novo produto ou processo que atenda as necessidades dos consumidores. Mtodo de Engenharia ou cientfico a abordagem para formular e resolver problemas. As etapas no mtodo de engenharia so dadas a seguir: 1. Desenvolver uma descrio clara e concisa do problema. 2. Identificar, ou tentar identificar, os fatores importantes que afetam esse problema ou que possam desempenhar um papel na soluo. 3. Propor um modelo para o problema, usando conhecimento cientfico. Estabelecer limitao ou suposio do modelo. 4. Conduzir experimentos apropriados e coletar dados para testar ou validar as concluses das etapas 2 e 3. 5. Manipular o modelo de modo a ajudar o desenvolvimento da soluo do problema. 6. Confirmar se a soluo proposta para o problema efetiva e eficiente. 7. Tirar concluses ou fazer recomendaes baseadas na soluo do problema.. Os engenheiros tm que saber planejar os experimentos, coletar dados, analisar, interpretar e entender como os dados observados esto relacionados com o modelo que eles propuseram para o problema em estudo. O campo da Estatstica lida com a coleta, apresentao, anlise e uso dos dados para tomar decises, resolver problemas e planejar produtos e processos. Os mtodos Estatsticos ajudam a entender a variabilidade presente no dia a dia. Sabemos que sucessivas observaes de um sistema ou fenmeno no produzem o mesmo resultado. Exemplo 1: Considere o consumo de combustvel de um automvel. Ele varia. Essa variabilidade depende de muitos fatores: Tipo de estrada Mudana nas condies do veculo ao longo do tempo ( desgaste de vlvulas, compresso do motor, desgaste dos pneus, marca ou octanagem da gasolina usada) Condies climticas. A Estatstica fornece uma estrutura para descrever essa variabilidade e apreender quais fontes potenciais de variabilidade so mais importantes e tem maior impacto no desempenho do consumo de gasolina.
Exemplo 2: Um engenheiro est projetando um conector de nylon para ser usado em uma aplicao automotiva. O engenheiro estabelece como especificao do produto uma espessura de parede de 3/32 polegadas, mas est inseguro com relao ao efeito desta deciso na fora de remoo do conector. Ele sabe que se a fora for muito baixa o motor pode falhar quando for instalado no motor. O que ele faz? Trabalha com 8 unidades do prottipo medindo suas foras de remoo ( libras-p): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6; 13,1. Todos foram produzidos igualmente, mas a variabilidade est presente. Qual a mdia?______________ Surge uma nova questo: Se aumentar a parede aumenta a fora de remoo? Novo experimento conduzido para responder a questo e mais 8 prottipos so construdos. Medidas da fora de remoo: 12,9; 13,7; 12,8; 13,9; 14,2; 13,2 ; 13,5 e 13,1. Mdia? _____ Cada vez que surgem novas questes, novos experimentos e conseqente uso da Estatstica para fazer a deciso. Raciocnio Estatstico: { }
Estudos enumerativos: faz a contagem das caractersticas de interesse presente na populao. Estudos analticos: envolvem a realizao de alguma ao num processo para melhorar o desempenho no futuro. Ex: investigao dos resultados de um processo de produo ou de servios.
Estatstica Inferencial: {
A- Dados: informao numrica necessria para ajudar a tomar deciso (Levine, Berenson e Stephan, 2000). Podemos ter dados de uma populao ou de uma amostra. B- Populao: totalidade dos itens ou objetos produzidos ou considerados. Parmetro: medida calculada para descrever uma caracterstica de toda a populao. C- Amostra: parte da populao selecionada para anlise. Estatsticas, no plural, so medidas calculadas para descrever caractersticas de uma amostras. Tipos de amostras: no probabilsticas e Amostras probabilsticas. C.1. Amostras no probabilsticas: Amostragem por julgamento, amostragem por quota, etc Amostragem por julgamento um tipo de amostragem no-probabilstica que utiliza o julgamento do pesquisador para a seleo dos elementos da amostra, ou seja, com base em sua experincia e criatividade, o pesquisador escolhe os elementos que julga serem representativos ao estudo. um mtodo rpido e barato, mas que apresenta como limitao a impossibilidade de se inferir parmetros da populao. Amostragem por quota uma amostragem por julgamento realizada em dois estgios. No primeiro estgio faz se a distribuio das quotas de modo que a proporo de elementos com caractersticas relevantes na amostra seja a mesma que a proporo de elementos na populao com estas caractersticas.No segundo estgio esses elementos so escolhidos por julgamento, como no caso anterior. C.2. Amostras probabilsticas: tem seus elementos escolhidos com base em probabilidades conhecidas. Amostra Aleatria simples: composta por elementos retirados ao acaso da populao. Todo elemento da populao tem igual probabilidade de ser escolhido para a amostra. Para se fazer uma amostra casual simples deve-se fazer uma listagem de todos os elementos da populao e obter os elementos da amostra por sorteio, tabela de nmeros aleatrios ou gerao de nmeros aleatrios por computador. Exemplo de amostra casual simples: De uma lista de 450 produtos sortear uma amostra de 50 deles para recebimento de um tratamento especial. Amostra sistemtica: Os seus elementos so escolhidos por um sistema. Para se fazer uma amostra sistemtica de c % da populao, buscamos o primeiro elemento da amostra por sorteio entre os 100/c primeiros elementos listados da populao. Os outros elementos so localizados a cada 100 / c posio na populao.
Exemplo: Numa certa regio foram catalogados e numerados todos os 540 produtos de uma indstria. Selecionar uma amostra de 2% desta populao. Soluo: 1- Em primeiro lugar fazemos uma lista dos 540 elementos desta populao. 2- Efetuamos a diviso 100% / 2% = 50. 3- Sorteamos o primeiro elemento da amostra entre 1 e 100 / 2 = 50. Imagine que neste sorteio tenhamos obtido o nmero 30. Isto significa que o trigsimo produto o primeiro elemento de minha amostra. Os demais elementos so escolhidos a cada 50 elementos. 4- Assim faro parte da amostra os produtos de nmero: 30, 80, 130, 180, 230, 280, 330, 380, 430, 480 e 530. 5- Sero ao todo em nmero de 11 os indivduos desta amostra.
Exercicio: Numa populao de 1500 elementos selecionar os elementos que vo compor uma amostra para que ela 5% da populao.
Amostra estratificada: aplicada quando a populao se divide em subpopulaes ou estratos, sendo razovel supor que a caracterstica de interesse apresente um comportamento mais ou menos homogneo dentro de cada estrato e substancialmente diverso de estrato para estrato. A amostra estratificada pode ser: - uniforme, quando sorteado igual nmero de elementos em cada estrato; - proporcional se o nmero de elementos sorteados em cada estrato for proporcional ao nmero de elementos existentes no estrato. Amostra de convenincia formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Se um profissional da sade tomar seus pacientes para estudar determinado problema estar usando uma amostra de convenincia. O pesquisador que utilizar amostras de convenincia deve ter muito senso crtico para que seus resultados no sejam tendenciosos.
Unidade 3 - Variveis aleatrias Variveis aleatrias: fenmenos ou caractersticas que geram dados que o resultado da observao dessas variveis. As variveis aleatrias podem ser
A- Variveis aleatrias categricas expressas por qualidades ou atributos. Dados obtidos a partir de uma varivel categorizada so interpretados como tendo sido medidos numa escala nominal ou numa escala ordinal. Uma escala nominal classifica os dados em categorias distintas, nas quais nenhum ordenamento est implcito. Exemplo: produto: defeituoso (sim, no); qualidade do acabamento ( especial, bom, razovel, ruim); falhas nos componentes(sim,no). Uma escala ordinal classifica os dados em categorias distintas, nas quais est implcita uma ordenao. uma forma mais robusta de mensurao do que a escala nominal, uma vez que um valor observado classificado em uma categoria possui maior quantidade de determinada propriedade do que um valor observado em outra categoria. ainda uma forma precria de mensurao, uma vez que a escala ordinal no leva em conta a quantidade de diferenas entre as categorias. O ordenamento, do mais baixo para o mais alto, implica somente qual categoria maior, melhor ou preferida, embora no diga o quanto. Exemplo: Satisfao do produto (muito insatisfeito, relativamente insatisfeito, neutro, relativamente satisfeito, muito satisfeito) B- Variveis aleatrias numricas: produzem respostas numricas. As variveis numricas so subdivididas em variveis discretas e contnuas. Variveis aleatrias discretas: apresentam valores numricos obtidos por contagem. Exemplo: nmero de arranhes nos itens inspecionados, nmero de bits transmitidos com erro, nmero de defeitos por pea, nmero de reclamaes recebidas. Variveis aleatrias contnuas: produzem respostas numricas que surgem de um processo de mensurao. Exemplo: corrente eltrica, presso, voltagem, temperatura, altura, comprimento, tempo, peso, etc. Os dados oriundos de uma varivel numrica so medidos em uma escala intervalar ou em uma escala de razo. Uma escala intervalar constitui uma escala ordenada, na qual a diferena entre mensuraes uma quantidade significativa embora no envolva um verdadeiro ponto zero. Exemplo: Temperatura ( em graus Celsius ou Farenheit que tm origem em zeros artificiais); Resultado de um exame padronizado,teste de aptido(ACT ou SAT). Uma escala de razo constitui uma escala ordenada, na qual a diferena entre mensuraes envolve um ponto zero verdadeiro, como o caso da altura, peso, volume, presso, velocidade, brilho, tempo decorrido.
Unidade 4: Descrio de dados Sumrios e apresentao de dados so essenciais ao bom julgamento estatstico. Permitem ao engenheiro focar nas caractersticas mais importantes dos dados; discernir acerca do modelo que deveria ser usado na soluo do problema. A - Diagrama de ramos e folhas: apresentao visual informativa de um conjunto de dados x1 , x2, ..., xn, em que cada nmero xi consiste em, no mnimo, dois dgitos. Etapas para construir um diagrama de Ramos e Folhas: 1- Divida cada nmero xi em duas partes: um ramo, consistindo de um ou mais dgitos iniciais, e uma folha consistindo dos dgitos restantes. 2- Liste os valores do ramo em uma coluna vertical. 3- Ao lado do ramo registre a folha para cada observao. 4- Escreva as unidades para os ramos e folhas no grfico. 5- aconselhvel escolher entre 15 e 20 ramos. Exemplo: Resistncia Compresso em libras por polegada quadrada (psi) de 80 corpos de prova da liga de alumnio ltio, submetida avaliao como um possvel material para elementos estruturais de aeronaves. Os dados foram registrados medida que os testes iam sendo realizados e assim eles no contm muita informao a respeito da resistncia compressiva. 105 97 245 163 207 134 218 199 160 196 221 154 228 131 180 178 157 151 175 201 183 153 174 154 190 76 101 142 149 200 186 174 199 115 193 167 171 163 87 176 121 120 181 160 194 184 165 145 160 150 181 168 158 208 133 135 172 171 237 170 180 167 176 158 156 229 158 148 150 118 143 u141 110 133 123 146 169 158 135 149
Questes como que percentagem dos corpos de prova cai abaixo de 120 psi?, no so fceis de serem respondidas sem antes construir uma apresentao mais efetiva para os dados. O diagrama de ramos e folhas (abaixo) capacita a determinar rapidamente algumas caractersticas importantes dos dados, que no estavam bvias.
Ramo 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Folha Frequncia 6 1 7 1 7 1 51 2 580 3 103 3 413535 6 29583169 8 471340886808 12 3073050879 10 8544162106 10 0361410 7 960934 6 7108 4 8 1 189 3 7 1 5 1
Numa Inspeo rpida possvel perceber que A maioria das resistncias compresso est entre 110 e 200psi. Um valor central est entre 150 e 160 psi. As resistncias esto distribudas aproximadamente de forma simtrica em torno de um valor central.
B- Apresentao de dados em tabelas. A partir do diagrama de ramos e folhas (acima) possvel representar os dados em uma tabela Resistncia compresso Freqncia Freqncia % 70 | 90 02 2/80*100=2, 50 90 | 110 03 3, 75 110 | 130 06 7, 50 130 | 150 14 17, 50 150 | 170 22 27, 50 170 | 190 17 21,25 190 | 210 10 12, 50 210 | 230 04 5, 00 230 | 250 02 2, 50 Total 80 100,00
C- Histogramas. A partir do diagrama de ramos e folhas (acima) tambm possvel representar os dados em um Histograma. Para construir um histograma ( intervalos de classes iguais): Traar inicialmente o sistema de eixos cartesianos. Apresentar as classes no eixo das abscissas, marcando os seus limites. Traar barras retangulares com bases iguais, correspondendo aos intervalos de classe e com alturas determinadas pelas respectivas freqncias (ou freqncias relativas percentuais).
Exerccios de fixao
1-Um fabricante de semicondutores produz dispositivos usados como unidades
de processamento central em computadores pessoais. A velocidade, em megahertz, do dispositivo importante porque ela determina o preo que o fabricante pode cobrar pelos dispositivos.A tabela seguinte contm medidas de 120 dispositivos. a) Construa um diagrama de ramos e folhas para esses dados e comente sobre importantes caractersticas que voc note. b) Monte uma distribuio de frequncias para esses dados. c) Faa um histograma para representar esses dados.
680 677 649 681 652 717 704 683 662 681 669 669 675 679 720 727 652 723 644 715 719 700 701 691 660 664 710 653 683 665 699 718 721 683 695 637 702 680 695 676 670 690 683 705 701 660 661 684 678 665 710 681 735 746 724 693 720 705 678 675 722 702 688 706 668 679 695 681 656 655 663 696 763 649 698 682 670 748 667 659 658 692 672 668 668 724 656 697 683 720 634 690 698 672 660 642 718 703 691 675 720 694 659 690 680 704 660 660 680 697 690 660 704 734 739 695 648 722 685 663 8
2-Um artigo em Technometrics apresenta os seguintes dados sobre as taxas de octanagem de combustvel para motor, de varias misturas de gasolina:
88,5 94,7 84,3 90,1 89,0 89,8 91,6 90,3 90,0 91,5 89,9 98,8 88,3 90,4 91,2 90,6 92,2 87,7 91,1 86,7 93,4 96,1 89,6 90,4 91,6 90,7 88,6 88,3 94,2 85,3 90,1 89,3 91,1 92,2 83,4 91,0 88,2 88,5 93,3 87,4 91,1 90,5 100,3 87,6 88,4 92,6 93,7 96,5 84,3 93,2 88,6 88,7 92,7 89,3 91,0 92,7 87,9 93,0 94,4 90,4 91,2 86,7 94,2 90,8 90,1 91,8 87,5 87,8 88,3 89,2 92,3 88,9 89,8 92,7 93,3 86,7 91,o 90,9 89,9 91,8 89,7 92,2
a) Construa um diagrama de ramos e folhas para esses dados e comente sobre importantes caractersticas que voc note. b) Monte uma distribuio de frequncias para esses dados. c) Faa um histograma para representar esses dados.
Unidade 5- Software de apoio Planilha eletrnica Microsoft Excel, uma ferramenta verstil para manipular e analisar dados numricos. Vantagens do uso do Excel sobre os pacotes estatsticos: 1- Essa planilha possui recursos estatsticos expressivos (funes, ferramentas, grficos, etc). 2- Apresenta uma interface funcional mais intuitiva para a maioria dos usurios do que os programas estatsticos ( Statistica, Minitab, SPSS, SAS, etc), que quase sempre exigem dos usurios o uso de comandos muito semelhantes aos comandos de uma linguagem de programao. 3- A maioria dos programas estatsticos composta por ferramentas criadas especialmente para quem j possui conhecimento na rea. 4- Um pacote estatstico no est sempre disponvel.
Vantagens dos pacotes estatsticos sobre o Excel: 1- Eles, em sua maioria, fornecem uma variedade muito maior de procedimentos estatsticos do que o Excel (Minitab, por exemplo). 2- Tm a disposio informaes complementares ou opcionais que no esto disponveis no Excel.
Preparando o Excel 2007: Carregar as Ferramentas de Anlise 1. Clique no Boto do Microsoft Office Opes do Excel. 2. Clique em Suplementos. 3. Na caixa Gerenciar, clique em Suplementos do Excel e, em seguida, clique em Ir. 4. Na caixa Suplementos disponveis, siga um destes procedimentos:
e, em seguida, clique em
Para carregar as Ferramentas de Anlise, marque a caixa de seleo Ferramentas de Anlise e clique em OK.
Para incluir as funes do Visual Basic for Applications (VBA) para Ferramentas de Anlise, marque a caixa de seleo Ferramentas de Anlise - VBA e clique em OK. Se Ferramentas de Anlise ou
10
Ferramentas de Anlise - VBA no constar na lista da caixa Suplementos disponveis, clique em Procurar para localizar o item. 5. Se for exibida uma mensagem informando que as Ferramentas de Anlise no esto instaladas no computador, clique em Sim para instal-las. Depois que voc carregar as Ferramentas de Anlise, o comando Anlise de Dados estar disponvel no grupo Anlise da guia Dados.
Preparando o Excel 1997- 2003: Carregar as Ferramentas de Anlise Preparando o Excel 1997-2003 para o trabalho estatstico: Dentro da planilha Excel, abra o menu ferramentas e verifique se no final da barra do menu aparece a alternativa Analisar dados. Se a alternativa Analisar Dados estiver na barra do menu Ferramentas significa que ao iniciar o Excel todas as funes e ferramentas necessrias so incorporadas planilha. Aperte o boto Cancelar. Se a alternativa Analisar Dados no constar do menu Ferramentas, proceda da seguinte maneira: abra o menu Ferramentas e escolha Suplementos. O Excel apresentar uma caixa de dilogo com os suplementos disponveis. Escolha Ferramentas de Analise e pressione o boto OK. Como teste, abra o menu Ferramentas e verifique no final da barra do menu a incorporao da alternativa Analisar Dados.
Histograma no Excel 2007. 1) Em uma planilha, digite seus prprios dados, da seguinte maneira: a) Em uma coluna, digite os dados de entrada (dados numricos quantitativos) um em cada clula, pois a ferramenta Histograma no funciona com dados numricos qualitativos). b) Em outra coluna, digite, em ordem crescente, os limites superiores das classes. Caso no sejam fornecidos, a ferramenta Histograma criar automaticamente esses limites, o que no recomendado. Se desejar, adicione um rtulo na primeira clula dessas colunas. 2) Na guia Dados, no grupo Anlises, clique em Anlise de Dados.
11
3) Na caixa Ferramentas de Anlise, clique em Histograma e, em seguida, clique em OK. 4) Em Entrada, na caixa Intervalo de Entrada, digite a referncia de clula do intervalo de dados que voc deseja analisar. 5) Em Entrada, na caixa Intervalo do bloco, digite a referncia de clula para um intervalo que contm um conjunto opcional de valores de limite que definem intervalos de classes. 6) Se tiver includo rtulos de coluna quando selecionou os dados de entrada e de intervalo de classes, marque a caixa de seleo Rtulos. 7) Em Opes de sada, siga um destes procedimentos: a. Para colar a tabela de sada na mesma planilha, clique em Intervalo de Sada e digite a referncia da clula superior esquerda da tabela de sada. b. Para inserir uma nova planilha na pasta de trabalho atual e colar a tabela de sada comeando pela clula A1 da nova planilha, clique em Novo Mdulo de Planilha. c. Para criar uma nova pasta de trabalho e colar a tabela de sada em uma nova planilha na nova pasta de trabalho, clique em Nova Pasta de Trabalho. 8) Em Opes de sada, execute um ou todos os procedimentos a seguir: a. Para apresentar os dados na tabela de sada em ordem de freqncia decrescente, marque a caixa de seleo Pareto (histograma classificado). b. Para gerar uma coluna de tabela de sada para porcentagens cumulativas e incluir uma porcentagem cumulativa no grfico de histograma, marque a caixa de seleo Porcentagem Cumulativa. c. Para gerar um grfico de histograma incorporado, marque a caixa de seleo Sada do Grfico. Este o que escolhemos neste caso.
12
9) Clique em OK. 10) Para alterar a exibio do grfico, clicar com o boto direito do mouse em cima da barra do histograma. Na caixa de dilogo que se abre, selecionar a ltima opo formatar srie de dados. Em opes de srie escolher largura do espaamento entre as barras e digitar 0 %. Fechar a caixa de dilogo.Quando clicar no histograma, voc poder usar o design, o layout e as opes de formato das Ferramentas de Grfico para alterar a exibio do grfico. Para obter mais informaes sobre como alterar o design e o formato de um grfico, consulte os links da seo Consulte tambm. Resistncia compresso( em psi) 90 110 130 150 170 190 210 230 250
Freqncia 2 4 5 16 21 17 9 4 2
Histograma
25 20 Freqncia 15 10 5 0 90 110 130 150 170 190 210 230 250 Mais Resistncia compresso
13
Mdia aritmtica: denotada por x , a medida de tendncia central mais utilizada. Para uma amostra contendo um conjunto de n observaes x1, x2,..., xn, a mdia aritmtica calculada dividindo-se a soma dos valores de x pelo nmero de observaes.
Mediana: o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas de forma crescente ou decrescente. A mediana uma medida de localizao. Ela divide a disposio ordenada pela metade (50% das observaes so maiores e 50% das observaes so menores que a mediana). Para um nmero par de observaes a mediana a mdia aritmtica dos elementos centrais. Para um nmero mpar de dados(n), a mediana o valor que fica no centro dos dados ordenados, isto , o valor da varivel que ocupa o posto (n+1)/2.
Moda o valor mais freqente de um conjunto de dados. Exemplo1: Um engenheiro est projetando um conector de nilon para ser usado em uma aplicao automotiva. Ele estabelece como especificao do projeto uma espessura de parede de 3/32 polegada, mas no est seguro do efeito desta deciso na fora de remoo do conector. Se a fora de remoo for muito baixa, o conector pode falhar se ele for instalado no motor. Oito unidades do prottipo so produzidas e suas foras de remoo so medidas, resultando os seguintes dados(em libras/p): 12,6; 12,9; 13,4; 12,3; 13,6; 13,5; 12,6; 13,1.
14
A mdia = 104/8=13 A mediana dos dados ordenados ( 12,3; 12,6; 12,6; 12,9; 13,1; 13,4; 13,5; 13,6) dada pela mdia aritmtica dos termos centrais=( 12,9 + 13,1)/2=13. A moda 12,6 ( valor de maior freqncia).
B- Medidas de posicionamento Quartis: medidas descritivas que dividem os dados ordenados em quatro partes (conjuntos). Primeiro quartil (Q1) o valor que faz com que 25% das observaes sejam menores e 75% sejam maiores que ele. Segundo Quartil ou mediana (Q2) o valor que faz com que 50% das observaes sejam menores e 50% sejam maiores que ele. Terceiro Quartil (Q3) o valor que faz com que 75% das observaes sejam menores e 25% sejam maiores que ele. Para calcular os quartis, so usadas as frmulas de ponto de posicionamento a seguir: Q1= valor correspondente observao ordenada . Q2= valor correspondente observao ordenada
( ( ) )
Q3= valor correspondente observao ordenada . As regras abaixo sero usadas para obter o valor dos quartis: 1- Se o ponto de posicionamento um inteiro, o quartil a observao numrica correspondente quele posicionamento. 2- Se o ponto de posicionamento estiver na metade entre dois nmeros inteiros, o quartil a mdia dos respectivos valores. 3- Se o ponto de posicionamento no um nmero inteiro e nem est no meio de dois inteiros, faz-se o arredondamento para o inteiro mais prximo e seleciona o valor numrico da observao correspondente como o quartil. Primeiro quartil (Q1) = 12,6 ( segundo elemento da srie, pois (n+1)/4= 9/4= 2,25 que se arredonda para 2).
15
Segundo Quartil ou mediana (Q2) = 13 (pois (n+1)/2= 4,5 e o quartil a mdia entre o quarto e o quinto valor numrico da srie, ou seja, (12,9+13,1)/2=13). Terceiro Quartil (Q3)=13,5( stimo elemento da srie, pois 3(n+1)/4= 27/4= 6,75 que se arredonda para 7).
Mdia das Juntas ou Midhinge a mdia entre o primeiro e terceiro quartil. Mdia das Juntas ou Midhinge = Q1= primeiro quartil; Q3= terceiro quartil. Mdia das Juntas ou Midhinge=(12,6+13,5)/2=13,05.
C-
Para realizar os clculos com as medidas de posio, o Excel dispe das seguintes funes estatsticas: MEDIA, MED e MODO. MEDIA(nm1;nm2;...;nm30): retorna o valor da mdia dos valores. MED(nm1;nm2;...;nm30): retorna o valor da mediana dos valores. MODO(nm1;nm2;...;nm30): retorna o valor da moda dos valores. Se os dados forem registrados em uma planilha basta informar o intervalo, por exemplo, MEDIA (A1: A8) no lugar de toda a seqncia nm1; nm2;...; nm30, que podem ser selecionados arrastando o mouse. i. Medidas de Localizao no centrais no Excel. Para ordenar um conjunto de valores em ordem crescente, basta digit-los numa coluna e clicar no boto Classificao crescente que se situa no Menu Incio. . A funo estatstica QUARTIL (srie de dados; quartil) d como resultado o elemento do conjunto de observaes correspondente ao quartil definido, identificado da seguinte maneira: Se quartil = 0 o resultado o menor valor do conjunto de dados.
16
Se quartil =1 o resultado da funo o primeiro quartil. Se quartil =2 o resultado da funo o segundo quartil. Se quartil =3 o resultado da funo o terceiro quartil. Se quartil = 4 o resultado o maior valor do conjunto de dados. Procedimento para encontrar os quartis: 1- Digite o conjunto de dados. 2- Abrir o assistente de funo fx. 3- Em selecione uma categoria, escolha Estatstica. 4- Em selecione uma funo, escolha QUARTIL (OK). 5- Em Matriz selecione ao conjunto de dados. 6- Em quarto, escolha 1, 2 ou 3.
Unidade 7 - Medidas de Disperso Medidas de Disperso: so medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou disperso, dos valores em torno da mdia. 7.1. Amplitude total ou intervalo: mede a disperso total no conjunto de dados, sem contudo, levar em conta a maneira como os dados se distribuem entre o menor e o maior valor. Amplitude = Xmax X min No exemplo dado acima a amplitude =13,6-12,3= 1,3. 7.2. Amplitude interquartil a diferena entre o terceiro e o primeiro quartil. Amplitude interquartil = Q3 Q1 Esta medida considera a disperso nos dados que esto entre os 50% de observaes centrais da srie de dados (entre o primeiro e o terceiro quartis)e, deste modo, no , de maneira alguma influenciada por valores extremos. No exemplo dado acima a amplitude interquartil = 13,5 12,6= 0,9. 7.3. Varincia amostral: representada por s, pode ser definida pela soma dos quadrados dos desvios dividida por n-1. Os estatsticos chamam o valor n - 1 de nmero de graus de liberdade.
17
Desvios (xi - x ) (12,3- 13) (12,6-13) (12,6-13) (12,9-13) (13,1-13) (13,4-13) (13,5-13) (13,6-13) (xi - x ) = 0 ( )
Quadrados dos desvios (xi - x )2 (-0,7)=0,49 (-0,4)=0,16 (-0,4)=0,16 (-0,1)=0,01 (0,1)=0,01 (0,4)=0,16 (0,5)=0,25 (0,6)=0,36 (xi - x )2 = 1,6
7.4.
Desvio padro da amostra: representado pelo smbolo s, a raiz quadrada da varincia da amostra, expressa do seguinte modo: ( )
A varincia e o desvio padro medem a disperso mdia em torno da mdia aritmtica, isto , como as observaes maiores flutuam acima dela e as observaes menores se distribuem abaixo dela. 7.5. Coeficiente de Variao: uma medida de disperso relativa. Interpretao: Se C.V. < 15% h baixa disperso. Se 15% < C.V. < 30% h mdia disperso. Se C.V. >30% h elevada disperso. 7.6. Escore padronizado para uma medida xi e deteco de outliers.
Um escore zi negativo indica que a observao xi est esquerda da mdia; positivo indica que a observao xi est direita da mdia; maior do que 3 em valor absoluto indica que a observao xi foge das dimenses esperadas (outlier).
18
Exerccios: 1-Foram feitas oito medidas do dimetro (em mm) interno de anis forjados de pisto de um motor de um automvel. Os dados codificados so: 1, 3, 15, 0, 5, 2, 5 e 4. a) Calcule as medidas de tendncia central para estes dados e interprete-os. b) Calcule as medidas de disperso para estes dados e interprete-os.
2-Os dados a seguir se referem ao consumo de oxignio (ml/kg/min) para uma amostra de 10 bombeiros em uma simulao de supresso de incndio:
29,5 49,3 30,6 28 28 26,3 33,9 29,4
a) Dar o consumo mdio de oxignio. b) Dar o consumo mediano. c) Dar o consumo modal. d) Calcular a varincia e o desvio padro. e) Calcular e interpretar o coeficiente de variao. Unidade 8 Medidas de Assimetria Medidas de Assimetria: referem-se forma da curva de uma distribuio de freqncias, mais especificamente do polgono de freqncia ou do histograma. a) Curva ou Distribuio de Freqncias Simtrica: quando a mdia, mediana e moda so iguais. x = Me = Mo Graficamente:
Fi
Classe
x = Me = Mo b) Curva ou Distribuio de Freqncias Assimtrica Positiva: predominam valores superiores moda. x > Me > Mo Graficamente:
Fi
19
Mo Me
Classe
c) Curva ou Distribuio de Freqncias Assimtrica Negativa: predominam valores inferiores moda. x < Me < Mo Graficamente:
Fi
x Me Mo
Classe
Unidade 9: Medidas de curtose Curtose indica o grau de achatamento de uma curva de freqncias em relao a uma curva padro, denominada curva normal. De acordo com o grau de curtose, podemos ter trs tipos de curvas de freqncia. a) Curva ou Distribuio de Freqncias Mesocrtica Quando a curva de freqncias apresenta um grau de achatamento equivalente ou da curva normal.
20
b) Curva ou Distribuio de Freqncias Platicrtica Quando uma curva de freqncias apresenta um alto grau de achatamento, superior ao da normal. c) Curva ou Distribuio de Freqncias Leptocrtica Quando uma curva de freqncias apresenta um alto grau de afilamento, superior ao da normal.
(Q3 Q1 ) / 2 C 90 C10
Se k = 0, 263 Curva ou distribuio mesocrtica k > 0, 263 Curva ou distribuio platicrtica k < 0, 263 Curva ou distribuio leptocrtica Exerccio: O ultra-som foi usado para obter informaes sobre dados de corroso na espessura da chapa do assoalho de um reservatrio usado para armazenar leo bruto. Cada observao a maior profundidade do orifcio na placa, expressa em milipolegadas. 40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125 127 Classificar o conjunto de dados quanto assimetria e quanto curtose.
Diagrama de caule e folhas e histograma conduzem a impresses gerais sobre um conjunto de dados, enquanto um nico valor como mdia ou desvio padro
21
enfoca apenas um aspecto dos dados. Nos ltimos anos um resumo esquemtico denominado Box plot vem sendo usado para descrever as caractersticas mais proeminentes de conjuntos de dados. Estas caractersticas incluem: centro, disperso, a extenso e a natureza de qualquer desvio em relao simetria e a identificao de outliers, observa es que normalmente esto distantes da maior parte dos dados. Como apenas um outlier pode afetar drasticamente os valores da mdia e do desvio padro, um Box plot baseado em medidas resistentes presen a de alguns outliers: mediana e quartis. O Box plot mais simples tem base no seguinte resumo de cinco nmeros: menor, primeiro quartil, mediana, terceiro quartil e maior.
1- Desenhar um eixo de medida horizontal. 2- Coloque um retngulo sobre o eixo: a extremidade inferior do retngulo estar posicionada no primeiro quartil e a extremidade superior do retngulo estar posicionada no terceiro quartil. 3- Trace um segmento de reta vertical dentro do retngulo na posio da mediana. 4-Usando a amplitude interquartlica, AIQ = Q3 Q1 calcule os limites para o grfico ( 1,5 AIQ abaixo de Q1 e 1,5 AIQ acima de Q3. Os dados fora destes limites so os outliers. Os limites so sempre calculados mas podem no estar desenhados no Box plot. 5-As linhas tracejadas so desenhadas a partir dos lados do retngulo at os valores menores e maiores dentro dos limites calculados.
Exerccios: 1- Considere as 20 observaes a seguir ordenadas da menor para a maior, cada uma representando a vida til (em horas) de determinado tipo de lmpada incandescente:
22
612 1016
623 1022
666 1029
744 1058
883 1085
898 1088
964 1122
970 1135
983 1197
1003 1201
2-Os efeitos de descargas parciais na degradao de materiais de cavidades isolantes tm importantes implicaes na vida til de componentes de alta voltagem. Consideremos a seguinte amostra de larguras de pulso de descargas lentas em uma cavidade cilndrica de polietileno. 5,3 92,9 96,7 8,2 93,6 98,1 13,8 94,3 99 74,1 94,8 101,4 85,3 94,9 103,7 88 95,5 106 90,2 95,8 113,5 91,5 95,9 115 92,4 96,6 116
23
Unidade 11- Medidas de Disperso no Excel Para realizar clculos com medidas de disperso, o Excel dispe das funes VAR, VARP, DESVPAD, DESVPADP e CURT. Tem tambm a ferramenta de anlise Estatstica Descritiva. VAR(nm1, nm2, ...) retorna o valor da varincia da amostra. VARP(nm1, nm2, ...) retorna o valor da varincia da populao. DESVPADP(nm1, nm2, ...) retorna o valor do desvio padro da populao. DESVPAD(nm1, nm2, ...) retorna o valor do desvio padro da amostra. CURT(nm1, nm2, ...) retorna o valor do coeficiente de curtose e o seu resultado deve ser interpretado da seguinte maneira:
Se o resultado for {
DISTORO(nm1, nm2, ...) retorna o valor do coeficiente de assimetria e o seu resultado deve ser interpretado da seguinte maneira: Se for { o } resultado
Para usar esta ferramenta: preparar inicialmente a planilha de dados. Acrescentar as seguintes informaes: Intervalo de Entrada: selecionar os dados digitados. Agrupado por: selecionamos colunas, pois os dados foram registrados em coluna. Rtulos: selecionar rtulos na primeira linha. Em Opes de sada devemos informar o endereo da clula inicial a partir da qual a ferramenta de anlise apresentar os resultados. Escolhendo o parmetro Resumo Estatstico, a ferramenta de anlise apresenta o resumo estatstico completo.
24
Fora de remoo 12,6 12,9 13,4 12,3 13,6 13,5 12,6 13,1
Fora de remoo Mdia 13 Erro padro 0,169030851 Mediana 13 Modo 12,6 Desvio padro 0,478091444 Varincia da amostra 0,228571429 Curtose -1,558375 Assimetria 0,115040754 Intervalo 1,3 Mnimo 12,3 Mximo 13,6 Soma 104 Contagem 8
Exerccios 1- Os seguintes dados so medidas de viscosidade para um produto qumico observado de hora em hora. 47,9 47,9 48,6 48,0 48,4 48,1 48,0 48,6 48,8 48,1 48,3 47,2 48,9 48,6 48,0 47,5 48,6 48,0 47,9 48,3 48,5 48,1 48,0 48,3 43,2 43,0 43,5 43,1 43,0 42,9 43,6 43,3 43,0 42,8 43,1 43,2 43,6 43,2 43,5 43,0 49,1 42,3
a) Calcular as medidas de disperso. 1.Fazer um diagrama de ramos e folhas. 2. Montar uma distribuio de freqncias para estes dados. 3. Fazer um histograma para estes dados. 4. Fazer um Box Plot. 5. Interpretar os resultados.
2- Os dados mostrados a seguir representam o rendimento de 90 bateladas consecutivas de um substrato cermico, no qual um revestimento de metal foi aplicado por um processo de deposio a vapor.
25
94,1 86,1 95,3 84,9 88,8 93,2 90,4 94,1 78,3 86,4 90,6 89,1 97,8 89,6 85,1 91,4 87,3 93,1 90,3 84,0 88,2 84,1 86,4 93,1 93,7 86,1 90,1 87,6 94,6 87,7 95,1 95,2 94,1 96,3 90,6 92,4 86,1 92,1 94,7 89,4 92,4 94,3 96,4 91,1 88,6 a) Calcular as medidas de disperso.
b) Fazer um diagrama de ramos e folhas. c) Montar uma distribuio de freqncias para estes dados. d) Fazer um histograma para estes dados. e) Fazer um Boxplot. f) Interpretar os resultados.
26