E Statistic A
E Statistic A
E Statistic A
GRADUAÇÃO
Unicesumar
Reitor
Wilson de Matos Silva
Vice-Reitor
Wilson de Matos Silva Filho
Pró-Reitor de Administração
Wilson de Matos Silva Filho
Pró-Reitor Executivo de EAD
William Victor Kendrick de Matos Silva
Pró-Reitor de Ensino de EAD
Janes Fidélis Tomelin
Presidente da Mantenedora
Cláudio Ferdinandi
Impresso por:
Em um mundo global e dinâmico, nós trabalhamos
com princípios éticos e profissionalismo, não so-
mente para oferecer uma educação de qualidade,
mas, acima de tudo, para gerar uma conversão in-
tegral das pessoas ao conhecimento. Baseamo-nos
em 4 pilares: intelectual, profissional, emocional e
espiritual.
Iniciamos a Unicesumar em 1990, com dois cursos
de graduação e 180 alunos. Hoje, temos mais de
100 mil estudantes espalhados em todo o Brasil:
nos quatro campi presenciais (Maringá, Curitiba,
Ponta Grossa e Londrina) e em mais de 300 polos
EAD no país, com dezenas de cursos de graduação e
pós-graduação. Produzimos e revisamos 500 livros
e distribuímos mais de 500 mil exemplares por
ano. Somos reconhecidos pelo MEC como uma
instituição de excelência, com IGC 4 em 7 anos
consecutivos. Estamos entre os 10 maiores grupos
educacionais do Brasil.
A rapidez do mundo moderno exige dos educa-
dores soluções inteligentes para as necessidades
de todos. Para continuar relevante, a instituição
de educação precisa ter pelo menos três virtudes:
inovação, coragem e compromisso com a quali-
dade. Por isso, desenvolvemos, para os cursos de
Engenharia, metodologias ativas, as quais visam
reunir o melhor do ensino presencial e a distância.
Tudo isso para honrarmos a nossa missão que é
promover a educação de qualidade nas diferentes
áreas do conhecimento, formando profissionais
cidadãos que contribuam para o desenvolvimento
de uma sociedade justa e solidária.
Vamos juntos!
Seja bem-vindo(a), caro(a) acadêmico(a)! Você está
iniciando um processo de transformação, pois quando
investimos em nossa formação, seja ela pessoal ou
profissional, nos transformamos e, consequentemente,
Pró-Reitor de
Ensino de EAD
transformamos também a sociedade na qual estamos
inseridos. De que forma o fazemos? Criando oportu-
nidades e/ou estabelecendo mudanças capazes de
alcançar um nível de desenvolvimento compatível com
os desafios que surgem no mundo contemporâneo.
O Centro Universitário Cesumar mediante o Núcleo de
Educação a Distância, o(a) acompanhará durante todo
Diretoria de Graduação
e Pós-graduação este processo, pois conforme Freire (1996): “Os homens
se educam juntos, na transformação do mundo”.
Os materiais produzidos oferecem linguagem dialógica
e encontram-se integrados à proposta pedagógica, con-
tribuindo no processo educacional, complementando
sua formação profissional, desenvolvendo competên-
cias e habilidades, e aplicando conceitos teóricos em
situação de realidade, de maneira a inseri-lo no mercado
de trabalho. Ou seja, estes materiais têm como principal
objetivo “provocar uma aproximação entre você e o
conteúdo”, desta forma possibilita o desenvolvimento
da autonomia em busca dos conhecimentos necessá-
rios para a sua formação pessoal e profissional.
Portanto, nossa distância nesse processo de cresci-
mento e construção do conhecimento deve ser apenas
geográfica. Utilize os diversos recursos pedagógicos
que o Centro Universitário Cesumar lhe possibilita.
Ou seja, acesse regularmente o Studeo, que é o seu
Ambiente Virtual de Aprendizagem, interaja nos fóruns
e enquetes, assista às aulas ao vivo e participe das dis-
cussões. Além disso, lembre-se que existe uma equipe
de professores e tutores que se encontra disponível para
sanar suas dúvidas e auxiliá-lo(a) em seu processo de
aprendizagem, possibilitando-lhe trilhar com tranqui-
lidade e segurança sua trajetória acadêmica.
AUTORAS
ESTATÍSTICA
SEJA BEM-VINDO(A)!
Caro(a) estudante, é com muito prazer que apresentamos a você o livro que fará parte
da disciplina de Estatística. A Estatística é uma ciência que se dedica ao desenvolvimen-
to e ao uso de métodos para a coleta, resumo, organização, apresentação e análise de
dados. Um exemplo do uso da estatística está na previsão do tempo em uma região, em
tendências numa eleição, a posição dos bancos dos trens em certa linha e, até, o hábito
de lavar as mãos após usar o banheiro.
Fazendo uma pequena viagem pelo tempo, em 3000 a.C., registrava-se os primeiros in-
dícios de censos na Babilônia, na China e no Egito. No Velho Testamento, Livro 4° (Nú-
meros), registra-se uma instrução de Moisés: “Fazer levantamento dos homens de Israel
aptos a guerrear” (TOREZANI, 2004, p. 2).
A palavra “Censo” deriva do verbo latino “censere”, que significa taxar. O objetivo inicial
da realização dos censos era buscar informações sobre as populações para orientar a
taxação de impostos. Era, portanto, uma atividade que interessava, particularmente, aos
governos, ao Estado. Daí deriva a palavra ESTATÍSTICA (de STATUS). Trata-se da ferramen-
ta de trabalho dos estadistas.
Em 1805, Guilherme, o Conquistador, determinou que se fizesse, na Inglaterra, um le-
vantamento, visando obter informações sobre posse de terras, sua utilização, seus pro-
prietários, número de empregados, posse de animais etc., para taxação de impostos.
No século XVII, John Graint publica “Aritmética Política”, uma análise sobre nascimentos
e óbitos, a partir das chamadas Tábuas de Mortalidade.
Já, no século XVIII (1797), surge, na Enciclopédia Britânica, o verbete “STATISTICS” pela
primeira vez.
O termo “Estatística” é usado, hoje, com alguns significados diferentes. Ele pode se referir a:
• meros registros de eventos que interessem ao administrador em geral;
• uma simples medida estatística que seja obtida de uma amostra;
• métodos estatísticos padronizados utilizados em pesquisa por amostragem;
• ciência estatística em geral, hoje, grandemente desenvolvida e com aplicação disse-
minada como auxiliar as mais diferentes áreas de conhecimento.
De forma simplificada, podemos admitir que a Ciência Estatística tem como objetivo
obter informações confiáveis sobre determinado fenômeno de interesse.
A Estatística está de forma muito presente na mídia, seja em jornais, revistas ou meios
de comunicação. Além disso, uma vez que está diretamente envolvida com pesquisa,
é a partir dela que as decisões são tomadas. Podemos dizer que a Estatística é uma
ferramenta para qualquer pesquisador na busca pelas respostas aos vários problemas
relacionados ao meio em que trabalha. Entretanto, para que ela seja bem utilizada, é
necessário conhecer os seus fundamentos, seus princípios e suas ferramentas para que
possamos utilizá-la de forma adequada.
APRESENTAÇÃO
Este material foi separado em cinco unidades, sendo iniciado com a importância da
Estatística básica, passando por probabilidades e finalizando com medidas de asso-
ciação.
A unidade I vai do início de sua utilização até a importância dos gráficos e das tabelas
na apresentação dos dados. Essa unidade trata, basicamente, dos conceitos que você
precisará saber para entender a Estatística nas unidades posteriores.
Na unidade II, nos aprofundaremos no estudo de tabelas e de gráficos, mais especi-
ficamente, leitura e construção de tabelas, aplicação e utilização de alguns tipos de
gráficos.
A unidade III mostra as medidas de posição e de dispersão. Essas medidas são, ampla-
mente, empregadas dentro de pesquisas em nível científico e, também, nos proble-
mas mais simples do cotidiano.
A unidade IV trata sobre probabilidades. As probabilidades podem tratar de eventos
simples a extremamente complexos. De forma abrangente, elas tratam das chances
de determinados fenômenos ocorrerem. A importância de se estudar probabilidades
está na verificação de que alguns eventos ocorrem com uma facilidade maior que
outros e, assim, podemos prever situações futuras sobre esses eventos.
A unidade aborda as probabilidades de forma geral, mostrando desde os cálculos mais
simples, passando por suas propriedades, e indo até as probabilidades condicionais
e distribuições de probabilidades. As principais distribuições são aquelas que utiliza-
mos com maior frequência, uma vez que existem inúmeros tipos. Essas distribuições
do comportamento da variável com a qual estamos trabalhando é importante, pois,
por meio delas é que determinamos como calcular probabilidades de forma correta.
Finalizando o material, a unidade V trata das medidas de associação, mais especifica-
mente a correlação e a análise de regressão. Essas medidas nos mostram o grau de re-
lação entre duas variáveis. A correlação informa a intensidade da relação e a análise de
regressão mostra a quantidade de variação em uma por meio da variação em outra.
Este material está bastante sintetizado, focando os pontos principais da Estatística de
modo a proporcionar encaminhamentos que possibilitem a compreensão dos con-
ceitos, ao contrário do que muitas vezes é posto em se tratando de estudar Matemá-
tica e, especificamente, Estatística.
A resolução de tarefas é importante desde que o(a) estudante procure fazê-la à luz da
teoria que ela contempla. Com isso, afirmo: será necessário, também, muito empenho
de sua parte para a realização desse intenso trabalho. No decorrer de suas leituras,
procure interagir com os textos, fazer anotações, responder as atividades de estudo,
anotar suas dúvidas, ver as indicações de leitura e realizar novas pesquisas sobre os
assuntos tratados, pois com certeza não será possível esgotá-los em apenas um livro.
Prof.ª Ivnna Gurniski de Oliveira
Prof.ª Renata C. de Souza Chatalov
09
SUMÁRIO
UNIDADE I
15 Introdução
18 População e Amostra
20 Amostragem
30 Tipos de Variáveis
36 Considerações Finais
40 Referências
41 Gabarito
UNIDADE II
TABELAS E GRÁFICOS
45 Introdução
46 Tabelas
60 Gráficos
68 Considerações Finais
73 Referências
74 Gabarito
10
SUMÁRIO
UNIDADE III
79 Introdução
80 Medidas de Posição
91 Medidas Separatrizes
96 Medidas de Dispersão
110 Referências
111 Gabarito
UNIDADE IV
PROBABILIDADES
115 Introdução
116 Probabilidade
155 Referências
156 Gabarito
11
SUMÁRIO
UNIDADE V
159 Introdução
179 Referências
180 Gabarito
182 CONCLUSÃO
Professora Me. Ivnna Gurniski de Oliveira
Professora Me. Renata Cristina de Souza Chatalov
CONCEITOS E IMPORTÂNCIA
I
UNIDADE
DA ESTATÍSTICA
Objetivos de Aprendizagem
■■ Entender o que significa Estatística.
■■ Compreender a importância da Estatística.
■■ Assimilar os principais conceitos dentro da Estatística.
■■ Compreender as principais formas de apresentação de dados
estatísticos.
Plano de Estudo
A seguir, apresentam-se os tópicos que você estudará nesta unidade:
■■ A Importância da Disciplina de Estatística
■■ População e Amostra
■■ Amostragem
■■ Tipos de Variáveis
■■ Fases do Método Estatístico
15
INTRODUÇÃO
Introdução
16 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
A IMPORTÂNCIA DA DISCIPLINA DE ESTATÍSTICA
A Estatística tem por objetivo fornecer métodos e técnicas para que se possa
lidar com situações de incerteza, e pode ser subdividida em três áreas: descri-
tiva, probabilística e inferencial.
A estatística descritiva, também chamada de estatística dedutiva, tem como obje-
tivo organizar, resumir e simplificar as informações, a fim de torná-las mais fáceis
de serem entendidas, transmitidas e discutidas. Como o nome indica, ela descreve
os fenômenos de forma prática e acessível, ou seja, por meio de tabelas, gráficos e
medidas resumo, que veremos nas próximas unidades. Assim, podemos captar rapi-
damente, por exemplo, o significado de uma “taxa de desemprego”, de um “consumo
médio de combustível por quilômetro”, ou de uma “nota média de estudantes”.
A Estatística Inferencial objetiva “inferir” conclusões sobre a população,
interpretando os dados colhidos de uma amostra. Para isso, utiliza amplamente a
“Teoria das Probabilidades”, que é fundamental para avaliar situações que envol-
vam o acaso. A aplicação de métodos probabilísticos nos permite “quantificar”
a importância do acaso.
Assim, resultados obtidos por amostragem são “testados”, utilizando-se
conhecimentos probabilísticos, a fim de se determinar até que ponto eles são
significativos, isto é, não são obra do acaso.
Quando tratamos de dados estatísticos, podemos optar por dois processos:
o Censo e as Estatísticas, que podem ser assim definidos:
■■ Censo: processo que consiste no exame de todos os elementos da popu-
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
lação. Exemplo: censo demográfico, censo industrial, etc.
■■ Estatísticas: utilizadas para avaliar os elementos de uma amostra.
POPULAÇÃO E AMOSTRA
População pode ser definida como sendo uma coleção de elementos que
possuem alguma característica em comum, podendo estes ser animados ou
inanimados.
Quando as informações desejadas estiverem disponíveis para todos os objetos
da população, temos o chamado censo. Normalmente, é impraticável ou inviá-
vel trabalhar com a população quando se faz Estatística (CRESPO, 2009). Isto é
devido a alguns fatores:
■■ Restrição de tempo ou de recursos.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
População e Amostra
20 UNIDADE I
AMOSTRAGEM
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
amostragens, a fim de obtermos os valores aproximados (estimativas) para os
parâmetros em que estamos interessados.
Esse tipo de pesquisa é chamado de levantamento por amostragem
(BARBETTA, 2014). No entanto, a seleção dos elementos que serão utilizados
para fazerem parte da amostra, deve ser feita sob uma metodologia adequada,
de tal forma que os resultados da amostra sejam suficientemente informativos
para se inferir sobre os parâmetros populacionais.
Amostragem
22 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Existem dois grandes grupos de técnicas amostrais:
■■ Probabilísticas: quando todos os elementos da população têm probabili-
dade conhecida e diferente de zero de pertencer à amostra.
■■ Não probabilísticas: quando nem todos os elementos da população têm
probabilidade conhecida de pertencer à amostra.
Para se ter uma amostra casual simples, precisa-se de uma listagem com todos
os elementos da população de origem. Os elementos que farão parte da amos-
tra devem ser obtidos de forma totalmente aleatória, ou seja, por sorteio e sem
restrição. É escrito cada elemento em um cartão e assim sorteado os participan-
tes da amostra. Todos os elementos da população têm igual probabilidade n
N
de pertencer à amostra.
Essa técnica de sorteio se torna inviável quando a população é significativa-
mente grande. Neste caso, é necessário o uso de tabelas de números aleatórios
ou algoritmos que geram números aleatoriamente.
AMOSTRAGEM SISTEMÁTICA
Amostragem
24 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
da lista. Para obter os demais elementos da amostra, somamos o intervalo I ao
elemento anterior. Se o sorteado for, por exemplo, o número 4, a amostra será
formada pelos sujeitos de números 4, 10, 16, 22 e 28.
AMOSTRAGEM ESTRATIFICADA
É importante saber que a amostra não pode conter vícios, ou seja, não ser ten-
denciosa. Deve ser selecionada com cuidado, aplicando a técnica de amostragem
adequada com tamanho amostral (n) que seja informativo ao que consta na
população. O tamanho da população pode ser obtido por fórmulas encontra-
das facilmente na literatura ou pode ser dado pelo bom senso do pesquisador.
O importante é que ele seja representativo da população.
Amostragem
26 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
AMOSTRAGEM NÃO ALEATÓRIA
DIMENSIONAMENTO DA AMOSTRA
tros estimados pela pesquisa. Quanto menor o erro amostral, maior o tamanho
da amostra, implicando em maior precisão nas estimativas populacionais e con-
sequentemente maior custo para execução da pesquisa (FONSECA, 2008).
O erro amostral é a diferença entre uma estatística e o parâmetro que se quer
estimar (BARBETTA, 2014).
Para que possamos determinar o tamanho de uma amostra, o pesquisador
precisa especificar o erro amostral tolerável, isto é, o quanto ele admite errar na
avaliação dos parâmetros de interesse; por exemplo, em uma pesquisa eleitoral,
é comum encontrarmos algo que diz que a pesquisa tem um erro de 2%. Isso
significa que, quando a pesquisa aponta que determinado candidato tem 45% de
intenções de votos, o pesquisador afirma na verdade que a preferência por este
candidato, em toda a população de eleitores, é um valor no intervalo de 43% a
47%, isto é, 45% mais ou menos 2%.
Para dimensionamento da amostra, utilizaremos a equação a seguir:
Z 2 . p^ . q^ . N
d2 . (N - 1) + Z 2 . p^ . q^
Em que:
N = Tamanho da população.
p^ = estimativa da verdadeira proporção de um dos níveis da variável
escolhida.
q^ = 1 – p
Z α /2 = abcissa da curva norma padrão, fixado em um nível de confiança
d = erro amostral.
Amostragem
28 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fonte: elaborado pelas autoras adaptado de Crespo (2009); Barbetta (2014).
Os valores que devem ser utilizados na equação são os valores de z, por exemplo
se tivermos o intervalo de confiança de 90%, utilizaremos 1,645 e assim por diante.
Exemplo: Temos uma população com 43.373 pessoas e desejamos fazer uma
pesquisa utilizando os níveis de confiança e os erros amostrais a seguir:
Amostragem
30 UNIDADE I
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
2,332 . 0,5 . 0,5 . 43.373
0,022 . (43.373 - 1) + 2,332 . 0,5 . 0,5
58.869,63
= 3.146,43 arredondando = 3147 entrevistados
18,71
TIPOS DE VARIÁVEIS
VARIÁVEL – é uma característica que possa ser avaliada (ou medida) em cada
elemento da população, sob as mesmas condições. Uma variável observada (ou
medida) em um elemento da população deve gerar um e apenas um resultado.
Exemplo:
Seja uma população formada pelos funcionários de determinada empresa.
Podemos considerar variáveis como: tempo de serviço, salário, estado civil,
idade, sexo, escolaridade, inteligência, peso, estatura, autoestima, grau de satis-
fação com o emprego, autoritarismo, religiosidade, etc.
Como medir essas características? Devemos fixar uma unidade de medida
(kg, cm, anos completos,...) ou definir atributos (casado, solteiro, masculino,
feminino, forte, fraco...).
Exercício:
Tipos de Variáveis
32 UNIDADE I
Respostas:
a. Quantitativa Contínua.
b. Qualitativa Nominal.
c. Qualitativa Nominal.
d. Quantitativa Discreta.
e. Quantitativa Contínua.
f. Qualitativa Nominal.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
g. Qualitativa Nominal.
h. Quantitativa Discreta.
i. Quantitativa Discreta.
TABELAS E GRÁFICOS
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
O objetivo da utilização de tabelas e gráficos é transformar dados em informações
que permitam a fácil visualização e interpretação da nossa pesquisa. Também
servem para verificar a existência de algum padrão para comparar esse padrão
com outros resultados ou, ainda, para julgar sua adequação a alguma teoria.
As tabelas são quadros em que serão dispostas as informações por alguma
categoria pelo cálculo de alguma frequência. Devem ter as laterais abertas, ou
seja, sem bordas, e devem ainda ter um título explicativo e localizado acima delas,
precedido da palavra Tabela e seguido de sua numeração. Veja o exemplo abaixo:
Tabela 2 - Número de computadores pessoais instalados no Brasil e percentual sobre total de habitantes de
2000 a 2004
%
100,0
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
Brasil Norte Nordeste Sudeste Sul Centro-
oeste
2005 2006 2007
Gráfico 1 - Percentual de domicílios atendidos por rede geral de abastecimento de água no total de domicílios
particulares permanentes (%)
Fonte: IBGE - Pesquisa Nacional por Amostra de Domicílios (2006-2007, online).
CONSIDERAÇÕES FINAIS
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
elementos da população e cujas medidas são chamadas de parâmetros. Entretanto,
se utilizamos uma parte dessa população, não temos um parâmetro, e sim uma
estatística ou um estimador; portanto, um estimador é uma medida tomada em
uma parte dessa população, mas não nela toda, embora este estimador repre-
sente o parâmetro.
Também vimos os conceitos de População e Amostra. População, no sen-
tido estatístico, pode ser definida como um conjunto de elementos que possuem
alguma característica em comum. Como na maioria das vezes é difícil ou custoso
trabalharmos com população, utilizamos uma parte dela. A esta parte chama-
mos de amostra. Essa amostra deve, porém, representar a população, ou seja,
deve ter as mesmas características da população que se irá amostrar.
Para que isso seja conseguido, o processo de coleta de uma amostra, também
conhecido como amostragem, deve ser feito de forma casual ou aleatória. Existem
algumas maneiras de se fazer uma amostragem e, para cada situação, existe uma
maneira ideal. Nesta unidade, foram discutidos os principais tipos de amostras
utilizadas nas pesquisas, sendo que a escolha deve ser feita de modo que as amos-
tras representem de fato a população e de forma que sejam não tendenciosas.
Após a coleta da amostra, é necessário descrever os dados. Para isso, primei-
ramente, devemos saber com quais tipos de variáveis estamos trabalhando, para,
assim, escolhermos qual é a melhor maneira de apresentar a pesquisa.
Finalizando, é importante que a apresentação dos dados seja feita de forma
precisa. As duas formas vistas nesta unidade foram as tabelas e os gráficos, e o
uso correto das formas de apresentação dos dados é fundamental para o sucesso
da pesquisa.
A Estatística Fácil
Antônio Arnot Crespo
Editora: Saraiva
Sinopse: Este livro apresenta todos os tópicos exigidos pelo programa estabelecido
para os cursos profissionalizantes da rede de ensino particular e oficial, de forma
acessível ao aluno, dentro de um esquema de ensino objetivo e prático. O estudo é
complementado por exercícios em abundância com situações práticas.
Trabalha com estatística descritiva, probabilidades, distribuições de probabilidades,
correlação e regressão linear, de forma prática e fácil linguagem.
Material Complementar
REFERÊNCIAS
1. A Estatística pode ser definida como uma parte da matemática que se preocupa
em coletar, organizar, descrever, analisar e interpretar um conjunto de dados.
A estatística descritiva se preocupa em descrever os dados.
A estatística inferencial se preocupa com a análise dos dados e sua interpreta-
ção. Ela analisa os dados com base na amostra e, então, estende as conclusões
desta amostra à população.
5.
a) Funcionário da empresa, amostragem estratificada.
b) Senadores do Brasil, amostragem aleatória simples.
c) Pessoas na fila de atendimento, amostragem sistemática.
d) Peças fabricadas, amostragem sistemática.
Professora Me. Ivnna Gurniski de Oliveira
Professora Me. Renata Cristina de Souza Chatalov
II
UNIDADE
TABELAS E GRÁFICOS
Objetivos de Aprendizagem
■■ Entender a importância dos gráficos e das tabelas.
■■ Aprender a construir gráficos e tabelas para variáveis qualitativas.
■■ Aprender a construir gráficos e tabelas para variáveis quantitativas.
Plano de Estudo
A seguir, apresentam-se os tópicos que você estudará nesta unidade:
■■ Tabelas
■■ Gráficos
45
INTRODUÇÃO
Introdução
46 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
TABELAS
TABELAS E GRÁFICOS
47
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Tabelas
48 UNIDADE II
Exemplo:
Tabela 02 - Distribuição de frequências de indivíduos que acessam o site quanto ao sexo
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Outro exemplo:
Tabela 03 - Grupo de atributos que mais valorizam os imóveis
TABELAS E GRÁFICOS
49
Tabela Primitiva
Tabelas
50 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
A esse tipo de tabela, na qual os valores e/ou elementos não foram trabalhados,
nem numericamente organizados, denominamos de tabela primitiva.
Rol
TABELAS E GRÁFICOS
51
Observem que é bem melhor para trabalharmos com os dados organizados, não
acham? A partir disso, já conseguimos visualizar algumas coisas quanto à esta-
tura dos colaboradores, por exemplo, que o colaborador com a menor estatura
tem 150 cm e a maior estatura 173 cm.
Tabelas
52 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
distribuição de frequências.
Segue os dados em rol seguir:
TABELAS E GRÁFICOS
53
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
Total 40
Fonte: dados fictícios elaborados pelas autoras.
Tabelas
54 UNIDADE II
Vamos aprender a construir essa tabela? Vejamos os passos para sua elaboração.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
2º passo: determinar o número de classes (k): não há regras absolutas para
a escolha do número de classes (k), geralmente entre 5 e 20 classes serão satisfa-
tórias para a maior parte dos conjuntos de dados. Uma regra prática razoável é:
K≈ número de observações
K= n
Usar um número pequeno de classes poderia concentrar a maioria das
observações em uma ou duas classes. Se for usado um número grande de clas-
ses, muitas delas terão frequências iguais à zero.
No nosso exemplo, K = 40 = 6,32... = arredondando = 6.
Portanto, nossa tabela terá 6 classes.
TABELAS E GRÁFICOS
55
Tabelas
56 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
150 |----- 154 4
154 |----- 158 9
158 |----- 162 11
162 |----- 166 8
166 |----- 170 5
170 |----- 174 3
Total 40
Fonte: dados fictícios elaborados pelas autoras.
TABELAS E GRÁFICOS
57
n
Em que:
fr(%) = Frequência relativa em percentual
fi = Frequência da classe
n = número total de elementos (ou somatória da frequência)
Fac
FRac(%) = . 100
n
Em que:
FRac(%) = Frequência relativa acumulada em percentual
Fac = Frequência acumulada
n = número total de elementos (ou somatória da frequência)
Tabelas
58 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
(162+166)/2=
162 |----- 166 8 (8/40)*100 = 20 32 (32/40)*100 = 80
164
(166+170)/2=
166 |----- 170 5 (5/40)*100 = 12,5 37 (37/40)*100 = 92,5
168
(170+174)/2=
170 |----- 174 3 (3/40)*100 = 7,5 40 (40/40)*100 = 100
172
Total 40 100 972
Fonte: dados fictícios elaborados pelas autoras.
Para melhor apresentar nossa tabela, vamos apresentá-la somente com os resul-
tados, sem os cálculos dentro dela, observem:
Tabela 09 - Estaturas de 40 colaboradores de uma organização
TABELAS E GRÁFICOS
59
que fazer um bom ROL, pois, se você errar na distribuição da coluna fre-
quências (fi), você poderá errar os dados de toda tabela.
Exemplo 02: Suponhamos que perguntamos a idade a um grupo de 100 pessoas
e, ainda, que desejamos representar os resultados obtidos distribuídos em inter-
valos. As idades desse grupo estão apresentadas a seguir (em rol):
17 17 18 18 18 18 19 19 19 20
20 21 21 21 22 23 24 24 25 25
25 26 26 26 27 27 27 28 28 28
29 29 29 30 30 30 30 31 32 32
33 34 34 35 35 36 36 36 36 37
38 39 39 40 40 40 40 40 41 42
43 43 43 43 43 44 44 44 44 44
44 44 45 45 45 46 46 46 46 46
47 47 47 47 47 48 48 48 48 48
48 48 48 49 50 52 52 53 55 55
Fonte: elaborados pelas autoras.
2º passo: n = 100 = 10
AT 38
3º passo: h = = =3,8 = arredondando 4.
K 10
Tabelas
60 UNIDADE II
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
45 |----- 49 21 21 93 93 47
49 |----- 53 4 4 97 97 51
53 |----- 57 3 3 100 100 55
Total 100 100 370
Fonte: elaborada pelas autoras.
GRÁFICOS
Gráficos são ferramentas de representação dos dados que servem para facilitar a
visualização deles. Devem ter simplicidade e clareza para permitir se chegar a con-
clusões sobre a evolução do fenômeno ou como se relacionam os valores da série.
Cotidianamente, observa-se que meios de comunicação utilizam essa ferra-
menta para mostrar as pesquisas. Isso se deve ao fato da facilidade de interpretação
demonstrada nos gráficos e da eficiência com
que resume informações, embora apresente
menor grau de detalhes em relação às tabelas,
dando uma ideia mais global dos dados.
Ao optar pela utilização de um gráfico em uma
pesquisa, devemos levar em conta que sua cons-
trução exige cuidados, como escolher o tipo que
melhor se encaixa na representação dos dados.
TABELAS E GRÁFICOS
61
Gráficos em colunas
Esse tipo de gráfico é formado por retângulos verticais, em que cada um dos
retângulos representa a intensidade de um atributo. É o gráfico mais utilizado
para representar variáveis qualitativas. Indicado quando as categorias são breves.
Exemplo:
5.5
5
4.5
4
Preço (R$)
3.5
3
2.5
2
1.5
1
Arroz Feijão Macarrão Açúcar Leite
Produto
Gráfico 1 - Valores de Produtos em um Supermercado
Fonte: elaborados pelas autoras.
Gráficos
62 UNIDADE II
25
25
20
18
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Nº de alunos
15 Meninos
15
13 Meninas
11
10 10
10 9
5
5 4
0
Futebol Vôlei Basquete Atletismo Tênis
Modalidade Esportiva
Gráfico 2 - Modalidades Esportivas de uma escola
Fonte: elaborados pelas autoras.
25
Meninos
20 Meninas
15
10
5
0
Futebol Vôlei Basquete Atletismo Tênis
Gráfico 3 - Modalidades Esportivas de uma escola
Fonte: elaborados pelas autoras.
TABELAS E GRÁFICOS
63
É importante observar, neste tipo de gráfico, que cada uma das modalidades de
esporte refere-se a uma das barras e é dividida por sexo.
Gráfico em barras
Valores de Produtos
em um Supermercado
Leite 2,2
Açúcar 4,5
Produtos
Macarrão 3,5
Feijão 4,9
Arroz 5,3
0 1 2 3 4 5 6
Preço (em R$)
Gráfico de setores
Gráficos
64 UNIDADE II
Exemplo:
Não
informado
Aterro 5%
Controlado
18%
Aterro Vazadouro a
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Sanitário céu aberto
14% (lixão)
63%
Gráfico de linhas
TABELAS E GRÁFICOS
65
18
16
Número de computadores
14
12
10
8
6
4
2
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
0
Janeiro Fevereiro Março Abril
Mês
Histograma
Gráficos
66 UNIDADE II
12
10
8
Frequências (Fi)
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
2
0
150 | ----- 154 154 | ----- 158 158 | ----- 162 162 | ----- 166 166 | ----- 170 170 | ---- 174
Estaturas (em cm)
Gráfico 7 - Estatura (em cm) de 40 colaboradores de uma organização
Fonte: dados fictícios elaborados pelas autoras.
Polígono de frequência
4
Frequência (Fi)
0
0 | --- 2 2 | --- 4 4 | ---- 6 6 | ---- 8 8 | ------ 10
Idades
TABELAS E GRÁFICOS
67
O Microsoft Excel não fornece mais o assistente de gráfico. Agora, para criar
um gráfico básico, selecione uma parte do conteúdo que pretende repre-
sentar e clique no tipo de gráfico desejado na guia Inserir, no grupo Gráficos.
O Microsoft Excel possui um assistente para facilitar a geração de gráficos,
no qual ele divide este processo em quatro etapas subsequentes, apresen-
tando a cada etapa apenas as opções, diretamente, relacionadas e necessá-
rias para a conclusão do gráfico.
Fonte: Support Office (2017)
Gráficos
68 UNIDADE II
CONSIDERAÇÕES FINAIS
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Nesta unidade, vimos os tipos mais comuns como os de barras e colunas, os de
linha, de setores ou pizza, histograma e polígono de frequência.
De forma geral, os gráficos demonstram dados quantitativos associados a
alguma variável qualitativa. Todos os gráficos têm o mesmo objetivo, que é o
de demonstrar de forma clara e rápida os dados da pesquisa. A escolha do tipo
adequado fica ou a critério do pesquisador ou a critério do objetivo da pesquisa
estudada.
Nessa etapa, o interesse maior consiste em tirar conclusões que auxiliem o
pesquisador a resolver seu problema. Portanto, além da organização e da tabu-
lação dos dados, as tabelas e os gráficos nos apresentam de uma forma clara,
sucinta e objetiva os resultados de uma pesquisa, para tirarmos conclusões e nos
ajudarem na tomada de decisões.
Também observamos que podemos construir gráficos e tabelas por meio
de programas computacionais, por exemplo, o Microsoft Excel, que é uma pla-
nilha de dados que dispõe de ferramentas para construção de gráficos, a partir
de tabelas. Esse programa é fácil de usar, tem inúmeras ferramentas que podem
ser úteis ao gestor.
Esperamos que você tenha compreendido essa unidade, porque ela é de
extrema importância aos futuros profissionais, pois tabelas e gráficos estão pre-
sentes no nosso cotidiano, e cabe a nós entender, interpretar e avaliar os dados
apresentados por meio de tabelas e de gráficos.
TABELAS E GRÁFICOS
69
REGRAS DE ARREDONDAMENTO
Arredondamentos são de fundamental importância para nossos estudos, principalmen-
te ao calcular valores que têm muitas casas decimais. Muitas vezes, é conveniente supri-
mir unidades inferiores às de determinada ordem. Esta técnica é denominada arredon-
damento de dados ou valores.
Muitas vezes é muito mais fácil e mais compreensível usarmos valores arredondados
para melhor entendimento do público que terá acesso à informação.
De acordo com a Resolução nº 886/66 do IBGE:
I) < 5 (menor que 5). Quando o primeiro algarismo a ser abandonado é 0,1,2,3 ou 4, ficará
inalterado o último algarismo que permanece.
Exemplo:
43,24 passa para 43,2.
54,13 passa para 54,1.
II) > 5 (maior que 5). Quando o primeiro algarismo a ser abandonado é o 6,7,8, ou 9,
aumenta-se em uma unidade o algarismo que permanece.
Exemplos:
23,87 passa para 23,9.
34,08 passa para 34,1.
74,99 passa para 75,0.
III) = 5 (igual a 5). Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
A) Se após o 5 seguir, em qualquer casa, um algarismo diferente de zero, aumenta-se
uma unidade ao algarismo que permanece.
Exemplos:
6,352 passa para 6,4.
55,6501 passa para 55,7.
96,250002 passa para 96,3.
71
Exemplos:
14,75 passa para 14,8
24,65 passa para 24,6
34,75000 passa para 34,8
44,8500 passa para 44,8
Exemplo:
72,5 passa para 73 inteiros.
72,45 passa para 72,5 (setenta e dois inteiros e cinco décimos) - uma casa após a vírgula.
72,445 passa para 72,45 (setenta e dois inteiros e quarenta e cinco centésimos) duas
casas após a vírgula.
Estatística Básica
Geraldo Luciano Toledo, Ivo Izidoro Ovalle
Editora: Atlas
Sinopse: Este livro contém a matéria fundamental para estudos subsequentes no
campo da estatística inferencial. Além disso, aborda os tópicos mais importantes da
estatística básica.
73
REFERÊNCIAS
Fonte: as autoras.
2.
C1 C2 C3
31,25% 31,25%
37,50%
7,5 - 5,0
3. AC = = 0,625 = arredondando para 0,63
4
Tabela 01 - Distribuição de frequências para a variável tempo de resposta
TEMPO Fi Fr% Fac Xi
5,00 |--5,63 1 6,25 1 5,32
5,63 |--6,26 4 25,00 5 5,95
6,26 |--6,89 7 43,75 12 6,58
6,89|--7,52 4 25,00 16 7,21
Total 16 100,00 - -
Fonte: as autoras.
75
GABARITO
4.
8
7
7
5
4 4
4
2
1
1
0
5,00 | -- 5,63 5,63 | -- 6,26 6,26 | -- 6,89 6,89 | -- 7,52
Gráfico 02 - Porcentagem de clientes para a variável tempo de resposta ao usuário
Fonte: as autoras.
5.
III
MEDIDAS DESCRITIVAS
UNIDADE
ASSOCIADAS A VARIÁVEIS
QUANTITATIVAS
Objetivos de Aprendizagem
■■ Compreender as principais medidas estatísticas de posição, dispersão
e separatrizes.
■■ Entender a aplicação das medidas estatísticas de posição, dispersão e
separatrizes.
Plano de Estudo
A seguir, apresentam-se os tópicos que você estudará nesta unidade:
■■ Medidas de Posição
■■ Medidas Separatrizes
■■ Medidas de Dispersão
79
INTRODUÇÃO
distribuição de dados, dando-nos uma noção do que está ocorrendo com eles.
Por meio dessas medidas, podemos localizar a maior concentração de valores
em uma distribuição, ou seja, se ela localiza-se no início, no meio ou no centro,
ou, ainda, se há uma distribuição por igual. As medidas de tendência central
mais importantes são a média aritmética, a mediana e a moda. Vale salientar
que temos outras medidas de posição que são as separatrizes, que englobam: a
própria mediana, os quartis e os percentis.
As medidas de dispersão, porém, são utilizadas para avaliar o grau de varia-
bilidade do conjunto de dados, mostrando se ele é homogêneo ou heterogêneo.
Essas medidas servem para analisar o quanto os dados são semelhantes e des-
crevem o quanto os dados distanciam do valor central, portanto as medidas de
dispersão servem também para avaliar o grau de representação da média. As
medidas de dispersão mais utilizadas são: a amplitude total, a variância, o des-
vio padrão e o coeficiente de variação.
Assim, para descrevermos um conjunto de dados, é de bom grado sempre
termos uma medida de posição e uma de dispersão para representá-lo. A de
posição, para dizer o que está ocorrendo com a pesquisa, e a de dispersão, para
dizer se há alta ou baixa variabilidade.
Nesta unidade, vamos estudar as principais medidas de posição e medidas
de dispersão utilizadas nas pesquisas para descrever e representar o conjunto
de dados.
Introdução
80 UNIDADE III
MEDIDAS DE POSIÇÃO
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Para sumarizar as informações de um conjunto de observações, muitas vezes
é necessário utilizar medidas que resumem em um só número certas caracte-
rísticas. Assim, temos as medidas de posição, de dispersão, de assimetria e de
curtose. Se as medidas são calculadas para dados a partir de uma amostra, são
chamadas de estatísticas da amostra; se são calculadas a partir de uma popula-
ção, são chamadas de parâmetros da população.
As principais medidas de posição e as principais medidas separatrizes são:
MÉDIA ARITMÉTICA
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
A média de uma variável é a medida mais importante e mais simples de ser cal-
culada. Esta fornece uma medida de posição central. Se os dados são de uma
amostra, a média é denotada por ; se os dados são de uma população, a média
é denotada pela letra grega μ.
A média de um conjunto de dados é encontrada somando seus valores e
dividindo pelo número de observações. Seja x1, x2, ..., xn um conjunto de dados,
a média será dada por:
População Amostra
Exemplo:
Suponha que estamos estudando a idade de cinco indivíduos de uma família.
As idades observadas foram: 5, 10, 12, 35, 38. Logo, a idade média dessa família é:
n
i=1
xi x1 + x2 + ... + xn
x= =
n n
x = 5 + 10 + 12 + 35 + 38 = 20 anos
5
Medidas de Posição
82 UNIDADE III
Exercício
Calcule a média para a quantidade de atendimentos realizados em um mês
por um consultor financeiro.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Existem situações em que não temos todos os dados disponíveis ou então temos
“pesos” diferentes para os dados considerados. Nestes casos, utilizamos o que
chamamos de média aritmética ponderada para obtermos a média, cujas fórmu-
las para População e para Amostra são dadas da seguinte maneira:
População Amostra
20 1 20
21 3 63
25 3 75
28 5 140
29 3 87
Total 20 476
Fonte: dados fictícios elaborados pelas autoras.
476 = 23,8.
20
Quando desejamos obter a média de dados que estão distribuídos em uma tabela com
intervalo de classes, a equação para determinar a média continua sendo a mesma,
no entanto, temos que tirar o ponto médio antes. Observem um exemplo a seguir.
Tabela 03 - Idades de 100 colaboradores de uma organização
IDADES Fi Xi Xi. Fi
17 |----- 21 11 19 (11*19) = 209
21 |----- 25 7 23 (7*23) = 161
25 |----- 29 12 27 (12*27) = 324
29 |----- 33 10 31 (10*31) = 310
33 |----- 37 9 35 (9*35) = 315
37 |----- 41 9 39 (9*39) = 351
41 |----- 45 14 43 (14*43) = 602
45 |----- 49 21 47 (21*47) = 987
Medidas de Posição
84 UNIDADE III
Exercício:
Tabela 4 - Distribuição de frequências para a idade dos clientes de uma imobiliária para efetuar uma compra
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
CLASSES Fi Fr(%) Fac Xi
17 |---- 29 4 36,4 4 23
29 |---- 41 4 36,4 8 35
41 |----| 53 3 27,3 11 47
Total 11 100 - -
Fonte: dados fictícios elaborados pelas autoras.
Resposta: 33,91
Existem situações em que os dados não estão agrupados, mas existem “pesos”
diferentes para cada um deles. Vejamos um exemplo:
A média da nota bimestral dos alunos da Unicesumar é composta pela nota
de uma prova (com peso 8) e pela nota dos trabalhos (com peso 2). Calcule a
média bimestral do aluno que tirou as seguintes notas:
x = (8 x 7) (2 x 9) = 7,4
8+2
Exercício: Calcule as médias ponderadas das notas bimestrais dos alunos abaixo:
Tabela 5 - Médias bimestrais dos alunos da Escola X
(xi - x) = 0
Medidas de Posição
86 UNIDADE III
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
tabelecidas para os seus pesos, dando a aparência de que se trata de outra
fórmula, muito diferente da média aritmética.
Fonte: Neto (2009).
MODA
h(Fi - Fi - 1)
Mo = li +
(Fi - Fi - 1) + (Fi - Fi + 1)
Em que:
i é a ordem da classe modal.
li é o limite inferior da classe modal.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
IDADES Fi Xi
17 |----- 21 11 19
21 |----- 25 7 23
25 |----- 29 12 27
29 |----- 33 10 31
33 |----- 37 9 35
37 |----- 41 9 39
41 |----- 45 14 43
45 |----- 49 21 47
49 |----- 53 4 51
53 |----- 57 3 55
Total 100 370
Fonte: dados fictícios elaborados pelas autoras.
Medidas de Posição
88 UNIDADE III
Para isso, devemos determinar a classe modal. A classe modal é a classe com
a maior frequência absoluta e, neste caso, é a terceira classe, pois essa possui o
maior valor de Fi . Determinada a classe modal, vamos calcular a moda por meio
da fórmula para dados agrupados.
Nesse exemplo, temos que a classe modal é a 8º classe, pois é nela que temos
a maior frequência, agora que localizamos a classe modal, vamos aplicar a equa-
ção dada:
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
(Fi - Fi - 1) + (Fi - Fi + 1) (21 - 14) + (21 - 4)
MEDIANA
Md = 12.
3, 5, 6, 8, 9, 12, 13, 15, 15, 16, 17
Quando o rol tiver número par de elementos, a mediana será a média aritmética
entre os dois elementos centrais. Vejamos, por exemplo, um rol com 10 elemen-
tos (número par de elementos):
3, 5, 6, 8, 9, 13, 14, 15, 15, 16.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Md = = 11
Se n for ímpar: Md =
Exercício:
Calcule a mediana para as notas dos alunos nas duas situações seguintes:
■ 6.0, 4.5, 5.0, 7.0, 6.5;
■ 4.8, 6.3, 8.9, 9.5, 6.0, 7,8;
h(p - Fac - 1)
Md = li +
Fi
Em que:
li é o limite inferior da classe da mediana.
h é a amplitude da classe da mediana.
Medidas de Posição
90 UNIDADE III
IDADES Fi Fac Xi
17 |----- 21 11 11 19
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
21 |----- 25 7 18 23
25 |----- 29 12 30 27
29 |----- 33 10 40 31
33 |----- 37 9 49 35
37 |----- 41 9 58 39
41 |----- 45 14 72 43
45 |----- 49 21 93 47
49 |----- 53 4 97 51
53 |----- 57 3 100 55
Total 100 370
Fonte: dados fictícios elaborados pelas autoras.
p= n p = 100 = 50
2 2
Quando o valor de p for decimal, sempre aproximamos seu valor para “cima”.
Para saber qual é a classe da mediana, devemos olhar na coluna da frequência
acumulada, de modo que p ≤ Fac . Logo, a mediana está na 6ª classe. Em seguida,
aplicamos a equação da mediana:
MEDIDAS SEPARATRIZES
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
QUARTIS
Fórmulas:
Medidas Separatrizes
92 UNIDADE III
DECIS
Chamamos de decis os valores que dividem uma série em dez partes iguais.
Portanto, temos nove decis, o primeiro tem 10% dos dados à sua esquerda e 90%
à sua direita, o segundo tem 20% dos dados à sua esquerda e 80% à sua direita
e assim por diante até o nono decil, que tem 90% dos dados à sua esquerda e
10% à sua direita.
1º Decil (D1) P=0,10(n +1)
2º Decil (D2) P=0,20(n +1)
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
3º Decil (D3) P=0,30(n +1)
4º Decil (D4) P=0,40(n +1)
5º Decil (D5) P=0,50(n +1)
6º Decil (D6) P=0,60(n +1)
7º Decil (D7) P=0,70(n +1)
8º Decil (D8) P=0,80(n +1)
9º Decil (D9) P=0,90(n +1)
PERCENTIS
Em que a letra n nas fórmulas de calcular a posição dos quartis, dos decis e dos
percentis representa o número total de elementos da amostra.
Quando o valor de p for inteiro, temos que a medida separatriz está na posi-
ção de número p, caso contrário, o cálculo das medidas separatrizes, para os
dados em rol, é dado por:
Sk = Xi + (p - i) (Xi + 1 - Xi)
Em que:
Sk é a medida separatriz a ser utilizada, podendo ser os quartis, os decis ou
os percentis.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Medidas Separatrizes
94 UNIDADE III
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
P90 = 36 anos.
Portanto, 90% dos indivíduos têm idade inferior a 36 anos.
h(p - Fac - 1)
Sk = li +
Fi
Em que:
Sk é a medida separatriz a ser utilizada, podendo ser os quartis, os decis ou
os percentis.
li é o limite inferior da classe da separatriz.
h é a amplitude da classe da separatriz.
p é a posição da medida separatriz adotada. Sendo que para os quartis p = nk 4
,
nk nk
k = 1, 2, 3; para os decis p = 10 , k = 1, 2, ..., 9; para os percentis p = 100, k = 1, 2, ...,
99; onde n é a quantidade de elementos da amostra.
Fac - 1 é a frequência acumulada da classe anterior a da separatriz.
Fi é a frequência absoluta da classe da separatriz.
Exemplo:
Vamos determinar o Q3 e o D7 para o seguinte conjunto de dados:
Tabela 9 - Teor de oxigênio (mg/L) em vários rios da região Norte do Brasil
■■ Para o Q3 :
Primeiro vamos determinar a posição da medida e, em seguida, deter-
minar qual é a sua classe.
nk 16 . 3
p= = = 12
4 4
0,3(12 - 8)
Q3 = 1,1 + = 1,27
7
Portanto, pode-se afirmar que 75% dos rios da região norte do Brasil têm
teor de oxigênio inferior a 1,27 mg/L.
Para o D7 :
Primeiro vamos determinar a posição da medida e, em seguida, deter-
minar qual é a sua classe.
nk 16 . 7
p= = = 11,2
10 10
Medidas Separatrizes
96 UNIDADE III
Portanto, pode-se afirmar que 70% dos rios da região norte do Brasil têm
teor de oxigênio inferior a 1,24 mg/L.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
MEDIDAS DE DISPERSÃO
AMPLITUDE TOTAL
AT = xmax − xmin
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Em que:
xmax é o maior valor no conjunto de dados.
xmin é o menor valor no conjunto de dados.
Exemplo:
Suponha que estamos estudando a idade de cinco indivíduos de uma famí-
lia. As idades observadas foram: 5, 10, 12, 35, 38. Logo, a amplitude das idades
nessa família:
AT = 38 − 5 = 33 anos
Exercício
Calcule a Amplitude total dos seguintes conjuntos de dados:
A: 15; 15; 15; 15; 15
B: 13; 14; 15; 16; 17
C: 5; 10; 15; 20; 25
R: 0; 4; 20
Medidas de Dispersão
98 UNIDADE III
VARIÂNCIA
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
No qual μ é a média da população e N o número de observações.
Se os dados são para uma amostra, a variância, denotada por s2, é definida
como:
Exemplo:
Vamos calcular a variância do conjunto de dados do exemplo anterior, ou
seja, vamos calcular a variância das idades observadas de uma família, sendo
elas: 5, 10, 12, 35, 38.
Primeiramente, devemos calcular a média x para as idades:
x = 5 + 10 + 12 + 35 + 38 = 20
5
n 5
i=1
(xi - x)
2
i=1
(xi - 20)2
s =
2
=
n-1 5-1
DESVIO PADRÃO
População Amostra
Medidas de Dispersão
100 UNIDADE III
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
maior então será a variação dos dados e mais heterogêneo é o nosso conjunto
de observações.
COEFICIENTE DE VARIAÇÃO
População Amostra
CV = . 100 CV = . 100
Se isto acontecer, deve-se optar para representar os dados por outra medida,
podendo ser essa a mediana ou moda, não existindo uma regra prática para a
escolha de uma dessas. Fica, então, essa escolha a critério do pesquisador. Ao
mesmo tempo, quanto mais baixo for o valor do CV, mais homogêneo é o con-
junto de dados e mais representativa será sua média.
Quanto à representatividade em relação à média, podemos dizer que quando
o coeficiente de variação (CV) é ou está (CRESPO, 2009):
■ Menor que 10%: significa que é um ótimo representante da média, pois
existe uma pequena dispersão (desvio padrão) dos dados em torno da
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
média.
■ Entre 10% e 20%: é um bom representante da média, pois existe uma boa
dispersão dos dados em torno da média.
■ Entre 20% e 35%: é um razoável representante da média, pois existe uma
razoável dispersão dos dados em torno da média.
■ Entre 35% e 50%: representa fracamente a média, pois existe uma grande
dispersão dos dados em torno da média.
■ Acima de 50%: não representa a média, pois existe uma grandíssima dis-
persão dos dados em torno da média.
s 15,31
CV = = x 100 = 76,55%
x 20
Verificamos que há uma grande variação, ou seja, uma alta dispersão dos
dados. Portanto, concluímos que a média não é uma boa representante desse
conjunto de dados.
Medidas de Dispersão
102 UNIDADE III
Exercício:
Calcule as medidas de dispersão para um grupo de indivíduos que têm as
seguintes idades: 18, 19, 20, 21, 21, 22, 24, 24, 25, 27, 30, 33 e verifique se a média
é uma medida que representa bem este conjunto de dados.
R: Média: 23,67; Variância: 20,42; desvio padrão amostral: 4,51; C.V.(%): 19%.
Observe que, para dados agrupados, há uma pequena diferença nas fórmu-
las de variância da população e da amostra:
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
População Amostra
10884
= = 109,93
100 - 1
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
DESVIO PADRÃO
População Amostra
Medidas de Dispersão
104 UNIDADE III
Exemplo
Considerando a situação exposta acima, em que a variância foi igual a s2 =
109,93, o desvio padrão será:
S = 109,93 = 10,48
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Exercício:
Calcule as medidas de dispersão para dados agrupados considerando a
tabela abaixo:
Tabela 11 - Distribuição de frequências para a idade dos clientes de uma loja em Maringá
CONSIDERAÇÕES FINAIS
Nas pesquisas, após a coleta e organização dos dados, convém verificar o que
ocorre com eles. Nos dados quantitativos, a principal forma de análise é calcu-
lar as medidas de posição e de dispersão.
Nesta unidade, você aprendeu a calcular as principais medidas de Posição e
Dispersão, além das medidas Separatrizes. Vimos que as principais medidas de
posição dentro da estatística são média aritmética, moda, mediana e separatri-
zes. Pelo menos uma dessas medidas sempre deve estar presente na descrição
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Considerações Finais
106
Fonte: as autoras.
Calcule:
a. A média aritmética, a moda e a mediana.
b. A variância, o desvio padrão.
c. O coeficiente de variação (interprete).
d. O 3° quartil e o 4° percentil.
107
Estatística Aplicada
Douglas Downing; Jeffrey Clarck
Editora: Saraiva
Sinopse: este livro aborda assuntos, técnicas estatísticas e suas aplicações, estatística
descritiva, probabilidades, teste de hipóteses, pesquisa e amostragem, regressão
linear simples e múltipla, métodos não-paramétricos, indicadores econômicos e teoria
da decisão. Os capítulos começam com os “Termos-chave”, trazendo um resumo dos
conceitos fundamentais de cada capítulo. A seção “Lembre-se” retoma, ao longo do
estudo, tópicos essenciais a serem fixados, e no “Conheça os conceitos”, encontram-se
exercícios para aplicação do aprendizado.
Material Complementar
REFERÊNCIAS
1.
a) A média é mais utilizada, pois é a medida mais precisa, é única em um con-
junto de dados e sempre existe.
2.
a) A média aritmética: x =95,8 mm
A moda: Mo = 96 mm
A mediana: Md = 96 mm
c) CV = 6,2%. Temos uma baixa dispersão dos dados em torno da média, logo
esta é uma ótima representante do conjunto de dados.
d) Q3 = 101 mm, portanto, 75% dos diâmetros dos eixos estão abaixo de 101 mm.
D6 = 96 mm, portanto, 60% dos diâmetros dos eixos estão abaixo de 96 mm.
3.
a) x = 6,44 dias
Mo = 6,48 dias
Md = 6,5 dias
b) s2 = 33,3 dias2
s = 1,82 dias
IV
UNIDADE
PROBABILIDADES
Objetivos de Aprendizagem
■■ Entender os conceitos relacionados a probabilidades.
■■ Saber aplicar as probabilidades nas diversas situações.
■■ Compreender probabilidade condicional.
■■ Conhecer as principais distribuições de probabilidades.
Plano de Estudo
A seguir, apresentam-se os tópicos que você estudará nesta unidade:
■■ Probabilidade
■■ Distribuição de Probabilidades Discreta
■■ Distribuição de Probabilidades Contínua
115
INTRODUÇÃO
Introdução
116 UNIDADE IV
PROBABILIDADE
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
que gera resultados bem definidos. Os
experimentos aleatórios são aqueles
que, repetidos várias vezes, apre-
sentam resultados imprevisíveis.
Ao descrever um experimento
aleatório, deve-se sempre espe-
cificar o que deverá ser observado.
PROBABILIDADES
117
Face 1 2 3 4 5 6
Frequência 1/6 1/6 1/6 1/6 1/6 1/6
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fonte: as autoras.
Probabilidade
118 UNIDADE IV
Espaço amostral
Chamamos de espaço amostral o conjunto de todos os resultados possíveis de um
experimento. Os elementos do espaço amostral são chamados de pontos amos-
trais. Representamos o espaço amostral por Ω.
Exemplo: considere o lançamento de uma moeda. Os possíveis resulta-
dos (n) são dois: cara (c) ou coroa (k). Então, o espaço amostral é dado por Ω =
{c,k}. Se quisermos lançar a moeda duas vezes, os possíveis resultados são qua-
tro: cara e cara; cara e coroa; coroa e cara; coroa e coroa. Logo, o espaço amostral
é Ω = {cc,ck,kc,kk}.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Eventos
Chamamos de evento um subconjunto do espaço amostral Ω de um experimento
aleatório. O evento é dito simples se consistir em um único resultado, ou com-
posto se consistir em mais de um resultado.
Exemplo
No lançamento de uma moeda Ω = {cara, coroa}. Um evento de interesse A
pode ser “obter cara no lançamento de uma moeda” e então A = {cara} e o n para
este evento será 1, sendo n o número de resultados para o evento.
No lançamento de um dado, o evento de interesse A pode ser obter face par
e então A será igual a:
A = ⎨2; 4, 6⎬ e n = 3.
Probabilidade de um evento
Podemos fazer cálculos de probabilidades utilizando três formas distintas:
■■ Método clássico – quando o espaço amostral tem resultados equiprováveis.
■■ Método empírico – baseado na frequência relativa de um grande número
de experimentos repetidos.
■■ Método subjetivo – baseia-se em estimativas pessoais de probabilidade
com certo grau de crença.
PROBABILIDADES
119
n(A)
P(A) = , para qualquer evento discreto. Ou seja,
Ω
n(E)
P(E) =
Ω
Ω = {1, 2, 3, 4, 5, 6}, n = 6
A = {1, 3, 5}, n = 3
B = {2, 5}, n = 2
Assim,
n(A) 3
P(A) = = = 0, 5 ou, em porcentagem, P(A) = 0,5 x 100 = 50%.
Ω 6
n(B) 2
P(B) = = = 0,33 ou, em porcentagem, P(B) = 0,33 x 100 = 33%.
Ω 6
Probabilidade
120 UNIDADE IV
REGRAS BÁSICAS
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
0, enquanto que um evento certo tem probabilidade 1, assim:
P(Ω) = 1 P(φ)= 0
■■ A soma das probabilidades para todos os resultados experimentais tem
de ser igual a 1.
Assim:
■■ A probabilidade de um ou outro evento ocorrer é dada por P(A∪B).
■■ A probabilidade de ambos os eventos ocorrerem simultaneamente é dada
por P(A∩B).
PROBABILIDADES
121
Regra da adição
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
A B
P(A ∩B)
Probabilidade
122 UNIDADE IV
COMPLEMENTO DE UM EVENTO
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
O cálculo da probabilidade usando o complemento é feito por meio da relação:
Exemplo:
Considere o lançamento de um dado e os seguintes eventos: sair faces pares
(A), sair faces ímpares (B), sair faces cujo valor é maior do que 3 (C). Ou seja,
Ω = {1, 2, 3, 4, 5, 6} n(Ω) = 6
A = {2, 4, 6} n(A) = 3
B = {1, 3, 5} n(B) = 3
C = {4, 5, 6} n(C) = 3
PROBABILIDADES
123
Logo,
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
0
P(A ∩ B) = =0
6
2
P(A ∩ C) = = 0,33
6
6
P(A ∪ B) = =1
6
3
P(Ac) = = 0,5
6
Exercícios
Probabilidade
124 UNIDADE IV
TIPO DE IMÓVEL
REGIÃO TOTAL
APARTAMENTO CASA
Norte 30 28 58
Sul 40 56 96
Leste 38 34 72
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Oeste 52 22 74
Total 160 140 300
Fonte: as autoras.
Considere Norte por N; Sul por S; Leste por L; Oeste por O; Apartamento
por A e Casa por C.
Calcule as seguintes probabilidades:
a. P(N) =
b. P(S) =
c. P(L) =
d. P(O) =
e. P(A) =
f. P(C) =
g. P(N ∩ A) =
h. P(S ∩ C) =
i. P(L ∩ A) =
j. P(O ∩ C) =
k. P(N ∪ A) =
l. P(S ∪ C) =
m. P(L ∪ A) =
n. P(O ∪ C) =
PROBABILIDADES
125
Resposta:
1. Ω = {1, 2, 3, 4, 5, 6}
2.
a. Ω = {(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1)
(5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)}
b. A1 = {(1,1) (2,2) (3,3) (4,4) (5,5) (6,6)}
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
PROBABILIDADE CONDICIONAL
Probabilidade
126 UNIDADE IV
Neste caso, podemos utilizar esta informação extra para realocar probabilida-
des aos outros eventos. Vamos utilizar o exemplo da tabela do exercício anterior.
Tabela 5 - Tipos de imóveis e apartamentos por região
TIPO DE IMÓVEL
REGIÃO TOTAL
APARTAMENTO CASA
Norte 30 28 58
Sul 40 56 96
Leste 38 34 72
Oeste 52 22 74
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Total 160 140 300
Fonte: as autoras.
30
P(N⎥ A) =
160
De forma geral, para dois eventos quaisquer A e B, sendo P(B) > 0, definimos
a probabilidade condicional de A⎥ B como sendo P(A⎥ B) dado pela seguinte
fórmula:
P(A∩B)
P(A⎥ B) =
P(B)
PROBABILIDADES
127
P(A∩B)
P(B⎥ A) =
P(A)
P(N∩A) 30/300
P(N⎥ A) = = = 30 como mostrado acima.
P(A) 160/300 160
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Observe que, se trocarmos a condição para ser do tipo A, dado que a região
é Norte, a condição agora é ser da região Norte e o problema ficaria da seguinte
maneira:
P(N∩A) 30/300
P(N⎥ A) = = = 30
P(N) 58/300 58
Exercícios
Baseado na tabela acima, calcular as seguintes probabilidades:
a. P(S | C) =
b. P(C | S) =
c. P(L | A) =
d. P(A | L) =
e. P(O | C) =
f. P(C | O) =
EVENTOS INDEPENDENTES
Probabilidade
128 UNIDADE IV
Regra da multiplicação
A relação geral mostrada acima foi:
P(A∩B)
P(A⎥ B) =
P(B)
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Observe que a probabilidade de A e B ocorrerem conjuntamente está sob
uma condição, pois a probabilidade de A está sob a condição de B, mostrando
que há uma dependência de uma probabilidade em relação ao evento ocorrido
anteriormente.
Em caso de A e B serem eventos independentes, ou seja, a probabilidade
de um evento não depender da ocorrência do outro evento, nesta condição, a
probabilidade de A e B ocorrer é dada pela probabilidade de A vezes a proba-
bilidade de B.
Exemplo:
Uma urna contém duas bolas brancas e três bolas pretas. Sorteamos duas
bolas ao acaso sem reposição. Isto quer dizer que sorteamos a primeira bola,
verificamos sua cor e não a devolvemos à urna. As bolas são novamente mistu-
radas e sorteamos então a segunda bola. Para resolver as probabilidades nesta
situação, ilustraremos a situação por um diagrama de árvore em que em cada
“galho da árvore” estão indicadas as probabilidades.
PROBABILIDADES
129
Diagrama de árvore
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
RESULTADOS PROBABILIDADES
BB 2/5 x 1/4 = 2/20
BP 2/5 x 3/4 = 6/20
PB 3/5 x 2/4 = 6/20
PP 3/5 x 2/4 = 6/20
Total 1,0
Fonte: as autoras.
Probabilidade
130 UNIDADE IV
Considere agora que vamos fazer o mesmo sorteio, mas repondo a primeira bola
sorteada novamente na urna. Assim, as probabilidades são:
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Figura 2 - Diagrama de árvores para o sorteio de duas bolas com reposição
Fonte: as autoras.
Observe que os cálculos das probabilidades na segunda retirada não ficam con-
dicionados aos resultados da primeira retirada.
PROBABILIDADES
131
RESULTADOS PROBABILIDADES
BB 2/5 x 2/5 = 4/25
BP 2/5 x 3/5 = 6/25
PB 3/5 x 2/5 = 6/25
PP 3/5 x 3/5 = 9/25
Total 1,0
Fonte: as autoras.
Observe que os cálculos das probabilidades na segunda retirada não ficariam con-
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Observe que as probabilidades da segunda retirada não são alteradas pela extra-
ção da primeira bola.
Assim, P(P na 2ª⎥ B na 1ª) = 3/5 = P(P na 2ª ).
Nesse caso, dizemos que o evento A independe do evento B e:
P(A ∩ B) = P(A) . P(B)
Probabilidade
132 UNIDADE IV
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
probabilidades. São elas:
Exercícios:
PROBABILIDADES
133
Resposta:
1. a. 0,278
b. 0,167
c. 0,5
2. a. 0,333
b. 0,667
3. a. 0,333
b. 0,103
c. 0,008
Distribuições De Probabilidade
Os métodos de análise estatística requerem sempre que sejam enfocados certos
aspectos numéricos dos dados (média, desvio padrão, etc.), independentemente
de o experimento originar resultados qualitativos ou quantitativos.
Um meio para descrever, por valores numéricos, os resultados experimen-
tais é o conceito de Variável Aleatória.
Probabilidade
134 UNIDADE IV
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
uma infinita sequência de valores, tais como 0, 1, 2, ..., n.
■■ Contínua: quando pode assumir qualquer valor numérico em um inter-
valo ou associação de intervalos.
PROBABILIDADES
135
DISTRIBUIÇÃO DE BERNOULLI
Deve ficar claro que nem sempre o que é “bom” é o sucesso, mas sim o que se
está estudando. Assim, o fato da peça ser defeituosa, por exemplo, seria o sucesso
da pesquisa em si.
0 → fracasso
X=
1 → sucesso
onde P (X = 0) = q e P(X = 1) = p.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
P(X = k) = pk . q1-k
E(X) = p
Var(X) = pq
σ(X) = pq
Exemplo:
Supondo que a probabilidade de venda amanhã seja de 0,8.
Seja a variável aleatória “vender”, temos que:
■■ A probabilidade de não vender este produto é:
P (X = 0) = q
P(X = 0) = 1 - p
P(X = 0) = 1 - 0,8 = 0,2
Ou seja, 20% de chances de não vender.
■■ A probabilidade de vender este produto é:
P(X = 1) = p
P(X = 1) = 0,8
Ou seja, 80% de chances de vender.
PROBABILIDADES
137
DISTRIBUIÇÃO BINOMIAL
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
n k n-k
P(X = k) = p .q
k
n n!
=
k K! (n - k)!
n n!
P(X = k) = = pk . qn - k
k K! (n - k)!
Em que:
k = número de sucessos.
n = número de elementos da amostra.
p = probabilidade de sucesso.
q = probabilidade de fracasso.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Var(x).....
σ(X) = npq
Exemplos:
Um processo industrial na fabricação de monitores opera com média de 5%
de defeituosos. Baseado em amostras de 10 unidades, calcule as probabilidades
de uma amostra apresentar:
PROBABILIDADES
139
DISTRIBUIÇÃO DE POISSON
Exemplos:
■■ Número de chamadas telefônicas durante 10 minutos.
■■ Número de falhas de uma máquina durante um dia de operação.
■■ Número de acidentes ocorridos numa semana.
■■ Número de mensagens que chegam a um servidor por segundo.
■■ Defeitos por m2, etc.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
λk . e-λ
P(X - k) =
k!
Em que:
■■ λ é a taxa de ocorrência do evento em um intervalo.
■■ k é o número de ocorrências do evento.
■■ e é uma constante matemática e ≈ 2,71828.
2!
PROBABILIDADES
141
0!
1!
2!
P (X ≤ 2) = 0,0067 + 0,0337 + 0,0842 = 0,1246 ou 12,46%
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
As variáveis aleatórias contínuas são aquelas que assumem qualquer valor numé-
rico em um intervalo de números reais. Como este tipo de variável pode assumir
infinitos valores dentro de um intervalo e, por consequência, infinitos valores
de probabilidade, não faz sentido tratar as variáveis contínuas da mesma forma
que são tratadas as variáveis discretas.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Gráfico 1 - Alturas de indivíduos
Fonte: as autoras.
P(a ≤ X • b) = f (x)dx
a
PROBABILIDADES
143
DISTRIBUIÇÃO UNIFORME
Gráfico 2 - Função
Fonte: as autoras.
Sendo que:
1
f(x) = se a≤x≤b
b-a
a+b
E(x) =
2
(b - a)2
Var (x) =
12
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Fonte: as autoras.
X ~ N(μ, σ2)
1
f(x) = e - (x - μ)2 / 2σ 2
σ 2π
PROBABILIDADES
145
Em que:
e = constante matemática (aproximada por 2,71828).
π = constante matemática (aproximada por 3,14159).
μ = média aritmética da população.
σ = desvio padrão da população.
x = qualquer valor da variável aleatória contínua onde -∞ < X < ∞.
Para calcular P(a ≤ X ≤ b) quando X é uma variável aleatória normal com parâ-
metros μ e σ, devemos calcular:
b
1
e - (x - μ)2 / 2σ 2 dx
a
σ 2π
Quando uma variável aleatória tem uma distribuição normal com média
zero e desvio padrão 1, tem uma distribuição normal padrão de probabilidade.
Nenhuma das técnicas de integração padrão pode ser usada para calcular a
integral acima. Assim, quando μ = 0 e σ = 1, essa expressão foi calculada e tabu-
lada para valores determinados de a e b. Nesta tabela, entra-se com a variável
reduzida ou a variável padronizada Z e se encontra f(Z) ou vice-versa.
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
PROBABILIDADES
147
0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Tabela 10 - Tabela de distribuição normal reduzida
Fonte: EEL-USP ([2017], on-line)¹.
Vale ressaltar que tabelas com diferentes integrais calculadas podem ser encon-
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
xi - μ
z=
σ
Em que:
■■ xi = ponto que se deseja converter em z.
■■ μ = média da normal original.
■■ σ = desvio padrão da normal original.
Vejamos o exemplo:
Suponha que a média da taxa de falhas de dados é transmitida em lotes.
Sabe-se que essa característica segue uma distribuição normal com média de 2,0
e desvio padrão igual a 0,5. Calcule, então, as seguintes probabilidades:
■■ De tomarmos um lote ao acaso e este ter uma taxa de falhas entre 2,0 e
2,5. Traduzindo para linguagem probabilística, queremos:
xi - μ
Z= e que μ = 2,0 σ = 0,5
σ
PROBABILIDADES
149
Assim:
2,5 - 2,0
Z= =1
0,5
2,0 - 2,0
Z= =0
0,5
CONSIDERAÇÕES FINAIS
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
chances ou probabilidades de maneira correta e então tomarmos nossas deci-
sões com base em nossas estimativas.
Um efeito importante da teoria da probabilidade no cotidiano está na ava-
liação de riscos. Normalmente, governos, por exemplo, utilizam processos
envolvidos em probabilidades para suas tomadas de decisões. Uma aplicação
importante das probabilidades é a questão da confiabilidade, por exemplo, no
lançamento de algum produto, nas chances deles falharem.
Para inferir sobre probabilidades, é necessário saber que tipo de variável
aleatória está sendo trabalhada. Cada variável aleatória possui um tipo de com-
portamento chamado de distribuição de probabilidades. Isso é importante, pois
cada distribuição de probabilidade possui algumas características e elas devem
ser respeitadas para que se possa chegar a resultados precisos e então conclu-
sões válidas possam ser tomadas sobre aquilo que estamos estudando. Vimos,
nesta unidade, os conceitos básicos de probabilidade, a forma clássica de calcu-
lá-la e também vimos as principais distribuições de probabilidades utilizadas.
Deve-se entender que é razoável pensar ser de extrema importância com-
preender como estimativas de chance e probabilidades são feitas e como elas
contribuem para reputações e decisões em nossa sociedade.
PROBABILIDADES
151
REFERÊNCIAS ON-LINE
2.
a. 0,53 + 0,35 = 0,88 ou 88%
b. 0,0145 ou 1,45%
c. 0,53 ou 53%....
d. Média = 0,6. Variância = 0,54
3.
a. Ter resistência alta a arranhões 840/1000
b. Ter resistência baixa a arranhões 160/1000
c. Ser aprovado na avaliação das trilhas 800/1000
d. Ser reprovado na avaliação das trilhas 200/1000
840 + 800 - 700
e. Ter resistência alta ou ser aprovado p(a∪ap) = = 940/1000
1000
160 + 200 - 60
f. Ter resistência baixa ou ser reprovado p(b∪r) = = 300/1000
1000
g. Ter resistência alta dado que seja reprovado p(a/r) = 140/200
h. Ter resistência baixa dado que seja aprovado 100/800
4.
2,71828-80 . 80100
P (X) = =0,0039 ou 0,39%
100!
E(x) = 80
Var (x) = 80
5.
a. 0,4332 ou 43,32%
b. 0,0668
c. 0,3413 + 0,4332 = 0,77 ou 77%
d. 0,8413 ou 84,13%
Professora Me. Ivnna Gurniski de Oliveira
Professora Me. Renata Cristina de Souza Chatalov
CORRELAÇÃO LINEAR E
V
UNIDADE
REGRESSÃO
Objetivos de Aprendizagem
■■ Conhecer o coeficiente de correlação linear.
■■ Entender associação entre duas variáveis.
■■ Saber interpretar correlação positiva e negativa.
■■ Compreender a correlação e aplicação da correlação de Pearson.
■■ Conhecer a utilização da regressão linear.
■■ Entender a predição de uma variável por meio de outra.
Plano de Estudo
A seguir, apresentam-se os tópicos que você estudará nesta unidade:
■■ Correlação Linear
■■ Regressão Linear
159
INTRODUÇÃO
Introdução
160 UNIDADE V
CORRELAÇÃO LINEAR
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
entre duas variáveis aleatórias, mas é mais conveniente medir o grau da correla-
ção por meio do Coeficiente de Correlação Linear de Pearson.
r=
Correlação Linear
162 UNIDADE V
Exemplo:
Verifique se existe correlação linear entre o número de nascidos vivos e a
taxa de mortalidade infantil na região de Maringá-PR.
Tabela 01 - Taxa de Mortalidade Infantil em municípios da região de Maringá
TOTAL MENOR DE
REGIONAL DE SAÚDE E MUNICÍPIOS NASCIDOS VIVOS (X) *
01 ANO (Y)
Astorga 289 6
Colorado 246 2
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Floresta 68 1
Itambé 67 1
Mandaguaçu 251 4
Mandaguari 423 6
Marialva 378 5
Nova Esperança 423 9
Paiçandu 443 4
São Jorge do Ivaí 59 0
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informação em Saúde (2002, on-line).
Gráfico 04 - Dispersão da taxa de mortalidade até 1 ano e o número de nascidos vivos na região de Maringá
Fonte: adaptado de SESA/ISEP/CIDS - Departamento de Sistemas de Informação em Saúde (2002, on-line).
Por meio do diagrama de dispersão, podemos notar que há uma variação cres-
cente entre as duas variáveis.
As maiores correlações positivas e negativas são obtidas somente quando
todos os pontos estão bem próximos a uma linha reta.
O próximo passo é calcular o coeficiente de correlação entre as duas variá-
veis. Podemos utilizar uma tabela para organizar os dados:
Tabela 02 - Nascidos Vivos das Cidades Metropolitanas de Maringá
NASCIDOS TAXA DE
CIDADE X.Y X2 Y2
VIVOS (X) MORTALIDADE (Y)
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
r= = 0,84
Observe que o valor do coeficiente de correlação foi 0,84. Assim, podemos con-
cluir que existe uma forte correlação ou associação entre o número de nascidos
vivos e a taxa de mortalidade antes de 1 ano de idade, uma vez que o valor 0,84
é um valor próximo de 1. Em seguida, podemos verificar que, como mostrado
Correlação Linear
164 UNIDADE V
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
ar entre variáveis.
COEFICIENTE DE DETERMINAÇÃO
REGRESSÃO LINEAR
Regressão Linear
166 UNIDADE V
ŷ = a + bx em que
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
O coeficiente de regressão “b” fornece uma estimativa da variação esperada
de y a partir da variação de uma unidade em x (BARBETTA et al., 2010).
A partir dessa equação, é possível encontrar os valores preditos para y e a
reta de regressão. Além disso, a relação entre x e y pode ser mostrada por um
diagrama de dispersão. Vejamos o diagrama de dispersão abaixo, mostrando a
relação entre as variáveis x e y, bem como o exemplo de uma reta de regressão.
O método mais usado para ajustar uma linha reta a um conjunto de pontos
é conhecido como método dos mínimos quadrados que nos fornece os seguin-
tes resultados para estimarmos a e b:
b= e a = y - bx
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
TOTAL MENOR
REGIONAL DE SAÚDE E MUNICÍPIOS NASCIDOS VIVOS *
DE 01 ANO
Astorga 289 6
Colorado 246 2
Floresta 68 1
Itambé 67 1
Mandaguaçu 251 4
Mandaguari 423 6
Marialva 378 5
Nova Esperança 423 9
Paiçandu 443 4
São Jorge do Ivaí 59 0
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informação em Saúde (2002, on-line).
Regressão Linear
168 UNIDADE V
TAXA DE
CIDADE NASCIDOS VIVOS (X) X.Y X2
MORTALIDADE (Y)
Astorga 289 6 1734 83521
Colorado 246 2 492 60516
Floresta 68 1 68 4624
Itambé 67 1 67 4489
Mandaguaçu 251 4 1004 63001
Mandaguari 423 6 2538 178929
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
Marialva 378 5 1890 142884
Nova Esperança 423 9 3807 178929
Paiçandu 443 4 1772 196249
São Jorge do Ivaí 59 0 0 3481
Soma 2647 38 13372 916623
Fonte: adaptada de SESA/ISEP/CIDS - Departamento de Sistemas de Informação em Saúde (2002, on-line).
(2647 . 38)
13372 -
10
b= = 0,015
2647 2
916623 -
10
2647 38
x= = 264,7 y= = 3,8
10 10
ŷ = - 0,17 + 0,015x
Para cada número de nascidos vivos, temos uma taxa de mortalidade prevista.
A representação gráfica para esta situação pode ser observada no diagrama de
dispersão abaixo.
Gráfico 06 - Diagrama de dispersão para a taxa de mortalidade prevista em função do número de nascidos vivos
Fonte: as autoras.
Regressão Linear
170 UNIDADE V
Observe que, para cada número de nascidos vivos, foi construída uma equação
e obtida uma taxa de mortalidade prevista. No gráfico 2, é mostrada a reta que
descreve os dados e, a título de exemplificação, foi mostrado um ponto no grá-
fico em que o número de nascidos vivos (disposto no eixo x) foi 378 e a taxa de
mortalidade (disposta no eixo y) prevista é de 5,41.
Vimos que a correlação linear de Pearson mostrou um valor alto para a rela-
ção entre o número de nascidos vivos e a taxa de mortalidade (0,84), e que foi
verificada uma correlação populacional acima de “0”. Na análise de regressão,
utilizamos, também, o coeficiente de determinação para verificar a precisão da
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
reta de regressão e dizer se ela explica bem ou não a variação dos dados.
Como vimos:
R2 = 0,7056
Gráfico 07 - Diagrama de dispersão para a taxa de mortalidade prevista e taxa de mortalidade observada em
função do número de nascidos vivos
Fonte: as autoras.
Exercícios:
Resultado de um teste (de 0 a 100) sobre conhecimento (X) e tempo gasto
(minutos) para aprender a operar uma máquina (Y) para oito indivíduos.
Tabela 06 - Tempo gasto para operação de uma máquina
A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375
Fonte: as autoras.
Regressão Linear
172 UNIDADE V
Responda:
Reprodução proibida. Art. 184 do Código Penal e Lei 9.610 de 19 de fevereiro de 1998.
y preditos.
R: 2) a = 316,462 e b = 0,548
A análise de regressão também pode ser feita com várias variáveis indepen-
dentes sobre uma única variável dependente. A esse tipo de análise damos o
nome de análise de regressão múltipla, que é muito utilizada em aplicações
financeiras como renda, poupança e juros. Para ver um exemplo, leia o livro
Estatística para os cursos de engenharia e informática de Pedro Barbetta.
Fonte: Barbetta (2010, p. 346).
CONSIDERAÇÕES FINAIS
deve-se levar em conta 2 ou mais variáveis. Dentre esse estudo, o principal obje-
tivo é investigar a existência ou não de relação entres essas variáveis, quantificando
a força dessa relação por meio da correlação, ou explicitando a forma dessa rela-
ção por meio da regressão.
As correlações podem ser Positivas, quando o aumento de uma variável cor-
responde ao aumento da outra; Negativas, quando o aumento de uma variável
corresponde à diminuição da outra; Lineares, quando é possível ajustar uma reta,
que podem ser fortes (quanto mais próximas da reta) ou fracas (quanto menos
próximas da reta), e ainda Não Lineares, quando não é possível ajustar uma reta.
Após estabelecida uma relação linear e uma boa correlação entre as variá-
veis, deve-se, agora, determinar uma fórmula matemática para fazer predições
de uma das variáveis por meio da outra, e a essa técnica damos o nome de aná-
lise de regressão.
É importante entender que nem sempre duas variáveis estão de fato asso-
ciadas. Para isso, há necessidade da avaliação do coeficiente de determinação
na análise de regressão. É, também, importante termos bom senso na hora de
calcular algumas medidas, uma vez que estamos trabalhando com fórmulas
matemáticas para explicar fenômenos. Assim, sempre algum valor será extraído
numericamente, porém, nem sempre esses valores podem ser explicados biologi-
camente ou socialmente. Portanto, cabe ao pesquisador escolher quais variáveis
devem participar das análises.
Considerações Finais
174
Fonte: as autoras.
2. Uma pesquisa foi realizada para verificar o efeito da área (m2) sobre o preço de
terrenos na cidade de Mogi Mirim-SP. Considere a equação y = 20 + 0,5x para
estimar os preços em função da área. Considerando terrenos com 200, 300 e
400 m2, estime o preço de cada terreno.
3. É esperado que a massa muscular de uma pessoa diminua com a idade. Para
estudar essa relação, uma nutricionista selecionou 18 mulheres, com idade entre
40 e 79 anos, e observou em cada uma delas a idade (X) e a massa muscular (Y).
Determine a correlação linear entre a idade a massa muscular.
Relação entre massa muscular e idade
MASSA MUSCULAR (Y) IDADE (X)
82.0 71.0
91.0 64.0
100.0 43.0
68.0 67.0
87.0 56.0
73.0 73.0
78.0 68.0
80.0 56.0
65.0 76.0
84.0 65.0
116.0 45.0
76.0 58.0
97.0 45.0
100.0 53.0
105.0 49.0
77.0 78.0
73.0 73.0
78.0 68.0
Fonte: as autoras.
176
A maior parte dos estudos que visa associar o consumo de sódio à hipertensão arterial
utiliza a excreção urinária de sódio de 24h como marcador diário e em muitos há uma
consistente relação. Evidências sobre a associação do consumo de sódio e hipertensão
foram relatadas também pelo INTERSALT Group, principalmente quando foram avalia-
das as diferenças nas prevalências de hipertensão arterial associadas ao nível de indus-
trialização das populações estudadas. Populações ocidentais e com alto consumo de
sal apareceram como tendo os maiores percentuais de hipertensão, enquanto as popu-
lações rurais ou primitivas que não faziam uso de sal de adição apresentaram menores
prevalências ou nenhum caso de hipertensão arterial. Porém, o sobrepeso e o seden-
tarismo, presentes nessas populações, podem ser importantes variáveis de confusão.
Outros estudos foram conduzidos nesta direção em várias populações com objetivo de
comprovar a hipótese de que uma grande ingestão de sal na dieta aumenta os níveis
pressóricos, independentemente da idade e de outros fatores, hoje já bem estabeleci-
dos.
Fonte: Bisi Molina et al. (2003)
MATERIAL COMPLEMENTAR
Estatística Básica
Wilton de O. Bussab, Pedro A. Morettin
Editora: Saraiva
Sinopse: O livro trata da estatística básica e é dividido em três partes. A primeira trata
da análise de dados unidimensionais e bidimensionais, com atenção especial para
métodos gráficos. A segunda parte trata dos conceitos básicos de probabilidades
e variáveis aleatórias. Por fim, a terceira parte estuda os tópicos principais da
interferência estatística, além de alguns temas especiais, como regressão linear
simples.
179
REFERÊNCIAS
1.
a. A variável independente é o comprimento do cabo x e a variável dependente
é a variável taxa de falhas y, ou seja, a taxa de falhas depende do comprimen-
to do cabo.
b. 0,47 – verifica-se uma correlação mediana e positiva entre as duas variáveis
a, mostrando que, quanto maior o comprimento do cabo, maior a taxa de
falhas.
c. tc = 2,17 ttabelado = 3,06
tc < ttabelado conclui-se que não existe significância na correlação entre as duas
variáveis em nível de 1% de erro.
d. Correlação substancial entre as duas variáveis.
e. b = 2,4 a = -15,2
f.
COMPRIMENTO DO CABO (M) Ŷ
8 4,08
9 6,49
10 8,9
11 11,31
12 13,72
13 16,13
14 18,54
15 20,95
g. Diagrama de dispersão
3. -0,837.
CONCLUSÃO
Caro(a) aluno(a)!
Este material foi feito para contribuir com seu processo de formação. Atualmente,
as informações chegam a nós de forma rápida e não podemos deixar de pensar o
quanto a Estatística é útil para quem precisa tomar decisões.
Nesse sentido, a Estatística aparece como suporte na compreensão dos fatos, dando
base para o seu entendimento e compreensão adequada para eles.
Este material tratou de alguns pontos importantes no ensino da Estatística. O pri-
meiro ponto tratou da importância da Estatística, dos seus conceitos e da aplicação
de algumas de suas ferramentas. Em qualquer pesquisa, seja ela de ordem observa-
cional ou experimental, utilizamos a Estatística.
Na unidade II, foram discutidas formas de apresentação dos dados estatísticos, mais
especificamente a estruturação e a interpretação de gráficos e tabelas.
A unidade III tratou das medidas descritivas, mostrou como devemos calculá-las e
onde devemos aplicá-las. Vimos as principais medidas de posição, as separatrizes e
as medidas de dispersão.
Na unidade IV, trabalhamos com parte da teoria das probabilidades e algumas de
suas principais distribuições. As distribuições de probabilidades, vistas também nes-
sa unidade, lida com probabilidades, porém associadas ao tipo de variável aleatória
em questão. Para utilizarmos qualquer distribuição, é necessário saber se a variável
aleatória numérica é contínua, discreta.
Finalizando o material, a unidade V tratou das medidas de associação, duas ferra-
mentas importantes dentro da estatística. Tanto a correlação quanto a regressão
envolvem associação entre variáveis, embora a função de cada uma delas seja dife-
rente. Na correlação, tem-se o grau de associação entre as duas variáveis; na regres-
são, o que se obtém é estimação de uma variável por meio da outra. Entender como
duas variáveis se relacionam é importante dentro da análise de dados. Alguns cri-
térios devem ser seguidos, entretanto, ao se trabalhar com regressão ou correlação,
essas medidas só podem ser utilizadas em casos de variáveis quantitativas.
Professora Me. Ivnna Gurniski de Oliveira
Professora Me. Renata Cristina de Souza Chatalov