Correlação
Correlação
Correlação
1. Introdução
• Quando consideramos variáveis como peso e altura de um grupo de
pessoas, uso do cigarro e incidência do câncer, vocabulário e
compreensão da leitura, procuramos verificar se existe alguma
relação entre as variáveis e qual o grau dessa relação.
• Sendo a relação entre as variáveis de natureza quantitativa, o
instrumento adequado para descobrir e medir essa relação é a
correlação.
• O estudo da relação entre duas variáveis qualitativas pode ser feito
pelo teste Qui-Quadrado (veremos mais adiante).
1. Introdução
• Uma vez caracterizada a relação, procuramos descrevê-la através de
uma função matemática. A regressão é o instrumento adequado para
a determinação dos parâmetros dessa função.
Aluno (nº) 1 8 25 30 12
Nº de Faltas (X) 2 6 60 6 0
Notal Final (Y) 10,0 7,0 0,0 8,0 9,0
2. Gráfico: Diagrama de Dispersão
12
10
8
Nota Final
6
4
2
0
0 20 40 60 80
Nº de Faltas
Não há Correlação
3. Coeficiente de correlação linear de Pearson (r)
O coeficiente de correlação foi proposto por Karl Pearson em
1896.
Mede o grau de associação linear entre duas variáveis
quantitativas (X, Y), e ainda, o sentido dessa correlação (positivo ou
negativo). O coeficiente de correlação de Pearson é dado por:
σ𝑥 × σ𝑦
σ 𝑥𝑦 −
𝑟= 𝑛
σ 𝑥 2 σ 𝑦 2
σ 𝑥2 − × σ 𝑦2 −
𝑛 𝑛
n é o número de observações (pares ordenados).
O coeficiente de correlação (r) varia entre -1 e +1.
Calcule o coeficiente de correlação de Pearson para os dados
abaixo:
Nº de faltas (X) Nota final (Y)
2 10
6 7
60 0 𝑛=5
6 8
0 9
74 × 34
110 − −393,2 −393,2
𝑟= 5 = = = −0,977
742 342 2580,8 × 62,8 402,58
3676 − × 294 −
5 5
Nota
4 4
2 2
0 0
0 2 4 6 8 10 0 2 4 6 8 10
Horas de Estudo Nº de Faltas
Nota
6 6
4 4
2 2
0 0
0 2 4 6 8 10 0 2 4 6 8 10
Horas de Estudo Nº de Faltas
5
34
4 31
Temperatua
3 28
Y
2 25
22
1 19
0 16
0 2 4 6 8 10 0 5 10 15 20 25
X Hora