Lineaarne korrelatsioonikordaja
Ilme
See artikkel vajab toimetamist. (Juuni 2009) |
Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)
Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.
Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.
Matemaatiline definitsioon
[muuda | muuda lähteteksti]Lineaarne korrelatsioonikordaja r avaldub kujul[1]ː
,
kus n on juhuslike suuruste X ja Y väärtuste ja paaride arv (valimi maht), ja aritmeetilised keskmised ning ja vastavad standardhälbed.
Omadused
[muuda | muuda lähteteksti]- Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
- Kui tunnused on kasvavalt seotud on r>0.
- Kui tunnused on kahanevalt seotud, on r<0.
- Kui tunnused on sõltumatud, siis r =0.
- Nõrk seos: kordaja |r|< kui 0.3
- Keskmine seos: kordaja 0.3< |r| < 0.7.
- Tugev seos: kordaja |r|> 0.7.
Puudused
[muuda | muuda lähteteksti]- Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
- Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
- Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.
Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.
Vaata ka
[muuda | muuda lähteteksti]Viited
[muuda | muuda lähteteksti]- ↑ Ako Sauga (2020). Statistika õpik majanduseriala üliõpilastele. Tallinn: Tallinna Tehnikaülikooli kirjastus. Lk 398. ISBN 978-9949-83-519-5.