Mine sisu juurde

Lineaarne korrelatsioonikordaja

Allikas: Vikipeedia

Lineaarne korrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja r kasutab hajuvusdiagrammi informatsiooni ning on kõige levinum kordaja. Excel'is r = CORREL(X,Y)

Korrelatsioonikordaja r omab tähendust vaid pidevatele ja normaaljaotusega tunnustele.

Mida lähemal on r absoluutväärtus ühele, seda tugevamalt on tunnused omavahel seotud.

Matemaatiline definitsioon

[muuda | muuda lähteteksti]

Lineaarne korrelatsioonikordaja r avaldub kujul[1]ː

,

kus n on juhuslike suuruste X ja Y väärtuste ja paaride arv (valimi maht), ja aritmeetilised keskmised ning ja vastavad standardhälbed.

  • Väärtus asub lõigus –1 kuni 1 -1≤r≤1.
  • Kui tunnused on kasvavalt seotud on r>0.
  • Kui tunnused on kahanevalt seotud, on r<0.
  • Kui tunnused on sõltumatud, siis r =0.
  • Nõrk seos: kordaja |r|< kui 0.3
  • Keskmine seos: kordaja 0.3< |r| < 0.7.
  • Tugev seos: kordaja |r|> 0.7.
  • Mõjutub erinditest (paar erindit võivad “venitada” kordaja suureks, kuigi tegelikult on seos nõrk) – erind välja jätta
  • Mõjutub kolmandast tunnusest ehk punktid moodustavad mingi kolmanda tunnuse suhtes tõusva (langeva) pilve – uurida kordajaid kolmanda tunnuse väärtuste kaupa
  • Tunneb ära vaid lineaarse seose, muu seose korral (ruutfunktsionaalne seos vms) võib anda tulemuseks nõrga või olematu sõltuvuse.

Kõigil juhtudel on üldjuhul probleem nähtav hajuvusdiagrammilt.

  1. Ako Sauga (2020). Statistika õpik majanduseriala üliõpilastele. Tallinn: Tallinna Tehnikaülikooli kirjastus. Lk 398. ISBN 978-9949-83-519-5.