Mine sisu juurde

Suurima tõepära meetod

Allikas: Vikipeedia

Suurima tõepära meetod on statistikas laialt kasutatav meetod hinnangute leidmiseks. Suurima tõepära meetod on üldjuhul efektiivsem kui muud levinud meetodid.[1]

Põhikomponendid

[muuda | muuda lähteteksti]

Olgu antud valim jaotusest , mis võib olla kas pidev või diskreetne. Tõepärafunktsiooniks nimetame avaldist

kus tähistab jaotuse tihedusfunktsiooni (pideval juhul) ja tähistab tõenäosusfunktsiooni (diskreetsel juhul), .[1]

Olgu sõltumatud suurused ja , siis on valimi saamise tõenäosus (diskreetsel juhul) või juhusliku vektori tihedusfunktsiooni väärtus punktis (pideval juhul) antud korral. Realiseerunud valimi korral on suurused teadaolevad arvud ja on üksnes parameetri funktsioon. Eesmärgiks on leida niisugune väärtus parameeterruumist , et oleks maksimaalne. Ütleme, et vastav väärtus on kõige tõepärasem vaadeldava valimi jaoks (st ka vastav üldkogumi jaotus on kõige tõepärasem vaadeldava valimi jaoks).

Suurima tõepära printsiip – kõige tõepärasema üldkogumijaotuse määramine antud valimi jaoks.

Väärtust , mida maksimeeritakse parameeterruumis ( saavutab maksimaalse väärtuse), nimetatakse parameetri suurima tõepära hinnanguks:

Kui tahta leida suurima tõepära hinnangut praktiliselt, on tihti lihtsam kasutada tõepärafunktsiooni logaritmi. Logaritmi monotoonsuse tõttu saavutavad ja maksimumi samas punktis, st määravad sama suurima tõepära hinnangu.

Logaritmiline tõepärafunktsioon on

[1]

Näide 1: Mündivise. Üldkogumijaotuseks on mündi visketulemuse (vapp, kiri) jaotus, kus vapi tulemise tõenäosuseks on ja kirja tulemise tõenäosuseks . Olgu eelnevalt teada, et Olgu meil kaks vaatlust: = vapp ja = vapp. Kumb on tõepärasem hinnang parameetrile p, kas või Kirjutame välja tõepärafunktsiooni:

millest saame, et .

Kuna , siis on suurima tõepära hinnang -le.[1]

Näide 2: Olgu üldkogumijaotus eksponentjaotusest parameetriga . Jaotusele vastav tihedusfunktsioon on

Olgu parameeter tundmatu. Pole raske näidata, et on antud jaotuse keskväärtus. Olgu meil vaatlust jaotusest:

Leiame tõepärafunktsiooni

ja logaritmilise tõepärafunktsiooni:

Paneme tähele, et tõepärafunktsioonid on funktsioonid. Mõlemad funktsioonid saavutavad maksimumi samal kohal, kuna logaritmfunktsioon on monotoonselt kasvav. Maksimumi leidmiseks leiame tuletise,

Tuletise võrdsustamisel nulliga saame logaritmilise tõepärafunktsiooni maksimumpunkti, mis on ühtlasi parameetri suurima tõepära hinnanguks, .[1]

Hinnang logistilise regressiooni korral

[muuda | muuda lähteteksti]

Logistilise regressiooni korral avaldub suurima tõepära hinnang järgmiselt:

kus on tõepära hinnang, on vaadeldav väärtus -l juhul ja on ennustatud tõenäosus -l juhul. väärtused tulevad logistilise regressiooni mudelist ja valemist , kus on log-šansid, mis on määratud vabaliikme ja parameetri väärtuste poolt. Eesmärk on leida väärtused, mille tulemusel saadakse ja väärtused, mis maksimeerivad -i.[2]

  1. 1,0 1,1 1,2 1,3 1,4 Lepik, Natalja. (2017). Tõenäosusteooria ja statistika II. Loengukonspekt. Kasutatud 19.03.2018.
  2. Pampel F. C. (2000). Logistic Regression. Aprimer. CA Sage: Thousand Oaks.