Suurima tõepära meetod

Suurima tõepära meetod on statistikas laialt kasutatav meetod hinnangute leidmiseks. Suurima tõepära meetod on üldjuhul efektiivsem kui muud levinud meetodid.[1]

Põhikomponendid

muuda

Olgu antud valim   jaotusest  , mis võib olla kas pidev või diskreetne. Tõepärafunktsiooniks nimetame avaldist

 

kus   tähistab jaotuse   tihedusfunktsiooni (pideval juhul) ja   tähistab   tõenäosusfunktsiooni (diskreetsel juhul),  .[1]

Olgu   sõltumatud suurused ja  , siis   on valimi   saamise tõenäosus (diskreetsel juhul) või juhusliku vektori   tihedusfunktsiooni väärtus punktis   (pideval juhul) antud   korral. Realiseerunud valimi   korral on suurused   teadaolevad arvud ja   on üksnes parameetri   funktsioon. Eesmärgiks on leida niisugune   väärtus parameeterruumist  , et   oleks maksimaalne. Ütleme, et vastav   väärtus on kõige tõepärasem vaadeldava valimi jaoks (st ka vastav üldkogumi jaotus on kõige tõepärasem vaadeldava valimi jaoks).

Suurima tõepära printsiip – kõige tõepärasema üldkogumijaotuse määramine antud valimi jaoks.

Väärtust  , mida maksimeeritakse parameeterruumis   (  saavutab maksimaalse väärtuse), nimetatakse parameetri   suurima tõepära hinnanguks:

 

Kui tahta leida suurima tõepära hinnangut praktiliselt, on tihti lihtsam kasutada tõepärafunktsiooni logaritmi. Logaritmi monotoonsuse tõttu saavutavad   ja   maksimumi samas punktis, st määravad sama suurima tõepära hinnangu.

Logaritmiline tõepärafunktsioon on

 [1]

Näited

muuda

Näide 1: Mündivise. Üldkogumijaotuseks on mündi visketulemuse (vapp, kiri) jaotus, kus vapi tulemise tõenäosuseks on   ja kirja tulemise tõenäosuseks  . Olgu eelnevalt teada, et   Olgu meil kaks vaatlust:   = vapp ja   = vapp. Kumb on tõepärasem hinnang parameetrile p, kas   või   Kirjutame välja tõepärafunktsiooni:

 

millest saame, et  .

Kuna  , siis   on suurima tõepära hinnang  -le.[1]

Näide 2: Olgu üldkogumijaotus eksponentjaotusest   parameetriga   . Jaotusele vastav tihedusfunktsioon on

 

Olgu parameeter   tundmatu. Pole raske näidata, et   on antud jaotuse keskväärtus. Olgu meil   vaatlust jaotusest:

 

Leiame tõepärafunktsiooni

 

ja logaritmilise tõepärafunktsiooni:

 

Paneme tähele, et tõepärafunktsioonid on   funktsioonid. Mõlemad funktsioonid saavutavad maksimumi samal kohal, kuna logaritmfunktsioon on monotoonselt kasvav. Maksimumi leidmiseks leiame tuletise,

 

Tuletise võrdsustamisel nulliga saame logaritmilise tõepärafunktsiooni maksimumpunkti, mis on ühtlasi parameetri   suurima tõepära hinnanguks,  .[1]

Hinnang logistilise regressiooni korral

muuda

Logistilise regressiooni korral avaldub suurima tõepära hinnang järgmiselt:

 

kus   on tõepära hinnang,   on vaadeldav väärtus  -l juhul ja   on ennustatud tõenäosus  -l juhul.   väärtused tulevad logistilise regressiooni mudelist ja valemist  , kus   on log-šansid, mis on määratud vabaliikme ja parameetri väärtuste   poolt. Eesmärk on leida   väärtused, mille tulemusel saadakse   ja   väärtused, mis maksimeerivad  -i.[2]

Viited

muuda
  1. 1,0 1,1 1,2 1,3 1,4 Lepik, Natalja. (2017). Tõenäosusteooria ja statistika II. Loengukonspekt. Kasutatud 19.03.2018.
  2. Pampel F. C. (2000). Logistic Regression. Aprimer. CA Sage: Thousand Oaks.