Suurima tõepära meetod on statistikas laialt kasutatav meetod hinnangute leidmiseks. Suurima tõepära meetod on üldjuhul efektiivsem kui muud levinud meetodid.[1]
Olgu antud valim jaotusest , mis võib olla kas pidev või diskreetne. Tõepärafunktsiooniks nimetame avaldist
kus tähistab jaotuse tihedusfunktsiooni (pideval juhul) ja tähistab tõenäosusfunktsiooni
(diskreetsel juhul), .[1]
Olgu sõltumatud suurused ja , siis on valimi saamise tõenäosus (diskreetsel juhul) või juhusliku vektori tihedusfunktsiooni
väärtus punktis (pideval juhul) antud korral.
Realiseerunud valimi korral on suurused teadaolevad arvud ja on üksnes
parameetri funktsioon. Eesmärgiks on leida niisugune väärtus parameeterruumist
, et oleks maksimaalne. Ütleme, et vastav väärtus on kõige tõepärasem vaadeldava valimi
jaoks (st ka vastav üldkogumi jaotus on kõige tõepärasem vaadeldava valimi jaoks).
Suurima tõepära printsiip – kõige tõepärasema üldkogumijaotuse määramine antud valimi jaoks.
Väärtust , mida maksimeeritakse parameeterruumis ( saavutab maksimaalse
väärtuse), nimetatakse parameetri suurima tõepära hinnanguks:
Kui tahta leida suurima tõepära hinnangut praktiliselt, on tihti lihtsam kasutada tõepärafunktsiooni logaritmi. Logaritmi monotoonsuse tõttu saavutavad ja maksimumi samas
punktis, st määravad sama suurima tõepära hinnangu.
Logaritmiline tõepärafunktsioon on
- [1]
Näide 1: Mündivise. Üldkogumijaotuseks on mündi visketulemuse (vapp, kiri) jaotus,
kus vapi tulemise tõenäosuseks on ja kirja tulemise tõenäosuseks . Olgu eelnevalt teada, et Olgu meil kaks
vaatlust: = vapp ja = vapp. Kumb on tõepärasem hinnang parameetrile p, kas või Kirjutame välja tõepärafunktsiooni:
millest saame, et .
Kuna , siis on suurima tõepära hinnang -le.[1]
Näide 2: Olgu üldkogumijaotus eksponentjaotusest parameetriga . Jaotusele vastav tihedusfunktsioon on
Olgu parameeter tundmatu. Pole raske näidata, et on antud jaotuse keskväärtus.
Olgu meil vaatlust jaotusest:
Leiame tõepärafunktsiooni
ja logaritmilise tõepärafunktsiooni:
Paneme tähele, et tõepärafunktsioonid on funktsioonid. Mõlemad funktsioonid saavutavad maksimumi
samal kohal, kuna logaritmfunktsioon on monotoonselt kasvav.
Maksimumi leidmiseks leiame tuletise,
Tuletise võrdsustamisel nulliga saame logaritmilise tõepärafunktsiooni maksimumpunkti, mis on ühtlasi parameetri
suurima tõepära hinnanguks, .[1]
Logistilise regressiooni korral avaldub suurima tõepära hinnang järgmiselt:
kus on tõepära hinnang, on vaadeldav väärtus -l juhul ja on ennustatud tõenäosus -l juhul. väärtused tulevad logistilise regressiooni mudelist ja valemist , kus on log-šansid, mis on määratud vabaliikme ja parameetri väärtuste poolt. Eesmärk on leida väärtused, mille tulemusel saadakse ja väärtused, mis maksimeerivad -i.[2]