Keskeinen raja-arvolause
Keskeinen raja-arvolause on todennäköisyyslaskennan tulos, jonka mukaan keskiarvo riittävän suuresta määrästä toisistaan riippumattomia satunnaismuuttujia, joista kullakin on hyvin määritelty odotusarvo ja varianssi, on tietyin edellytyksin likipitäen normaalisti jakautunut riippumatta kunkin satunnaismuuttujan omasta jakaumasta.[1][2]
Lausetta voi havainnollistaa muodostamalla suuren määrän havaintoja käsittävä otos, jossa kukin havainto on generoitu satunnaisesti muista havaintokerroista riippumatta. Tämän jälkeen lasketaan otoksen eli havaintojen keskiarvo. Jos tämä toistetaan monta kertaa, keskeisen raja-arvolauseen mukaan niiden keskiarvo jakautuu todennäköisesti sitä tarkemmin normaalijakauman eli niin sanotun kellokäyrän mukaisesti. Esimerkiksi jos kolikkoa heitetään erittäin monta kertaa, todennäköisyys saada kruuna tietyllä määrällä kertoja noudattaa normaalijakaumaa, jonka odotusarvo on puolet heittojen lukumäärästä.
Keskeisestä raja-arvolauseesta on monia muunnelmia. Sen kauimmin tunnettu muoto edellyttää, että satunnaismuuttujat, joiden keskiarvoa tarkastellaan, ovat samoin jakautuneet. Satunnaismuuttujien keskiarvo kuitenkin suppenee kohti normaalijakaumaa tietyin edellytyksin useissa sellaisissakin tapauksissa, joissa ne eivät ole samoin jakautuneet eivätkä edes toisistaan riippumattomat.
Yleisimmässä mielessä keskeiset raja-arvolauseet ovat koko joukko todennäköisyyslaskennan raja-arvolauseita. Ne kaikki ilmaisevat eri tavoin, että monen riippumattoman ja identtisesti jakautuneen tai tietyin edellytyksin myös tavalla tai toisella toisistaan riippuvankin satunnaismuuttujan summalla on taipumus noudattaa jakaumaa, joka kuuluu pieneen joukkoon attraktorijakaumaa. Kun riippumattomien ja identtisten jakautuneiden satunnaismuuttujien varianssi on äärellinen, tämä attraktorijakauma on normaalijakauma. Sitä vastoin jos muodostetaan sellaisten satunnaismuuttujien summa, joilla on potenssilain mukainen, funktion |x|-α-1 mukaisesti (0 < α < 2) pienenevä "häntä" ja joiden varianssi näin ollen on ääretön, se suppenee kohti alfa-vakaata jakaumaa, jonka vakausparametri muuttujien lukumäärän kasvaessa on α[3]
Tilastotieteessä keskeisellä raja-arvolauseella on perustava merkitys käsiteltäessä suuria otoksia jostakin aineistosta. Sen sijaan pieniä otoksia käsiteltäessä se ei ole yhtä käyttökelpoinen.[4]
Keskeisiä raja-arvolauseita riippumattomille jonoille
[muokkaa | muokkaa wikitekstiä]Klassinen keskeinen raja-arvolause
[muokkaa | muokkaa wikitekstiä]Olkoon {X1, ..., Xn} n alkion satunnaisotos, toisin sanoen jono riippumattomia ja identtisesti jakautuneita satunnaismuuttujia, joilla kaikilla on sama odotusarvo on μ ja sama äärellinen varianssi σ2. Tarkastellaan näiden satunnaismuuttujien otoskeskiarvoa
- .
suurten lukujen lain mukaan otoskeskiarvo suppenee stokastisesti ja melkein varmasti kohti odotusarvoa μ, kun n kasvaa rajatta. Klassinen keskeinen raja-arvolause kuvaa stokastisten fluktuaatioiden suuruutta ja niiden jakauman muotoa tämä raja-arvon μ molemmin puolin suppenemisen aikana. Tarkemmin sanottuna se sanoo, että kun n kasvaa, otoskeskiarvon Sn ja sen raja-arvon μ erotuksen jakauma, kun se kerrotaan tekijällä , toisin sanoen tulon jakauma) lähestyy normaalijakaumaa, jonka keskiarvo on 0 ja varianssi σ2. Tarpeeksi suurella n:n arvolla Sn:n jakauma on lähellä normaalijakaumaa, jonka keskiarvo on μ ja varianssi σ2/n. Tuloksen merkitys perustuu siihen, että lausekkeen jakauma lähestyy normaalijakaumaa riippumatta siitä, millainen jakauma alkuperäisillä satunnaismuuttujilla Xi itsellään on. Täsmällisessä muodossa lause voidaan esittää seuraavasti:
Lindebergin–Lévyn keskeinen raja-arvolause. Olkoon {X1, X2, ...}
jono riippumattomia ja identtisesti jakautuneita satunnaismuuttujia, joiden odotusarvo on E[Xi] = µ ja varianssi Var[Xi] = σ2 < ∞. Tällöin kun n kasvaa rajatta, satunnaismuuttujat konvergoivat jakaumaltaan kohti normaalijakaumaa N(0, σ2):[5]
Tapauksessa s > 0, jakaumakonvergenssi merkitsee, että lausekkeen jakauman kertymäfunktio suppenee pisteittäisesti kohti normaalijakauman N (0, σ2 kertymäfunktiota jokaisella reaaliluvulla z,
missä F(x) on normaalijakauman kertymäfunktion arvo pisteessä x. Suppeneminen on myös tasaista pisteessä z siinä mielessä, että
missä sup tarkoittaa joukon pienintä ylärajaa eli supremumia.[6]
Ljapunovin keskeinen raja-arvolause
[muokkaa | muokkaa wikitekstiä]Tämä lause on saanut nimensä venäläisen matemaatikko Aleksandr Ljapunovin mukaan. Tämä keskeisen raja-arvolauseen muunnelma edellyttää, että satunnaismuuttujien Xi on oltava riippumattomat, mutta ei välttämättä identtisesti jakautuneet. Lause edellyttää myös, että satunnaismuuttujilla |Xi| on oltava asteiden (2 + δ) momentit ja että näiden momenttien kasvu on rajoitettu jäljempänä selitetyllä Ljapunovin ehdon mukaisella tavalla.
Ljapunovin keskeinen raja-arvolause.
[7] Olkoon {X1, X2, ...} jono riippumattomia satunnaismuuttujia, joista jokaisen odotusarvo on µi ja varianssi σi2. Määritellään
Jos jollakin arvolla δ > 0, pätee Ljapunovin ehto
niin summa (Xi - µi)/sn konvergoi jakaumaltaan kohti standardia normaalijakaumaa, kun n kasvaa rajatta:
Käytännössä on tavallisesti helpointa tarkistaa, päteekö Ljapunovin ehto arvolla δ = 1. Jos satunnaismuuttujien jono toteuttaa Ljapunovin ehdon, se toteuttaa myös Lindebergin ehdon. Kääntäen ei kuitenkaan Lindebergin ehdosta seuraa Ljapunovin ehto.
Lindebergin–Fellerin lause
[muokkaa | muokkaa wikitekstiä]Suomalainen matemaatikko Jarl Waldemar Lindeberg osoitti vuonna 1920, että keskeisen raja-arvolauseen edellytyksenä ollut Ljapunovin ehto voidaan korvata heikommalla Lindebergin ehdolla. Myöhemmin William Feller osoitti, että Lindebergin ehto on myös välttämätön ehto sille, että summa konvergoi jakaumaltaan kohti normaalijakaumaa. Täten kysymyksen siitä, millä ehdoilla keskeinen raja-arvolause pätee, voidaan katsoa saaneen tyhjentävän ratkaisun.[8]
Olkoon {X1, X2, ...} jono riippumattomia satunnaismuuttujia, joista jokaisen odotusarvo on µi ja varianssi σi2. Oletetaan lisäksi, että
- , missä .
Tällöin summa (Xi - µi)/sn konvergoi jakaumaltaan kohti standardia normaalijakaumaa, kun n kasvaa rajatta, jos ja vain jos seuraava Lindebergin ehto pätee:[8]
- kaikilla ε > 0.
Moniulotteinen keskeinen raja-arvolause
[muokkaa | muokkaa wikitekstiä]Todistukset, joissa käytetään karakteristisia funktioita, voidaan yleistää tapauksiin, joissa kukin muuttuja Xi on satunnaisvektori avaruudessa , jonka vektoriarvoinen odotusarvo on µ = E(Xi) ja vektorin komponenteista muodostettu kovarianssimatriisi S, ja nämä satunnaisvektorit ovat riippumattomat ja identtisesti jakautuneet. Näiden vektorien summaus on suoritettava komponenteittain. Moniulotteinen keskeinen raja-arvolause sanoo, että skaalattuina nämä summat suppenevat kohti moniulotteista normaalijakaumaa.[9]
Olkoon
k-vektori. Lihavointi merkinnässä Xi osoittaa, että kyseessä on satunnaisvektori, ei yksiulotteinen satunnaismuuttuja. Tällöin satunnaisvektorien summa on
ja keskiarvo
ja sen vuoksi
- .
Moniulotteinen keskeinen raja-arvolause osoittaa, että
missä kovarianssimatriisi S on
Yleistetty lause
[muokkaa | muokkaa wikitekstiä]Keskeinen raja-arvolause sanoo, että riippumattoman ja identtisesti jakautuneiden satunnaismuuttujien summa, kun niillä on äärellinen varianssi, lähestyy suurella todennäköisyydellä normaalijakaumaa, kun muuttujien lukumäärä kasvaa. Gnedenko ja Kolmogorov keksivät lauseelle yleistyksen, joka koskee sellaisiakin satunnaismuuttujia, joiden jakaumat ääripäissään pienenevät potenssilain mukaan kuten |x|-a-1, missä 0 < a < 2, ja joiden varianssi tämän vuoksi on ääretön; tällainen on esimerkiksi Pareton jakauma. Tällaisissakin tapauksissa satunnaismuuttujien summa suppenee kohti jotakin vakaata jakaumaa , kun yhteenlaskettavien lukumäärä kasvaa.[10][11] Jos a > 2, tämä summa suppenee kohti vakaata jakaumaa, jonka vakausparametri on arvoltaan 2, toisin sanoen Gaussin jakaumaa.[12]
Keskeisiä raja-arvolauseita riippuville prosesseille
[muokkaa | muokkaa wikitekstiä]Tämä artikkeli tai sen osa on tuotu vieraskielisestä lähteestä ja käännös on keskeneräinen. Voit auttaa Wikipediaa tekemällä käännöksen loppuun. |
Huomautuksia
[muokkaa | muokkaa wikitekstiä]Klassisen keskeisen raja-arvolauseen todistus
[muokkaa | muokkaa wikitekstiä]Keskeisen raja-arvolauseen klassinen voidaan todistaa melko helposti karakterististen funktioiden avulla. Todistus on samantapainen kuin heikon suurten lukujen lain. Taylorin lauseen mukaan jokaisen sellaisen satunnaismuuttujan Y karakteristinen funktio, jonka odotusarvo on nolla ja varianssi var(Y) = 1), on
missä o on jokin t:n funktio, joka suppenee kohti nollaa nopeammin kuin t2.
Olettamalla, että Yi on (Xi - µ)/s eli Xi:n standardoitu arvo on helppo huomata, että havaintojen X1, X2, ..., Xn standardoitu keskiarvo on
Karakterististen funktioiden perusominaisuuksien nojalla summan karakteristinen funktio on:
niin että kun eksponenttifunktio voidaan esittää raja-arvona
- ,
Zn:n karakteristinen funktio on
Mutta tämä on sama kuin standardin normaalijakauman N(0, 1), karakteristinen funktio, ja keskeinen raja-arvolause seuraa Lévyn jatkuvuuslauseesta, joka takaa, että karakterististen funktioiden suppenemisesta seuraa jakaumien konvergenssi.
Suppeneminen kohti raja-arvoa
[muokkaa | muokkaa wikitekstiä]Keskeinen raja-arvolause antaa vain asymptoottisen jakauman. Äärelliselle äärelliselle määrälle havaintoja se antaa järkevän likiarvon vain lähellä normaalijakauman huippua; tarvitaan erittäin suuri määrä havaintoja, jotta tulos pätisi myös jakauman kummassakin ääripäässä.
Jos kolmas keskeinen momentti E((X1 - μ)3) on olemassa ja se on äärellinen, mainittu suppeneminen on tasaista ja suppenemisvauhti on vähintään luokkaa 1/n1/2 (katso Berryn-Esseenin lause). Steinin metodia[13] voidaan käyttää, paitsi keskeisen raja-arvolauseen todistamiseen, myös suppenemisvauhdin arvioimiseen valitulla mitta-asteikolla.[14]
Suppeneminen normaalijakaumaa kohti on monotonista siinä mielessä, että Zn:n entropia kasvaa monotonisesti kohti normaalijakauman entropiaa.[15]
Keskeinen raja-arvolause pätee erityisesti myös riippumattomien ja identtisesti jakautuneiden diskreettien satunnaismuuttujien keskiarvolle. Diskreettien satunnaismuuttujien summa on yhä diskreetti satunnaismuuttuja, joten tässä on kysymyksessä jono diskreettejä satunnaismuuttujia, joiden kertymäfunktio suppenee kohti jatkuvan jakauman, nimittäin normaalijakauman kertymäfunktiota. Tämä merkitsee, että jos n riippumattoman identtisen satunnaismuuttujan toteutuneista summista laaditaan histogrammi ja piirretään käyrä, joka yhdistää histogrammin muodostavien suorakulmioiden yläreunojen keskipisteet, tämä käyrä muistuttaa muodoltaan Gaussin käyrää sitä tarkemmin, mitä suurempi luku n on. Tätä tulosta sanotaan de Moivren–Laplacen lauseeksi. Esimerkiksi jos lasketaan sellaisten satunnaismuuttujien summa, joista kullakin on vain kaksi mahdollista arvoa, tämä summa noudattaa binomijakaumaa, joka lähestyy muodoltaan normaalijakaumaa sitä enemmän, mitä enemmän näitä yhteenlaskettuja satunnaismuuttujia on.
Keskeinen raja-arvolause ja suurten lukujen laki
[muokkaa | muokkaa wikitekstiä]Keskeisen raja-arvolauseen tavoin myös suurten lukujen laki on osittainen ratkaisu yleiseen ongelmaan: Mitä riippumattomien ja identtisesti jakautuneiden satunnaismuuttujien summalle Sn tai niiden keskiarvolle lopulta tapahtuu kun satunnaismuuttujien lukumäärä n kasvaa rajatta?
Matemaattisessa analyysissä asymptoottiset sarjat kuuluvat käytetyimpiin työkaluihin senlaatuisten kysymysten käsittelyssä. Oletetaan, että f(n):llä on asymptoottinen kehitelmä:
Jakamalla molemmat puolet f1(n):llä ja ottamalla raja-arvo saadaan a1, kehitelmän korkeimman asteen termin kerroin, joka osoittaa, kuinka nopeasti f(n):n johtava termi muuttuu.
Epämuodollisesti voidaan sanoa, että "f(n) kasvaa likiptäen samassa tahdissa kuin a1 f1(n)". Jos f(n):n ja sen likiarvon erotus jaetaan kehitelmän seuraavalla termillä saadaan f(n):lle tarkempi arvio:
Tässä voidaan sanoa, että funktion ja sen likiarvon erotus kasvaa likipitäen saman verran kuin a2 f2(n). Ajatuksena on, että kun funktio jaetaan sopivilla normalisointifunktioilla ja tutkitaan, miten näin saadulle funktiolle käy n:n kasvaessa voidaan päätellä paljon myös siitä, miten alkuperäiselle funktiolle silloin tapahtuu
Kutakuinkin samaan tapaan voidaan tarkastella myös riippumattomien ja identtisesti jakautuneiden satunnaismuuttujien X1, ..., Xn summaa Sn. Jos jokaisella Xi on äärellinen odotusarvo μ suurten lukujen lain mukaan niiden keskiarvo lähestyy tätä odotusarvoa eli Sn/n → µ.[16] Jos lisäksi jokaisella Xi on äärellinen varianssi σ2, niin keskeisen raja-arvolauseen mukaan
missä ξ noudattaa normaalijakaumaa N(0, σ2). Tästä saadaan kahden ensimmäisen vakion arvot epämuodollisessa kehitelmässä
Tapauksessa, jossa satunnaismuuttujilla Xi ei ole äärellistä keskiarvoa tai varianssia, niiden summalle voidaan silti sopivasti muuntamalla ja uudelleen skaalaamalla saada suppeneva lauseke:
tai vähemmän muodollisesti
Tällä tavoin saatuja jakaumia Ξ sanotaan vakaiksi jakaumiksi.[17] Normaalijakauma selvästikin on vakaa, mutta on olemassa muitakin vakaita jakaumia, esimerkiksi Cauchyn jakauma, jolla ei ole odotusarvoa eikä varianssia ja jota sen vuoksi ei sen enempää keskeinen raja-arvolause enempää kuin suurten lukujen lakikaan koske.
Skaalaustekijä bn saattaa olla verrannollinen lausekkeeseen nc, missä usein c = 1/2, mutta se voidaan myös kertoa jollakin n:n hitaasti vaihtelevalla funktiolla.[12][18]
Toistettujen logaritmien laki tarkentaa, mitä tapahtuu suurten lukujen lain ja keskeisen raja-arvolauseen "välissä". Erityisesti se osoittaa, että normalisointifunktion avulla, joka suuruudeltaan on suurten lukujen laissa esiintyvän lukumäärän n ja keskeisessä raja-arvolauseessa esiintyvän neliöjuuren välissä, saadaan n:n kasvaessa ei-triviaaleja tuloksia.
Vaihtoehtoisia muotoiluja
[muokkaa | muokkaa wikitekstiä]Tiheysfunktiot
[muokkaa | muokkaa wikitekstiä]Kahden tai useamman riippumattoman muuttujan summan tiheysfunktio on näiden muuttujien tiheyksien konvoluutio, jos niillä on tiheysfunktiot. Niinä keskeinen raja-arvolauseen voidaan tulkita koskevan näiden tiheysfunktioiden ominaisuuksia konvoluutiossa: tiheysfunktiojoukon konvoluutio lähestyy normaalijakaumaa, kun tiheysfunktioiden lukumäärä kasvaa rajatta. Tällaiset tiheysfunktioiden suppenemista koskevat, niin sanotut lokaalit keskeiset raja-arvolauseet kuitenkin pätevät vain tietyin edellytyksin, jotka ovat ankarammat kuin keskeisen raja-arvolauseen edellä esitetyissä versiossa.[19]
Karakteristiset funktiot
[muokkaa | muokkaa wikitekstiä]Koska konvoluution karakteristinen funktio on siinä mukana olevien tiheysfunktioiden karakterististen funktioiden tulo, keskeisestä raja-arvolauseesta on olemassa myös niitä koskeva muoto: tiheysfunktiojoukon karakterististen funktioiden tulo lähestyy normaalijakauman karakteristista funktiota, kun tiheysfunktioiden lukumäärä kasvaa rajatta, edellä mainituilla edellytyksillä. Tämän tarkentamiseksi on karakterististen funktioiden argumentteja on kuitenkin muunnettava sopivalla skaalaustekijällä.
Vastaava tulos voidaan esittää myös Fourier-muunnoksille, sillä karakteristinen funktio on oleellisesti Fourier-muunnos.
Lauseen laajennuksia
[muokkaa | muokkaa wikitekstiä]Positiivisten satunnaismuuttujien tulo
[muokkaa | muokkaa wikitekstiä]Lukujen tulon logaritmi on tulon tekijöiden logaritmien summa. Sen vuoksi sellaisten satunnaismuuttujien tulo, joista kukin lähestyy normaalijakaumaa mutta voi saada vain positiivisia arvoja, lähestyy log-normaalijakaumaa. Monet fysikaaliset suureet (erityisesti massa tai pituus, jotka eivät voi olla negatiivisia), ovat monien satunnaisten tekijöiden tuloja, jolloin nämä suureet monissa tilanteissa noudattavat log-normaalijakaumaa.
Sen sijaan että satunnaismuuttujien summaa koskeva keskeinen raja-arvolause edellyttää äärellistä varianssia, vastaava lause niiden tulolle edellyttää, että tiheysfunktioiden neliöt ovat integroituvia.[20]
Klassisen viitekehyksen ulkopuolella
[muokkaa | muokkaa wikitekstiä]Asymptoottinen normaalisuus, toisin sanoen suppeneminen sopivien muunnosten ja uudelleenskaalausten jälkeen kohti normaalijakaumaa, on ilmiö, joka esiintyy monessa muussakin kuin edellä käsitellyissä tilanteissa, toisin sanoen satunnaismuuttujien tai -vektoreiden summan tapauksessa. Tilanteita, joissa vastaava ilmiö esiintyy, on aikaa myöten paljastunut jatkuvasti lisää, eikä niitä kaikkia toistaiseksi voida käsitellä yhtenäiseltä pohjalta.
Tämä artikkeli tai sen osa on tuotu vieraskielisestä lähteestä ja käännös on keskeneräinen. Voit auttaa Wikipediaa tekemällä käännöksen loppuun. |
Lakunaariset trigonometriset sarjat
[muokkaa | muokkaa wikitekstiä]Salemin–Zygmundin lause. Olkoon U satunnaismuuttuja
joka on jakautunut tasaisesti välille (0, 2p), ja Xk = rk cos(nkU + ak), missä
- nk toteuttaa lakunaarisuusehdon: on olemassa sellainen luku q > 1, että nk+1 = qnk kaikilla k:n arvoilla,
- rk ovat sellaisia, että
konvergoi jakaumaltaan kohti normaalijaumaa N(0, 1/2).
Gaussin polytoopit
[muokkaa | muokkaa wikitekstiä]Teoreema: Olkoot A1, ..., An riippumattomia satunnaisesti valittuja pisteitä tasossa , joista jokainen noudattaa kaksiulotteista standardinormaalijakaumaa. Olkoon Kn näiden pisteiden kupera peite ja ''Xn alueen Kn pinta-ala. Silloin[23]
suppenee jakaumana kohti normaalijakaumaa N(0, 1), kun n kasvaa rajatta.
Sama pätee kaikissa ulottuvuuksissa (2, 3, ...).
Kuperaa polytooppia Kn sanotaan Gaussin satunnaispolytoopiksi.
Vastaava tulos pätee Gaussin polytooppien kärkien, särmien ja sivutahkojenkin lukumäärälle.[24]
Alijonot
[muokkaa | muokkaa wikitekstiä]Lause. Olkoot satunnaismuuttujat X1, X2, … ∈ L2(O) sellaisia, että Xn → 0 heikosti joukossa L2(O) ja Xn2 → 1 heikosti joukossa L1(O). Silloin on olemassa sellaiset kokonaisluvut n1 < n2 < …, että suppenee kohti jakaumaa N(0, 1), kun k kasvaa rajatta.[25]
Satunnaiskulku kidehilassa
[muokkaa | muokkaa wikitekstiä]Keskeisestä raja-arvolauseesta on olemassa myös versio, joka koskee yksinkertaista satunnaiskulkua kidehilassa. Kidehilan oletetaan olevan ääretön Abelin verkko, joka peittää äärellisen verkon. Tätä tulosta on käytetty kiteiden rakenteiden kuvaamiseen.[26][27]
Sovelluksia ja esimerkkejä
[muokkaa | muokkaa wikitekstiä]Yksinkertainen esimerkki
[muokkaa | muokkaa wikitekstiä]Yksinkertainen esimerkki keskeisestä raja-arvolauseesta saadaan heittämällä suurta määrää samanlaisia, "painottamattomia" noppia. Saatujen silmälukujen summa tai vaihtoehtoisesti keskiarvo noudattaa tällöin likimain normaalijakaumaa. Koska reaalimaailman suureet ovat usein monien havaitsematta jääneiden satunnaisilmiöiden painotettuja keskiarvoja, keskeinen raja-arvolause osaltaan myös selittää, miksi normaalijakauma esiintyy mitä erilaisimmissa ilmiöissä. Siihen perustuu myös normaalijakauman käyttö likiarvona suuria otoksia koskevia kontrolloiduissa tilastollisissa kontrolloiduissa kokeissa.
Sovellettavuudesta yleisesti
[muokkaa | muokkaa wikitekstiä]Julkaistussa kirjallisuudessa on suuri joukko käyttökelpoisia ja mielenkiintoisia esimerkkejä keskeisen raja-arvolauseen sovelluksista.[28] Esimerkkeinä voidaan mainita seuraavat:[29]
- Sen etäisyyden todennäköisyysjakauma, johon satunnaiskulussa päädytään, lähestyy normaalijakaumaa.
- Heitettäessä suurta määrää kolikkoja kruunien tai vastaavasti klaavojen lukumäärän todennäköisyysjakauma lähestyy normaalijakaumaa.
Keskeistä raja-arvolauseesta seuraa, että mielivaltaisten riippumattomien satunnaismuuttujien summa noudattaa likimain normaalijakaumaa, mikäli niitä yhteenlaskettavia muuttujia on hyvin paljon ja mikäli jokaisen yksityisen muuttujan vaihtelu on pieni verrattuna summan vaihteluun.[4]
Täten keskeinen raja-arvolause myös selittää "kellokäyrän" (Gaussin käyrän) yleisen esiintymisen reaalimaailman aineistoon sovelletuissa tietynlaisen tapauksen esiintyvyyden arvioinneissa. Sen kaltaisissa tapauksissa kuin esimerkiksi elektronisessa hälyssä, tutkintojen arvosanoissa ja monissa muissa voidaan yksittäistä mitattua arvoa usein pitää painotettuna keskiarvona suuresta määrästä pieniä ilmiöitä. Keskeisen raja-arvolauseen yleistysten avulla todetaan, että tämä usein, joskaan ei kaikissa tapauksissa, tuottaa lopullisen jakauman, joka on likipitäen normaali.
Regressioanalyysi
[muokkaa | muokkaa wikitekstiä]Regressioanalyysi ja varsinkin tavallinen pienimpien neliösummien menetelmä osoittavat, että jos jokin muuttuja ei ole riippumaton, se yleensä riippuu jonkin funktion mukaisesti yhdestä tai useammasta riippumattomasta muuttujasta, joihin lisäksi liittyy korjaustermi. Useat regressioon perustuvat tilastolliset päätelmät edellyttävät, että korjaustermi on normaalisti jakautunut. Tämä oletus voidaan perustella olettamalla, että korjaustermi itse asiassa on hyvin monien riippumattomien korjaustermien summa; vaikka yksittäiset korjaustermit sinänsä eivät olisikaan normaalisti jakauteet, keskeisen raja-arvolauseen perusteella niiden summaa voidaan kuitenkin approksimoida normaalijakaumalla.
Historia
[muokkaa | muokkaa wikitekstiä]Käsityksen normaalijakauman luonteesta eräänlaisena monen tekijän yhteisvaikutusta kuvaavana rajajakaumana esitti eräissä erikoistapauksissa jo Abraham de Moivre[30] vuonna 1733.[31] Keksintö oli tuolloin pitkälti aikaansa edellä, ja se lähes unohdettiin, kunnes kuuluisa ranskalainen matemaatikko Pierre-Simon Laplace palasi asiaan vuonna 1812 julkaistussa teoksessa Théorie analytique des probabilités.[31] Laplace kuitenkin onnistui todistamaan lauseen vain binomijakauman tapauksessa.[30] Mutta myöskään Laplacen keksintö ei hänen omana aikanaan saanut paljonkaan huomiota. Vasta 1800-luvun lopulla keskeisen raja-arvolauseen merkitys alettiin yleisesti ymmärtää, ja vuonna 1901 venäläinen matemaatikko Aleksandr Ljapunov määritteli sen yleisin käsittein ja todisti täsmällisesti, miten se matemaattisesti toimii.[31] Nykyisin keskeinen raja-arvolause yhdessä suurten lukujen lain kanssa muodostaa perustan koko matemaattiselle tilastotieteelle.[32]
Francis Galton kuvaili keskeisen raja-arvolauseen merkitystä seuraavasti:[33]
»Tunnen tuskin mitään, mikä siinä määrin olisi omiaan kiehtomaan mielikuvitusta kuin se ihmeellinen kosminen järjestys, jonka "virheen frekvenssin laki" ilmaisee. Kreikkalaiset olisivat personifioineet lain ja pitäneet sitä jumalana, jos olisivat tunteneet sen. Se hallitsee tyynesti ja itse täysin syrjässä pysytellen keskellä villeintä sekaannusta. Mitä runsaampi väkijoukko ja mitä suurempi näennäinen sekasorto, sitä täydellisemmin se vallitsee. Se on Järjettömyyden ylin laki. Missä tahansa onkin käsillä suuri joukko kaoottisia alkeisvoimia, jotka ohjautuvat niiden suuruusluokkien mukaisessa järjestyksessä, odottamaton ja mitä kaunein säännöllisyyden muoto osoittautuu olleen piilevänä koko ajan.»
Termin "keskeinen raja-arvolause" (saks. zenrtaler Grenzwertsatz) otti ensimmäisenä käyttöön George Pólya vuonna 1920 erään tutkielmansa nimessä.[34][35] Pólya nimitti lausetta "keskeiseksi" sen suuren merkityksen vuoksi, joka sillä todennäköisyysteoriassa on. Le Camin mukaan todennäköisyyslaskennan ranskalainen koulukunta kuitenkin tulkitsee sanan "keskeinen" viittaavan siihen, että lause kuvaa jakauman keskikohdan, ei sen ääripäiden käyttäytymistä.[35] Pólyan vuonna 1920 julkaiseman tutkielman yhteenvedossa[34] sanotaan:
Gaussin todennäköisyystiheyden 1 = e-x² esiintyminen toistokokeissa ja mittausvirheissä, jotka saadaan yhteistuloksena hyvin monista ja hyvin pienistä virhelähteistä, sekä diffuusioprosesseissa ja niin edelleen voidaan tunnetusti selittää samalla raja-arvolauseella, jolla on keskeinen osa todennäköisyyslaskennassa. Tämän raja-arvolauseen keksijäksi pitää nimetä Laplace; luultavaa on, että sen täsmällisen todistuksen esitti ensimmäisenä Tšebyšov, ja terävin löydettävissä oleva muoto, jonka tunnen, on eräässä Ljapunovin artikkelissa. [...]
Yleisimmässä muodossaan lauseen todisti suomalainen matemaatikko Lindeberg vuonna 1922. Saman tuloksen todisti myöhemmin Lindebergin todistuksesta tietämättä myös Alan Turing vuonna 1934. Vasta lähetettyään tutkielmansa Cambridgen yliopistoon tarkastettavaksi hän sai tietää, että se oli jo aiemmin todistettu, minkä vuoksi Turingin tutkielmaa ei koskaan julkaistu.[36][37]
Eräs Andreas Haldin laatima artikkeli matemaattisen tilastotieteen historiasta sisältää myös perusteellisen esityksen keskeisen raja-arvolauseen historiasta. Siinä kerrotaan yksityiskohtaisesti Laplacen sekä myös Cauchyn, Besselin ja Poissonin keksinnöistä.[38] Hans Fischer on laatinut asiasta kaksi historiallista esityistä, joista ensimmäinen kuvaa kehitystä Laplacesta Cauchyyn, jälkimmäinen von Misesin, Pólyan, Lindebergin, Lévyn ja Cramérin tutkimuksia 1920-luvulla.[39] Le Cam on kuvaillut kehitystä vuoden 1935 aikoihin.[35] Bernstein on myös laatinut lauseen historiasta esityksen, joka keskittyy Pafnuty Tšebyšovin ja hänen oppilaidensa Andrei Markovin ja Aleksandr Ljapunovin töihin, jotka johtivat keskeisen raja-arvolauseen ensimmäiseen yleisillä ehdoilla päteviin todistuksiin.[40]
Katso myös
[muokkaa | muokkaa wikitekstiä]Lähteet
[muokkaa | muokkaa wikitekstiä]- Bradley, Richard: Introduction to Strong Mixing Conditions, 1. painos. Heber City, Utah: Kendrick Press, 2007. ISBN 0-9740427-9-X
- Bradley, Richard: Basic Properties of Strong Mixing Conditions. A Survey and Some Open Questions. Probability Surveys, 2005, 2. vsk, s. 107–144. doi:10.1214/154957805100000104 arXiv:math/0511078v1 Artikkelin verkkoversio.
Viitteet
[muokkaa | muokkaa wikitekstiä]- ↑ The Central Limit Theorem math.uah.edu. Viitattu 7.1.2015.
- ↑ Rice, John: Mathematical Statistics and Data Analysis, 2. painos. Duxbury Press, 1995. ISBN 0-534-20934-3
- ↑ Voit, Johannes: The Statistical Mechanics of Financial Markets, s. 124. Springer-Verlag, 2003. ISBN 3-540-00978-7
- ↑ a b Vasama, Pyry-Matti & Vartia, Yrjö: ”Keskeinen raja-arvolause”, Johdatus tilastotieteeseen, osa 1, s. 285-286. Gaudeamus, 1973. ISBN 951-662-015-9
- ↑ Billingsley, Patrick: Probability and Measure, 3. painos, s. 357. John Wiley & Sons, 1995. ISBN 0-471-00710-2
- ↑ Bauer, Heinz: ”Theorem 30.13”, Measure and Integration Theory, s. 199. Berliini: de Gruyter, 2001. ISBN 3110167190
- ↑ Billingsley, Patrick: Probability and Measure, 3. painos, s. 362. John Wiley & Sons, 1995. ISBN 0-471-00710-2
- ↑ a b Tuominen, Pekka & Norlamo, Pekka: ”Keskeinen raja-arvolause”, Todennäköisyyslaskenta, osa 2, s. 496–497. Limes ry, 1978. ISBN 951-745-023-0
- ↑ A. W. Van der Vaart: Asymptotic statistics. New York: Cambridge University Press, 1998. ISBN 978-0-521-49603-2
- ↑ Voit, Johannes: ”Section 5.4.3”, The Statistical Mechanics of Financial Markets (Texts and Monographs in Physics). Springer-Verlag, 2003. ISBN 3-540-00978-7 Teoksen verkkoversio.
- ↑ Gnedenko, B. V. & Kolmogorovul, A. N.: Limit distributions for sums of independent random variables. Cambridge: Addison-Wesley, 1954. Teoksen verkkoversio.
- ↑ a b Uchaikin, Vladimir V. & Zolotarev, V. M.: Chance and stability: stable distributions and their applications, s. 61–62. VSP, 1999. ISBN 90-6764-301-7
- ↑ Stein, Charles: A bound for the error in the normal approximation to the distribution of a sum of dependent random variables. Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability, 1972, s. 583–602. MR:402873 Artikkelin verkkoversio.
- ↑ Chen, L. H. Y. & Coldstein, L. & Shao, Q. M.: Normal approximation by Stein's method. Springer, 2011. ISBN 978-3-642-15006-7
- ↑ Artstein, S. & Ball, K. & Barthe, F. & Naor, Assaf: Solution of Shannon's Problem on the Monotonicity of Entropy. Journal of the American Mathematical Society, 2004, 17. vsk, nro 4, s. 975–982. doi:10.1090/S0894-0347-04-00459-X Artikkelin verkkoversio.
- ↑ Set, Jeffrey: ”Theorem 5.3.4”, A first look at rigorous probability theory, s. 47. World Scientific, 2000. ISBN 981-02-4322-7
- ↑ Johnson, Oliver Thomas: Information theory and the central limit theorem, s. 88. Imperial College Press, 2004. ISBN 1-86094-473-6
- ↑ Borodin, A. N. & Ibragimov, Il'dar Abdulovich & Sudakov, V. N.: ”Theorem 1.1”, Limit theorems for functionals of random walks, s. 8. AMS Bookstore, 1995. ISBN 0-8218-0438-3
- ↑ Petrov, V. V.: ”7. luku”, Sums of Independent Random Variables. New York, Heidelberg: Springer-Verlag, 1976.
- ↑ Remala, G. & Wesolowski, G.: Asymptotics of products of sums and U-statistics. Electronic Communications in Probability, 2002, 7. vsk, s. 47–54. doi:10.1214/ecp.v7-1046 Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
- ↑ Zygmund, Antoni: ”Sect. XVI.5, Theorem 5-5”, Trigonometric series, Volume II. Cambridge University Press, 1959. ISBN 0-521-89053-5 (vuonna 2003 ilmestynyt yhdistelmä osista I ja II)
- ↑ Gaposhkin, V. F.: Lacunary series and independent functions. Russian Mathematical Surveys Vuosi = 1966, Määritä ajankohta! doi:10.1070/RM1966v021n06ABEH001196
- ↑ Bárány, Imre & Vu, Van: Central limit theorem for Gaussian polytopes (Theorem 1.1.). Annals of Probability, 2007, 35. vsk, nro 4. Institute of Mathematical Statistics. doi:10.1214/009117906000000791 arXiv:math/0610192
- ↑ Bárány, Imre & Vu, Van: Central limit theorem for Gaussian polytopes (Theorem 1.2.). Annals of Probability, 2007, 35. vsk, nro 4. Institute of Mathematical Statistics. doi:10.1214/009117906000000791 arXiv:math/0610192
- ↑ Gaposhkin, V. F.: Lacunary series and independent functions. Russian Mathematical Surveys Vuosi = 1966, Määritä ajankohta! doi:10.1070/RM1966v021n06ABEH001196
- ↑ Kotani, M. & Sunada, Toshikazu: Spectral geometry of crystal lattices, s. 271–305. Contemporary Math, 2003. ISBN 978-0-8218-4269-0
- ↑ Toshikazu Sunada: Topological Crystallography ---With a View Towards Discrete Geometric Analysis---. Springer, 2012. ISBN 978-4-431-54177-6
- ↑ Ivo Dinov & Nicolas Christou & Juana Sanchez: Central Limit Theorem: New SOCR Applet and Demonstration Activity. Journal of Statistics Education, 2008, 16. vsk, nro 2. ASA. Artikkelin verkkoversio. (Arkistoitu – Internet Archive)
- ↑ SOCR CLT Activity wiki.stat.ucla.edu. Viitattu 9.1.2016.
- ↑ a b Tuominen, Pekka & Norlamo, Pekka: ”Johdanto, katsaus historiaan”, Todennäköisyyslaskenta, osa 1, s. iv. Limes ry, 1978. ISBN 951-745-023-0
- ↑ a b c Tijms Henk: Understanding Probability: Chance Rules in Everyday Life, s. 169. Cambridge University Press, 2004. ISBN 0-521-54036-4
- ↑ Pekka Tuominen & Pekka Norlamo: ”Alkusanat”, Todennäköisyyslaskenta, osa 1. Limes ry, 1978. ISBN 951-745-023-0
- ↑ Galton, Francis: Natural Inheritance, s. 66. Määritä julkaisija! Teoksen verkkoversio. (Arkistoitu – Internet Archive)
- ↑ a b Pólya, George: Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem. Mathematische Zeitschrift, 1920, 8. vsk, nro 3–4, s. 171–181. doi:10.1007/BF01206525 Artikkelin verkkoversio. (saksaksi)
- ↑ a b c Lucien Le Cam: The central limit theorem around 1935. Statistical Science, 1986, 1. vsk, nro 1, s. 78–91. doi:10.2307/2245503 Artikkelin verkkoversio.
- ↑ Aldrich, John: England and Continental Probability in the Inter-War Years. Electronic Journ@l for History of Probability and Statistics, joulukuu 2009, 5/2. vsk. Artikkelin verkkoversio.
- ↑ S. L. Zabell: Symmetry and its discontents: essays on the history of inductive probability, s. 199–. Cambridge University Press, 2005. ISBN 0-521-44470-5
- ↑ A History of Mathematical Statistics from 1750 to 1930 (Ch. 17) Andreas Hald.
- ↑ Fischer, Hans: ”Luku 2: The Central Limit Theorem from Laplace to Cauchy: Changes in Stochastic Objectives and in Analytical Methods; Luku 5.2: The Central Limit Theorem in the Twenties”, A History of the Central Limit Theorem: From Classical to Modern Probability Theory. Sources and Studies in the History of Mathematics and Physical Sciences. Springer, 2001. ISBN 978-0-387-87856-0 doi:10.1007/978-0-387-87857-7
- ↑ Bernstein, Sergei Natanovich: ”P.L. Tšebyšovin töistä todennäköisyysteoriassa”, Nauchnoe Nasledie P.L.Chebysheva, Vypusk Pervyi: Matematika (P. L. Tšebyšovin tieteellinen perintö, 1. osa: Matematiikka), s. 174–. Moskova, Leningrad: Academiya Nayk SSSR, 1945. (venäjäksi)
Aiheesta muualla
[muokkaa | muokkaa wikitekstiä]- Central limit theorem Encyclopedia of Mathematics. Viitattu 9.1.2016.
- Central Limit Theorem, Example: Uniform Distribution statisticalengineering.com.
- Learning by Simulations: Central Limit Theorem vias.org.
- CLT in NetLogo CM ProbLab.
- SOCR EduMaterials Activities GeneralCentralLimitTheorem wiki.stat.ucla.edu.
- About Pages for SOCR Experiments wiki.stat.ucla.edu.
- Generate Samplers for Excel John K. Kruschke. Arkistoitu 17.5.2008. Viitattu 9.1.2016.
- The Central Limit Theorem Wolfram Demonstrations Project. Chris Boucher.
- Central Limit Theorem Wolfram MathWorld. Eric W. Weisstein.
- Keskeinen raja-arvolause yleistajuisesti Jarno Elonen.