Todennäköisyysjakautuma ja satunnaisilmiön odotusarvo

Ongelma

Viikolla 27 (vuonna 1997) oli Lotossa jaossa yksi kaikkien aikojen suurimmista jättipoteista, ja suomalaiset lottosivat ennätysmäisesti. Onkohan jotenkin määritettävissä etukäteen, paljonko esimerkiksi lottoaja todennäköisimmin tulee voittamaan?

Ratkaisu

On toki, mutta tutustutaanpa asiaan ensin vähän yksinkertaisemman tapauksen, nimittäin nopanheiton avulla.

Jatkossa edellytetään, että käsiteltävän satunnaisilmiön alkeistapaukset ovat lukuja. Periaatteessa ne voivat olla "äärettömän tiheässä" olevia reaalilukujakin, mutta nopanheiton mahdolliset tulokset muodostuvat erillisistä eli diskreeteistä arvoista, mikä helpottaa uuden asian esittelyä.

Nopanheiton tulos voi olla jokin luvuista 1, 2, 3, 4, 5 ja 6, joista jokaisen todennäköisyys on 1/6.

Alla olevat kuvat esittävät äskeisen asian sekä taulukkomuodossa että graafisena kaaviona.

Teoria

Kun satunnaisilmiöstä äskeiseen tapaan taulukon tai kuvan avulla kerrotaan sen mahdolliset arvot ja arvoja vastaavat todennäköisyydet, esitetään satunnaisilmiön (todennäköisyys)jakautuma.

On osoittautunut hyödylliseksi määritellä käsite satunnaisilmiön todennäköisyysjakautuman odotusarvo µ siten, että jokainen alkeistapaus kerrotaan todennäköisyydellään ja saadut tulot lasketaan yhteen.

Nopanheiton tapauksessa odotusarvo on siis



Odotusarvo on tavallaan satunnaisilmiön "todennäköisin" tulos, jossa eri tulosmahdollisuuksia painotetaan niiden todennäköisyyksillä. Odotusarvon ei tarvitse olla satunnaisilmiön alkeistapaus!

Odotusarvolle voidaan myös antaa seuraava tulkinta:

Jos toistamme satunnaisilmiön monta kertaa ja laskemme tulosten keskiarvon, niin se tulee olemaan lähellä odotusarvoa. Mitä useampia kertoja satunnaisilmiö toistetaan, sitä varmemmin tulosten keskiarvo on lähellä odotusarvoa.

Oletetaan, että satunnaisilmiön alkeistapaukset ovat



sekä odotusarvo µ. Jakautuman varianssi määritellään kaavalla



Tässä kreikkalainen "sigma"-kirjain. Varianssia laskettaessa siis
1. jokaisen alkeistapauksen arvosta vähennetään odotusarvo ja korotetaan erotus neliöön
2. neliön arvo kerrotaan kyseisen alkeistapauksen todennäköisyydellä
3. saadut termit lasketaan yhteen.

Varianssi on nollaa suurempi tai nolla, koska kaikki summan termit ovat ei-negatiivisia. Varianssi on nolla vain, jos satunnaisilmiöllä on yksi ainoa alkeistapaus, ja silloinhan ei enää olekaan kysymys satunnaisilmiöstä.

Varianssi luonnehtii alkeistapausten hajallaan oloa tai tiiviyttä odotusarvon ympärillä. Jos siitä vielä otetaan neliöjuuri, niin saadaan standardipoikkeama .

Nopanheitossa varianssi ja standardipoikkeama ovat