Tilastolliset jakaumat
Eräällä lukioluokalla pidettiin matematiikan koe. Kokeen maksimipistemäärä oli 20. Oppilaiden saamat pistemäärät olivat seuraavat.
Tässä tapauksessa tilastoyksiköiden joukko muodostuu 28 oppilaasta. Mitattava ominaisuus eli tilastollinen muuttuja on kokeen pistemäärä. Merkitään oppilaiden muodostamaa perusjoukkoa
:lla ja tämän joukon
alkioita
sekä tilastomuuttujaa
:llä. Muuttujan arvot
muodostavat joukon
. Tällöin tilannetta voidaan kuvata seuraavasti.
Tilastoyksiöt kuvautuvat tilastomuuttujien joukkoon eli alkioiden
ja
välillä on funktio
.
Tulokset voidaan järjestää taulukoksi, josta ilmenee kunkin tuloksen esiintymien lukumäärä eli frekvenssi. Tämä esitys on nk. diskreetti tilastollinen frekvenssijakauma.
| pistemäärä |
frekvenssi |
pistemäärä |
frekvenssi |
| 1 |
0 |
11 |
4 |
| 2 |
0 |
12 |
3 |
| 3 |
0 |
13 |
2 |
| 4 |
0 |
14 |
3 |
| 5 |
1 |
15 |
1 |
| 6 |
0 |
16 |
3 |
| 7 |
3 |
17 |
1 |
| 8 |
2 |
18 |
1 |
| 9 |
2 |
19 |
2 |
| 10 |
1 |
20 |
0 |
Sama tulos voidaan esittää vieläkin havainnoillisemmassa muodossa graafisesti. Merkitään vaaka-akselille pistemäärä ja pystyakselille frekvenssit.
Tällaista esitystä kutsutaan janadiagrammiksi.
Jatkuva tilastollinen jakauma
Edellisessä tapauksessa tilastollisen muuttujan
mahdolliset arvot olivat kokonaislukuja ykkösen ja 20 väliltä. Tästä syystä muuttuja ei voinut saada arvoja esimerkiksi 15 ja 16 väliltä. Kutsuimme jakaumaa diskreetiksi eli erillisistä arvoista koostuvaksi tilastolliseksi jakaumaksi. Mikäli tilastollinen muuttuja voi saada mitä tahansa arvoja tietyltä väliltä, kutsutaan tätä vastaavaa jakaumaa jatkuvaksi tilastolliseksi jakaumaksi. Jatkuvan jakauman tapauksessa tilastomuuttujalla on äärettömän monta mahdollista arvoa. Todellisuudessa mittaamalla ei voida muodostaa jatkuvaa jakaumaa, vaikka tilastoyksikön vastaava ominaisuus olisi luonteeltaan jatkuva, sillä mittaustarkkuus on aina rajallinen.
Eräässä psykologisessa kokeessa mitattiin 30 koehenkilön reaktioaikaa. Mittaus tehtiin mikrosekunnin tarkkuudella ja tulokset ilmenevät oheisesta taulukosta.
| mittaus | aika ( ) | mittaus | aika ( ) | mittaus | aika ( ) |
| 1 | 731 | 11 | 770 | 21 | 1060 |
| 2 | 716 | 12 | 954 | 22 | 832 |
| 3 | 782 | 13 | 931 | 23 | 911 |
| 4 | 1042 | 14 | 1020 | 24 | 705 |
| 5 | 603 | 15 | 885 | 25 | 901 |
| 6 | 1015 | 16 | 723 | 26 | 985 |
| 7 | 1067 | 17 | 621 | 27 | 852 |
| 8 | 643 | 18 | 693 | 28 | 1092 |
| 9 | 1017 | 19 | 648 | 29 | 706 |
| 10 | 897 | 20 | 1093 | 30 | 941 |
Tilastomuuttujana reaktioaika on luonteeltaan jatkuva. Mikäli mittaustarkkuutta lisätään riittävästi, ei yksikään mittaustulos ole täsmälleen sama. Tällaisen muuttujan tapauksessa ei ole mielekästä esittää tuloksia frekvenssitaulukkona, sillä jokaista arvoa vastaava frekvenssi olisi yksi.
Sovelletaan aineistoon ns. luokittelu-menetelmää. Merkitään tilastomuuttujaa
:llä. Aluksi selvitetään tilastomuuttujan pienin ja suurin arvo, jotta saadaan selville millä alueella mitatut muuttujan arvot sijaitsevat. Tätä väliä kutsutaan muuttujan vaihteluväliksi. Aineiston perusteella muuttujan pienin arvo on
ja suurin arvo
. Seuraavaksi valitaan sopiva osavälin pituus ja jaetaan vaihteluväliä likimain vastaava väli osavälien määräämiin luokkiin. Tässä tapauksessa on soveliasta valita muuttujan arvot
ja jakaa tämä väli luokkiin eli osaväleihin
. Frekvenssi lasketaan kullekin välille kuuluvien tilastomuuttujan arvojen lukumääränä. Tällöin voidaan mittaustulokset esittää oheisen taulukon avulla.
reaktioaika ( ) | frekvenssi |
| 600 - 700 | 30 |
| 700 - 800 | 25 |
| 800 - 900 | 18 |
| 900 - 1000 | 14 |
| 1000 - 1100 | 8 |
Esitystapa on paljon edellistä havainnollisempi. Sama jakauma voidaan esittää myös graafisesti janadiagrammina:
|