6: Todennäköisyys ja tilastot
Esimerkit

Esimerkki 1    Kirjastossa asiakkaiden käytössä olevien tietokoneiden käyttöä automaattisesti seurattaessa saatiin oheisen taulukon mukaiset tiedot asiakkaan selaamien internet-sivujen lukumäärästä ja yksittäisten istuntojen kestosta.

asiakassivujen lukumääräistunnon kesto (min)asiakassivujen lukumääräistunnon kesto (min)
1515,3911679,56
2375,0612312,23
3211,2813633,98
4853,1141036,95
5422,5115414,73
6943,9716530,59
745,2517538,04
81056,0918310,07
9312,0619862,09
10417,53201074,13

Laaditaan selattujen sivujen lukumäärää kuvaava jakauma ja määritetään sen keskiarvo, vaihteluväli ja keskihajonta.

Selattujen sivujen lukumäärää kuvaavan jakauman esitykseksi taulukkona saadaan

sivujen lukumääräfrekvenssi
10
21
34
44
53
62
70
82
91
103

Keskiarvo voidaan laskea summaamalla alkuperäisessä taulukossa sivujen lukumääriä osoittavien sarakkeiden arvot ja jakamalla summa istuntojen lukumäärällä.

asiakassivujen lukumääräistunnon kesto (min)asiakassivujen lukumääräistunnon kesto (min)
1515,3911679,56
2375,0612312,23
3211,2813633,98
4853,1141036,95
5422,5115414,73
6943,9716530,59
745,2517538,04
81056,0918310,07
9312,0619862,09
10417,53201074,13
 summa: 52  summa: 60 

Keskiarvoksi saadaan

$\displaystyle \mathsf{\bar{x}=\frac{52 + 60}{20} = 5,6}$

Keskimääräinen selattujen sivujen lukumäärä on siis 5,6. Vaihteluväli on pienimmän ja suurimman arvon määräämä väli eli $ \mathsf{[2,10]}$ ja vaihteluvälin pituus on

$\displaystyle \mathsf{R=x_{max}-x_{min}= 8}$

Keskihajonnan kaava on muotoa

$\displaystyle \mathsf{s = \sqrt{\frac{1}{n}\sum_{i=1}^{n}\left( x_i-\bar{x} \right)^2}}$

Tämän laskemiseksi merkitään taulukkoon termien $ \mathsf{(x_i-\bar{x})^2}$ arvot ja lasketaan niiden summa.

asiakassivujen lukumääräasiakassivujen lukumäärä
150,361160,16
236,761236,76
3212,961360,16
485,76141019,36
542,561542,56
6911,561650,36
742,561750,36
81019,361836,76
936,761985,76
1042,56201019,36
  summa: 71,2  summa: 61,6

Näin saadaan

$\displaystyle \mathsf{\sum_{i=1}^{n}\left( x_i-\bar{x} \right)^2=71,2 + 61,6 = 132,8}$

ja keskihajonta voidaan laskea.

$\displaystyle \mathsf{s=\sqrt{\frac{1}{20}\cdot 132,8}\approx 2,58}$

Esimerkki 2    Jatketaan edellisen tehtävän tilastoaineiston käsittelyä. Istunnon kesto on luonteeltaan jatkuva tilastomuuttuja. Jaetaan muuttujan arvot kahdeksaan kymmenen minuutin luokkaan, jolloin jakauman taulukkoesitykseksi saadaan

istunnon kesto (min)frekvenssi
0 - 101
10 - 207
20 - 301
30 - 404
40 - 501
50 -602
60 - 701
70 - 803

Selvitetään nyt tämän jakauman keskiarvo, vaihteluväli, keskihajonta, moodi ja mediaani. Keskiarvon laskemiseksi merkitään taulukkoon luokkakeskukset $ \mathsf{x_i}$ ja lasketaan niiden sekä luokkien frekvenssien $ \mathsf{f_i}$ tulot omaan sarakkeeseensa.

istunnon kesto (min)luokkakeskus (min)frekvenssi tulo
0 - 10515
10 - 20157105
20 - 3025125
30 - 40354140
40 - 5045145
50 -60552110
60 - 7065165
70 - 80753225
   summa: 720

Nyt keskiarvo voidaan laskea luokitellun aineiston keskiarvon kaavalla

$\displaystyle \mathsf{\bar{x}=\frac{1}{n} \sum_{i=1}^{m}f_i x_i=\frac{1}{20}\cdot 720=36}$

Vaihteluväli on jälleen pienimmän ja suurimman arvon määrämä väli $ \mathsf{[5.25 , 79.56]}$ ja näiden erotus $ \mathsf{x_{max}-x_{min}= 74,31}$ on vaihteluvälin pituus $ \mathsf{R}$.

Keskihajonta lasketaan luokitellun aineiston keskihajonnan kaavalla

$\displaystyle \mathsf{s = \sqrt{\frac{1}{n}\sum_{i=1}^{n} f_i \left( x_i-\bar{x} \right)^2}}$

Tätä varten lasketaan taulukkon luokkakohtaisten frekvenssien $ \mathsf{f_i}$ ja termien $ \mathsf{(x_i-\bar{x})^2}$ tulot ja näiden summa.

istunnon kesto (min)luokkakeskus (min)frekvenssi tulo
0 - 1051961961
10 - 201574413087
20 - 30251121121
30 - 4035414
40 - 504518181
50 -60552361722
60 - 70651841841
70 - 8075315214563
    summa: 10380

Keskihajonta on siis

$\displaystyle \mathsf{s = \sqrt{\frac{1}{20}\cdot 10380} \approx 22,78}$

Jakauman tyyppiarvo eli moodi on luokka, jolla on suurin frekvenssi eli $ \mathsf{Mo}$ on luokka $ \mathsf{10 - 20}$. Mediaani on puolestaan luokka, jonka alueella frekvenssien summa saa arvon $ \mathsf{\frac{n}{2}=\frac{20}{2}=10}$ eli tässä tapauksessa $ \mathsf{Md}$ on luokka $ \mathsf{30 - 40}$.

HUOM: Luokitellun tilastomuuttujan keskiarvo ja keskihajonta olisi voitu laskea myös ennen luokittelua käyttäen alkuperäisiä arvoja ja samoja kaavoja kuin ensimmäisessä tapauksessa. Usein luokitellun muuttujan alkuperäiset arvot eivät kuitenkaan ole käytettävissä ja on tyydyttävä tässä esitettyyn laskutapaan. Mikäli alkuperäinen, luokitelematon, aineisto on käytettävissä saadaan sen avulla tarkempi tulos.

PITKÄ MATEMATIIKKA
Kurssin etusivu
Tilastolliset jakaumat
Jakauman tunnusluvut
Esimerkit
Tehtävät
Todennäköisyyden käsite
Kombinaatio-oppia
Kertolaskusääntö
Komplementtitapaus
Yhteenlaskusääntö
Toistokoe
Diskreetti jakauma
Jatkuva jakauma
Normaalijakauma
Soveltavat tehtävät
Harjoituskoe
Sivukartta
OpetushallitusEtälukio KäyttöehdotOhjeet