Tilastollinen merkitsevyys ja p-arvo

Käyttötarkoitus

Tilastollista merkitsevyyttä laskemalla pyritään selvittämään, miten todennäköisesti löydetty otoksen ja oletetun perusjoukon välillä esiintyvä ero johtuu jostain muusta kuin otoksen arvojen ja perusjoukon keskiarvon välillä luonnollisesti esiintyvästä vaihtelusta. Merkitsevyyttä ilmaistaan p-arvolla, joka kertoo millä todennäköisyydellä otos kuuluu perusjoukkoon.

Esimerkki käytöstä

Halutaan selvittää pidentääkö tietty uusi lääke kuolettavasta taudista X kärsivien potilaiden elinikää. Tämän selvittämiseksi annamme osalle sairaista uutta lääkettä. Tutkimuksen loputtua vertaamme lääkettä saaneiden elinikää taudin alkamisesta lähtien ilman lääkettä olleisiin. Vaikka lääkettä saaneet elivätkin keskimäärin pidempään kuin ilman lääkettä jääneet, emme voi varmasti sanoa etteikö kyseessä olisi ollut sattuma: eliniässä on luonnostaan tiettyä satunnaisuutta. Laskemme siis p-arvon, joka kertoo miten todennäköisesti tämä otos (lääkettä saaneet) kuuluu perusjoukkoon (ilman lääkettä olleet), eli tutkimme onko otoksen ja perusjoukon ero tilastollisesti merkitsevä.

P-arvojen tulkinta

Koska p-arvo kuvaa todennäköisyyttä, ei sen tulkinnalle voida asettaa mitään ehdotonta raja-arvoa, jonka jälkeen tietty tulos olisi täysin varmasti jotain muuta kuin sattumaa. Yleinen konventio kuitenkin on, että mikäli todennäköisyys otoksen perusjoukkoon kuulumiseen on pienempi kuin 5 %, eli p < 0,05, on se "melkein merkitsevä", alle prosentin ( p < 0,01 ) todennäköisyys on "merkitsevä" ja alle promillen (0,1% eli p < 0,001) "erittäin merkitsevä"

Käyttöesimerkki R:llä

Jatkamme yllä esitettyä lääke-esimerkkiä. Olemme koonneet taulukon, jossa on lääkettä saaneiden eliniän ero vuosissa suhteessa ilman lääkettä olleiden keskimääräiseen elinikään. Toisin sanoen arvo "-0.21" merkitsee kyseisen henkilön eläneen taudin sairastumisensa jälkeen 0.21 vuotta eli 76 päivää vähemmän kuin ilman lääkettä olevat keskimäärin.

> elinaika
[1] -0.05 -0.15 1.03 0.61 0.52 0.03 -0.94 0.53 0.95 1.29
[11] 0.42 -0.97 -0.01 0.21 0.76 1.38 -0.08 -0.58 -0.33 -0.95
[21] 0.48 0.95 -0.24 -0.21 -0.42 0.99 0.92 1.25 0.31 1.49

> mean(elinaika)
[1] 0.3063333

Haluamme tietää mikä todennäköisyys on sille, että otoksemme kuuluu perusjoukkoon, jonka keskimääräinen elinikä on sama kuin lääkettä saamattomien potilaiden, eli tässä tapauksessa nolla. Suoritamme siis t-testin, jonka nollahypoteesi on, että otoksemme kuuluu perusjoukkoon jonka keskiarvo on 0.

> t.test(elinaika, mu=0)

One Sample t-test

data: elinaika
t = 2.3519, df = 29, p-value = 0.02568
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
0.03994675 0.57271991
sample estimates:
mean of x
0.3063333

Saimme tuloksena p-arvon 0.02568, joka kertoo yllä olevan nollahypoteesin oikeellisuuden todennäköisyydeksi hiukan alle 2.6%. Koska p-arvomme on pienempi kuin 0,05, mutta suurempi kuin 0,01, voimme siis sanoa tämän testin perusteella, että kyseessä on "tilastollisesti melkein merkitsevä ero".

Käytetyt lähteet

https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HyClt255s2011TestinTulkinta

http://fi.wikipedia.org/wiki/Tilastollinen_merkitsevyys

http://en.wikipedia.org/wiki/Statistical_significance

-- LeoLeppanen - 2012-10-04

Edit | Attach | Print version | History: r4 < r3 < r2 < r1 | Backlinks | Raw View | Raw edit | More topic actions...
Topic revision: r1 - 2012-10-04 - ljleppan
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback