CLT255: R:n tekemän tilastollisen testin tulkinta

R laskee helposti tilastollisia testejä, mutta on kovin niukkasanainen luvuista, joita testin tuloksena ilmoitetaan. Tässä pyritään selittämään tavallisissa testeissä annettavia lukuarvoja.

Oletetaan, että meillä on vaikkapa yksi jatkuvalla asteikolla arvoja saava muuttuja x, jonka voimme kohtuudella olettaa jakautuvan normaalisti.

> x
 [1] -0.21578555  1.53750763 -0.11482989  0.64794312  0.04803974  0.64747817
 [7] -1.17039865  0.23920364  0.40032698  1.31241833  0.55277156  0.08871287
[13]  0.16493518 -0.74912422  2.02529782  0.60228575  0.41974650  1.84625101
[19] -0.53675988  0.27633037  1.07618023  0.48903472  0.19832669 -1.17312065
[25]  0.64457287 -0.34619449 -0.53883530  0.84040382  2.06116819  2.20308183
> mean(x)
[1] 0.4492323

Muuttujan x otos on kotoisin jostakin suuremmasta populaatiosta. Epäilemme, että tuossa populaatiossa x:n keskiarvo ei ehkä ole nolla. Emme kuitenkaan vielä tiedä riittääkö aineistomme koko osoittamaan sitä. Teemme siis t-testin, jossa nollahypoteesina on se, että otoksemme olisi kuitenkin kotoisin populaatiosta, jossa keskiarvo on nolla:

> t.test(x, mu=0)

   One Sample t-test

data:  x 
t = 2.7461, df = 29, p-value = 0.01025
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval:
 0.1146508 0.7838138 
sample estimates:
mean of x 
0.4492323 

Testi antaa suoraan vastauksen p-value = 0.01025, jossa se sanoo, että jos otoksemme olisi kotoisin nollakeskiarvoisesta normaalijakautuman mukaisesta populaatiosta, näin suuri tai tätä suurempikin otoskeskiarvon poikkeama tuosta nollasta tapahtuisi noin yhdessä prosentissa otoksista.

Tilastotieteessä on vakiintunut kolme näitä todennäköisyyksiä eli p-arvoja koskevaa kynnysarvoa:

  • 5 prosenttia eli melkein merkitsevä,
  • 1 prosentti eli merkitsevä ja
  • 0,1 prosenttia eli erittäin merkitsevä taso.

Otoksemme keskiarvo poikkeaa siis melkein merkitsevästi nollasta (koska p-arvo on hitusen suurempi kuin 0.01). Voisimme siis hylätä olettamuksen siitä, että populaation keskiarvo on nolla, mutta tämä päätös voisi kerran sadasta tuottaa väärän tuomion.

Ei ole tapana esittää nollahypoteesin vastaisia väitteitä, ellei saada edes melkein merkitsevää tasoa. On huomattava, että jos ottaisimme yllä olevasta aineistosta vain 20 ensimmäistä havaintoa, p-arvo kasvaisi noin 4 prosenttiin ja testi olisi vielä melkein merkitsevä ja jos ottaisimme vain 10 ensimmäistä havaintoa, p-arvo kasvaisi noin 20 prosenttiin, eikä testi enää antaisi edes melkein merkitsevää tulosta.

R antaa muitakin lukuja: t = 2.7461 kertoo t-arvon, jonka jakautuma on teoreettisesti laskettavissa, kun tiedetään kuinka monesta havainnosta keskiarvo on laskettu. Vapausasteiden määrä df = 29 kertoo tämän. Yhdessä t-arvo ja vapausasteiden määrä riittää laskemaan yllä mainitun p-arvon. R tekee kaiken tämän puolestamme, joten meidän ei tarvitse kiinnittää sen enempää huomiota t-arvoon eikä vapausasteiden määrään.

Varsinkin, jos päädymme hylkäämään nollahypoteesin, meille tulee käyttöä ns. luottamusvälille, joka on testin tuloksen loppuosassa: 95 percent confidence interval: 0.1146508 0.7838138. Nyt analyysi lähtee siitä keskiarvosta ja hajonnasta, jotka on laskettu otoksesta. Jos tarkastelemme normaalijakautumaa, jonka keskiarvo on otoksemme keskiarvo ja hajonta otoksemme hajonta, niin siitä jakautumasta saisimme tietysti eri kerroilla hiukan erilaisia otoskeskiarvoja. Varmuusväli on laskettu siten, että mille alueelle 95 % tällaisista otoksista laskettu keskiarvo sattuisi. Varmuusvälin alapuolella olevia eli pienempiä keskiarvoja kuin 0,1146508 tulisi 2,5 % ajatelluista otoksista. Vastaavasti varmuusvälin yläpuolella olevia keskiarvoja tulisi myös 2,5 prosentille ajatelluista otoksista.

Mitä voi sanoa?

Kun puhuu tilastollisen testauksen tuloksesta, pitää olla tarkka sananvalinnoista, ettei vahingossa sano vääriä asioita. Testaamisen tuloksesta voi sanoa esimerkiksi seuraavanlaisia asioita, jos testi niin osoittaa:

  • Otoksen keskiarvo erosi merkitsevästi nollasta.
  • Aineiston keskiarvo ei eronnut edes melkein merkitsevästi nollasta.
  • Otoksen keskiarvon 95 % luottamusväli on 2,27 ... 2,54.
  • Aineiston perusteella populaation keskiarvo 95 % todennäköisyydellä välillä 2,27 ... 2,54.

Sen sijaan seuraavanlaisia asioita ei pidä mennä sanomaan:

  • Populaation keskiarvo on 27 % todennäköisyydellä 152,5. (Todennäköisyyttä yksittäisille arvoille ei yleensä voida mitenkään arvioida.)
  • Otoksen keskiarvo ei ole 0. (Muuten kuin, jos otoksen keskiarvo oli nolla. Jos se oli 0,00001, niin eihän se ollut nolla.)
  • Otos ei voi olla kotoisen populaatiosta, jonka keskiarvo on nolla. (Todennäköisyys vain ehkä on pieni. Yhtä lailla olisi väärin sanoa, että kymmenessä rahanheitossa ei voi tulla kymmentä klaavaa peräkkäin.)
  • Otokset eivät voi olla kotoisin samasta populaatiosta. (Sama perustelu kuin edellisessä.)

-- KimmoKoskenniemi - 2011-12-03

 
Topic revision: r3 - 2011-12-08 - KimmoKoskenniemi
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback