Mann Whitney U -metodi

Käyttötarkoitus ja perusteet

Mann-Whitney U -testi on ei-parametrinen testi, jossa testataan saako toinen otoksista suurempia arvoja kuin toinen. Laskelmat perustuvat sijalukuihin, joita vertaamalla lasketaan miten usein otoksen A arvot ovat suurempia kuin otoksen B arvot.

Testi perustuu vähän samaan ajatteluun kuin järjestyskorrelaatiokin (Spearman rank correlation) eli siihen, että muuttujien arvot korvataan niiden järjestysluvuilla (laskettuna molempien ryhmien yhteisessä aineistossa). Jos tässä järjestyksessä tulee keskenään yhtä suuria arvoja eri ryhmistä, tällaiset parit poistetaan. Jäljelle jäävistä lasketaan yhdestä ryhmästä, kuinka monta toisen ryhmän jäsentä kukin sen arvo "voittaa". Tätä, ns. U-arvoa verrataan sitten taulukkoon, jossa on laskettu U:n jakautuma, jos molemmat otokset olisi otettu samasta populaatiosta.

Testiä voi käyttää mm. silloin kun ollaan sitä mieltä että keskiarvo ei kuvaa hyvin tulosten eroa.

Käytön edellytykset ja oletukset

Mann-Whitney -testissä ei oleteta normaalijakautuneisuutta. Mikäli otokset ovat normaalijakauman mukaisia, silloin on tehokkaampaa käyttää 2-sample t-testiä.

  • Otokset tulee olla riippumattomia toisistaan
  • Tulokset pitää pystyä laittamaan ordinaaliseen järjestykseen lukeman suuruuden mukaisesti (x > y, x < y)

Samankaltaiset menetelmät

2-sample t-test on hyvin samankaltainen metodi, jossa verrataan kahden otoksen mediaaneja keskenään.

http://ccnmtl.columbia.edu/projects/qmss/the_ttest/twosample_ttest.html

Tärkeimmät erityispiirteet suhteessa muihin

Mann Whitney -metodin vastapari on edellä mainittu kahden otoksen t-testi. Siinä missä t-testissä tulosten jakauma molemmissa otoksissa oletetaan samankaltaiseksi, Mann Whitney -testissä tällaista oletusta ei tehdä.

Testin palauttamat arvot

U-testiä laskettaessa siirrytään havaintoarvoista pelkkiin järjestyslukuihin korvaamalla pienin arvo järjestysluvulla 1, toiseksi pienin luvulla 2 ja niin edelleen. Mann Whitney U -testi perustuu järjestyslukujen summaan.

Testi palauttaa sijalukujen summan, sekä p-luvun, jonka avulla voi arvioida otosten eroavuuden tilastollista merkittävyyttä.

Havainnollinen esimerkki R:llä

Otamme esimerkiksi tenttitulokset ennen ja jälkeen tutkintouudistuksen. Haluamme verrata ovatko ne muuttuneet tutkintouudistuksen jälkeen:

Otanta 1 (ennen uudistusta): 1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,5,5,5

Otanta 2 (jälkeen uudistuksen): 1,1,2,2,2,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5

Muodostetaan lukemista vektorit:

a <- c(1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,5,5,5) 
b <- c(1,1,2,2,2,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5,5,5,5,5) 



R:ssä wilcox.test palauttaa Mann Whitney U testin tulokset:

> wilcox.test(a,b)

Wilcoxon rank sum test with continuity correction
data: a and b 
W = 179, p-value = 0.00815 

Merkitsevyyden tunnistaminen arvoista

Merkitsevyyden tunnistus perustuu p-arvoon. Tilastollisesti luotettavan tuloksen rajana pidetään usein p-arvoa 0.05. Tarkemmin p-luvuista alla:

https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HyClt255s2011TestinTulkinta

Arvojen tulkinta

Mann-Whitney U -testi perustuu sijalukuihin. Tarkasteltavan muuttujan arvot laitetaan suuruusjärjestykseen ja niille annetaan suuruusjärjestykseen pohjautuvat sijaluvut. Kummallekin ryhmälle sijaluvut lasketaan yhteen. Jos jakaumat ovat samankaltaiset, niin sijalukujen summan pitäisi olla molemmissa ryhmissä saman suuruinen.

  • P-arvo kertoo tilastollisen merkittävyyden
  • W-arvo, jonka wilcox.test(a,b) palauttaa on sijalukujen summa.

Lähteet (kaikkia ei käytetty, osa vain materiaalina, johon palata)

Mikä on Mann Whitney -metodi?

http://en.wikipedia.org/wiki/Mann%E2%80%93Whitney_U

http://tilastoapu.wordpress.com/2012/03/08/mann-whitney-u-testi/

http://www.isixsigma.com/tools-templates/hypothesis-testing/making-sense-mann-whitney-test-median-comparison/

Esimerkki tulosten järjestämisestä:

http://www.brightstat.com/index.php?option=com_content&task=view&id=35&Itemid=1&limit=1&limitstart=1

R-esimerkkejä:

http://stat.ethz.ch/R-manual/R-patched/library/stats/html/wilcox.test.html

Mikä on t-testi (two sample test) ?

http://ccnmtl.columbia.edu/projects/qmss/the_ttest/twosample_ttest.html

P-arvoista:

http://fi.wikipedia.org/wiki/P-arvo

Normaalijakauman laskeminen R:llä

http://www.r-tutor.com/elementary-statistics/probability-distributions/normal-distribution

Alustava kommentti Leolta

Selkeä ja ymmärrettävä teksti. Käytännön esimerkki oli hyödyllinen ja selkeä. Palaan kommentoimaan tarkemmin kun sivu on merkitty valmiiksi.

Ensimmäinen kommentti

Antoinen kommentteja:

* En tuntenut Mann-Whitneyn U-testiä. Sivusi ansiosta minulla on nyt käsitys tästä testistä.

* Jaksossa "Käytön edellytykset ja oletukset" voisit tarkentaa, onko otosten koolla väliä: voiko testiä käyttää myös pienillä otoksilla?

Toissijaisia huomioita:

* Jakson "Havainnollinen esimerkki R:llä" lopussa kirjoitat: "Koska p-luvun arvo < 0.05, voimme todeta että toisen otoksen arvot ovat myös tilastollisesti merkittävästi suurempia kuin toisen.". Sivun https://kitwiki.csc.fi/twiki/bin/view/KitWiki/HyClt255s2011TestinTulkinta mukaan pitäisi ilmeisesti kirjoittaa: "Koska p-luvun arvo < 0.01, [...]".

* Myös wilcox.test(b,a) tulostaa tekstin "Wilcoxon rank sum test with continuity correction".

* Luettavuuden kannalta koodi on hyvä erottaa ympäröivästä tekstistä <verbatim>:lla.

Toinen kommentti Samilta

Hyvä ja havainnollinen sivu. Epäselvää on se, mitä tuo W-arvo oikein tarkoittaa?

Vastaus ensimmäiseen kommenttiin

Kiitos kommentista ja huomioista. Todennäköisesti (ja pienen testinkin avulla) voin sanoa, että otosten ollessa kooltaan liian pieniä p-arvo kasvaa, koska todennäköisyys siihen että otoksissa esiintyvät erot voivat yhtä hyvin johtua sattumasta kasvavat.

Vastaus toiseen kommenttiin

W -arvo on ymmärtääkseni sama kuin U -arvo eli sijalukujen summa. Meillä voi olla esimerkiksi seuraavat ryhmät:

Ryhmä A: 10, 30, 60 
Ryhmä B: 20, 40, 50

Nämä voidaan laittaa suuruusjärjestyksen mukaan sijoihin ja laskea sijalukujen summat:

Ryhmä A: 1 + 3 + 6 = 10 
Ryhmä B: 2 + 4 + 5 = 11 

W / U -luku saadaan kun sijoitusten yhteenlasketusta summasta vähennetään heikoin sijoitus mitä koko otannassa (A ja B mukaanlukien) on. Tässä tapauksessa se on ryhmän A sijoitus 6:

Ryhmä A: 10 - 6 = 4
Ryhmä B: 11 - 6 = 5

Voit testata tätä myös R:llä.

-- ErkkiIlmariRajakoski - 2012-09-28

Topic revision: r10 - 2012-10-20 - ErkkiIlmariRajakoski
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback