Back to: SuomenKielipankki:Helpdesk

Helpdesk Item: Lemmie Truncates Statistical Measurements

Description of the Problem

Olen työskennellyt melko paljon Lemmie 2:n kanssa ja huomannut seuraavan asian: Käyttäessäni kollokaatioden merkitsevyyslaskennassa vaikkapa Mi- tai t-testiä, tulos ilmoittaa merkitsevyysarvoksi tasalukua, esim. 4,000000000000 tai 8,000000000. Sama on suhteellisen osuuden kanssa. Koska luvut eivät tosiasiassa ole tasalukuja, miten tämän voisi korjata? Onko jokin asetus sellainen joka vaikuttaa tähän?

HAKU 1

  • Lähtötiedot:
    • hakusana: bf auto
    • korpus Aamulehti 1995; 3 838 400 sanetta
    • span: 2 + 2 (eli 4) Auto-esiintymät 2222 korpuksessa, josta kaavaan saadaan kaikkien esiintymien span 8888 (jota tarvitaan kaavassa) (noodin ja kollokaattien laskenta bf:stä)
  • Tulos: kollokaatti " bf varastaa" spanissa 43 esiintymää (korpusfrekvenssi 233)
    • ohjelma antaa: t-testin pyöristetty arvo 6 ja MI-testin pöyristetty arvo 6
    • laskin itse ko. arvot: t-testi 6,475 ja MI-testi 6,31

HAKU 2

  • Lähtötiedot:
    • Kollokaatti "bf vanhahko"
  • Tulos:
    • ohjelma: MI-testi 6
    • oma laskelma: 6,879 !!

TULKINTA

Siispä näyttää siltä, että kaavassa (molemmissa) on jossain kohtaa pyöristys - tai sitten siinä, miten luvut esitetään tuloksissa. Pöyristyy tapahtuu niin, että ohjelma ottaa vain huomioon ensimmäisen luvun eikä siis tee varsinaista pyöristystä, koska pitäisihän tuon olla 7.

Periaatteessa siis ohjelma antaa suuntaviivaa tilastollisesta merkitsevyydestä. Ongelma tuleekin esittämisen ja rajakohtien kanssa: yleensähän näitä tunnuslukuja ei esitetä pyöristettyina. Ja esim. MI-testin rajakohtana pidetään usein 1,58 , joten tässä pyöristys johtaa pahastikin harhaan.

The Answer(s)

Ongelma johtui virheellisestä tulostuksesta Lemmiessä. Lemmie 2 on päivitetty, ja se näyttää testien tulokset oikein.

-- EeroVitie - 15 Feb 2007

Metadata

Tämän on ongelman raportoinut lehtori dos. Jarmo Jantunen Oulun yliopiston Suomen kielen, informaatiotutkimuksen ja logopedian laitokselta. Helpdesk-itemin tallensi AnssiYliJyra - 21 Aug 2006.
HelpdeskForm
HelpdeskProblemName Lemmie Truncates Statistical Significance Values
HelpdeskProblemAbstract Käyttäessäni kollokaatioden merkitsevyyslaskennassa vaikkapa Mi- tai t-testiä, tulos ilmoittaa merkitsevyysarvoksi tasalukua.
HelpdeskUrgency FullyResponded
HelpdeskNumberOfUsers 50
HelpdeskDateIssued 2006-08-07
Topic revision: r2 - 2007-02-15 - EeroVitie
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback