F-mitta

Englanninkieliset nimitykset: F1 score, F-score, F-measure
Suomenkieliset nimitykset: F1-mitta, F-mitta

Käyttötarkoitus

F-mittaa käytetään yhdistämään tarkkuus ja saanti yhdeksi luvuksi. F-mitta kuvaa siis luokittimen hyvyyttä kokonaisuutena. Tämä mahdollistaa summittaisen "tämä luokitin on hyvä/huono" toteamisen sekä kahden luokittimen vertailun yhden numeron perusteella. Lisäksi F-mitan avulla voi arvioida miten hyvin luokitin suoriutuu eri parametrien arvoilla.

Teoria:

Katso F-mitan laskemiseen vaadittavat asiat sekä oletukset sivulta Luokittelumallin laadun mittaamisen kohdasta "Käytännön edellytykset ja oletukset".

F-mitan kaava:

f-measure.png

Laskukaavaa katsomalla voidaan todeta seuraavaa:

  • F-mitta on aina ei-negatiivinen, sillä tarkkuus ja saanti ovat positiivisia
  • F-mitan arvo on 1, kun sekä tarkkuus että saanti ovat 1
  • F-mitan arvo on 0, jos joko tarkkuus tai saanti on 0
  • F-mitan arvoa ei ole määritelty, mikäli sekä tarkkuus että saanti ovat 0 (mutta käytännössä voidaan sanoa, että silloin F-mitta on 0)
  • F-mitan vaihteluväli on [0, 1]

F-mitta on tarkkuuden ja saannin harmoninen keskiarvo. Tämä tarkoittaa, että keskiarvo "hilautuu" lähemmäs pienempää arvoa, eikä siten ole arvojen tavallinen, aritmeettinen keskiarvo. Tämä keskiarvon alenema on hyvä asia, sillä mikäli toinen mitoista on selvästi toista alempi, ei tätä huonoa suoritusta kompensoida.

F-mitta lasketaan yhdelle luokalle kerrallaan.

Esimerkki

Sairaita Terveitä
++-- -------

Lasketaan F-mitta sairaiden luokalle

Tarkkuus:
P = 2/(2+2) = 0.5

Saanti:
R = 2/(2+0) = 1

F-mitta on tällöin:
F = 0.67

Kuten huomataan, on F-mitan tulos pienempi kuin aritmeettinen keskiarvo (0.75).

Kyseisessä tilanteessa siis puolet luokkaan luokitelluista datapisteistä ei kultastandardin mukaan kuulu luokkaan, mutta kaikki kyseiseen luokkaan oikeasti kuuluvat pisteet ovat luokiteltu kyseiseen luokkaan.

Samankaltaiset menetelmät

F-mitan laskeminen perustuu tarkkuuteen ja saantiin.

Havainnollinen käyttöesimerkki R:llä

Tarkkuuden ja saannin laskemiseen katso: tarkkuus, saanti, luokittelumallin laadun mittaaminen.

> F = 2*P1*R1/(P1+R1)
> print(F)
        1 
0.5714286

Käytetyt lähteet

Ensimmäinen kommentti

Toinen kommentti

-- SiniPessala - 2012-10-03

Topic attachments
I Attachment Action Size Date Who Comment
PNGpng f-measure.png manage 1.2 K 2012-10-10 - 18:15 UnknownUser  
Topic revision: r2 - 2012-10-10 - SiniPessala
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback