F-mitta
Englanninkieliset nimitykset: F
1 score, F-score, F-measure
Suomenkieliset nimitykset: F
1-mitta, F-mitta
Käyttötarkoitus
F-mittaa käytetään yhdistämään
tarkkuus ja
saanti yhdeksi luvuksi. F-mitta kuvaa siis luokittimen hyvyyttä kokonaisuutena. Tämä mahdollistaa summittaisen "tämä luokitin on hyvä/huono" toteamisen sekä kahden luokittimen vertailun yhden numeron perusteella. Lisäksi F-mitan avulla voi arvioida miten hyvin luokitin suoriutuu eri parametrien arvoilla.
Teoria:
Katso F-mitan laskemiseen vaadittavat asiat sekä oletukset sivulta Luokittelumallin laadun mittaamisen kohdasta "Käytännön edellytykset ja oletukset".
F-mitan kaava:
Laskukaavaa katsomalla voidaan todeta seuraavaa:
- F-mitta on aina ei-negatiivinen, sillä tarkkuus ja saanti ovat positiivisia
- F-mitan arvo on 1, kun sekä tarkkuus että saanti ovat 1
- F-mitan arvo on 0, jos joko tarkkuus tai saanti on 0
- F-mitan arvoa ei ole määritelty, mikäli sekä tarkkuus että saanti ovat 0 (mutta käytännössä voidaan sanoa, että silloin F-mitta on 0)
- F-mitan vaihteluväli on [0, 1]
F-mitta on tarkkuuden ja saannin harmoninen keskiarvo. Tämä tarkoittaa, että keskiarvo "hilautuu" lähemmäs pienempää arvoa, eikä siten ole arvojen tavallinen, aritmeettinen keskiarvo. Tämä keskiarvon alenema on hyvä asia, sillä mikäli toinen mitoista on selvästi toista alempi, ei tätä huonoa suoritusta kompensoida.
F-mitta lasketaan yhdelle luokalle kerrallaan.
Esimerkki
Sairaita |
Terveitä |
++-- |
------- |
Lasketaan F-mitta sairaiden luokalle
Tarkkuus:
P = 2/(2+2) = 0.5
Saanti:
R = 2/(2+0) = 1
F-mitta on tällöin:
F = 0.67
Kuten huomataan, on F-mitan tulos pienempi kuin aritmeettinen keskiarvo (0.75).
Kyseisessä tilanteessa siis puolet luokkaan luokitelluista datapisteistä ei kultastandardin mukaan kuulu luokkaan, mutta kaikki kyseiseen luokkaan oikeasti kuuluvat pisteet ovat luokiteltu kyseiseen luokkaan.
Samankaltaiset menetelmät
F-mitan laskeminen perustuu tarkkuuteen ja saantiin.
Havainnollinen käyttöesimerkki R:llä
Tarkkuuden ja saannin laskemiseen katso:
tarkkuus,
saanti,
luokittelumallin laadun mittaaminen.
> F = 2*P1*R1/(P1+R1)
> print(F)
1
0.5714286
Käytetyt lähteet
Ensimmäinen kommentti
Toinen kommentti
--
SiniPessala - 2012-10-03