FreeLing 2.1 - An Open-Source Suite of Language Analyzers

Demo: http://garraf.epsevg.upc.es/freeling/demo.php

Dokumentaatio: http://garraf.epsevg.upc.es/freeling/doc/userman/html/

FreeLing ottaa syötteeksi tavanomaista tekstä ja tulostaa jokaiselle saneelle tekstissä esiintyvä muodon, perusmuodon ja sanaluokan Penn TreeBank muodossa. Sananluokan suhteen se tulostaa kaikki vaihtoehtoja painoarvoineen, todennäköisin vaihtoehto ensimmäisenä. Kokeilin englannin kielen jäsennintä.

Nettidemo vaikuttaa aika nopealta. Ohjelman saa asennettua mihin tahansa Linux-koneeseen. Dokumentaation mukaan ohjelma vie 50Mb levytilaa. Muita erityisiä vaatimuksia ei ole.

FreeLingin dokumentaation mukaan Englannin kielen sanakirjassa on 55,000 sanamuotoa ja 40,000 eri lemma-PoS yhdistelmiä. Näiden tietojen ja oman kokeilun mukaan kattavuus ja tarkkuus on erittäin hyvä. Ohjelma ei erota johtimia eikä erota yhdyssanojen rajakohtia. Ohjelma sietää hyvin virheellisiä muotoja. Se ei yritä ehdottaa tuntemattomille sananmuodoille vaihtoehtoa, vaan käsittelee ne sellaisenaan ja antaa arvion niiden sanaluokasta.

Esimerkki: "The FreeLing package consists of a library providing language analysis services."

Tulos: Analysis Results Sentence #1

The the DT 1

FreeLing freeling NP 1

package package NN 0.962199 package VB 0.0343643 package VBP 0.00343643

consists consist VBZ 1

of of IN 0.999907 of RP 9.27025e-05

a 1 Z 0.99998 a DT 2.03774e-05

library library NN 1

providing provide VBG 1

language language NN 1

analysis analysis NN 1

services service NNS 0.498797 services NNS 0.498797 service VBZ 0.00240674

. . Fp 1

-- HeikoSchach - 2009-01-27

Topic revision: r2 - 2009-02-05 - HeikoSchach
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback