Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

  • SFST -
  • MALAGA
  • Mikko Väisäsen MALAGA-formalismin mukainen sanalista
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista
  • HunSpell

Tavoitteita

  • OpenOffice -ohjelmaan avoin suomen kielen oikeinkirjoituksen tarkistusohjelma. Tällaisen ohjelman pitäisi tunnistaa sananmuotoja ja ilmaista, mitkä niistä ovat (todennäköisesti) oikein kirjoitettuja ja mitkä väärin kirjoitettuja.
  • Täysimittainen ja kaksisuuntainen morfologinen analysaattori eli -jäsennin, joka tunnistaa sananmuodolle perusmuodon sekä taivutusta koskevat piirteet, mutta myös osaa tällaisesta perusmuodosta ja piirteistä tuottaa taivutusmuodon.
  • Voisi myös jaoitella siten, että toisaalta halutaan aika pian jotakin, joka toimii auttavasti ja toisaalta vähän pitemmän ajan kuluessa jotakin, jota voi kehittää kohti parempaa täydellisyyttä (ilman että pitää kokonaan aloittaa alusta).

Suunnitelmia

MALAGA-ohjelmaan perustuva suunnitelma

...

Nykyisen osaamisen mukainen suunnitelma korkealaatuiseksi ja ylläpidettäväksi jäsentimeksi

...

-- KimmoKoskenniemi - 12 May 2006

Edit | Attach | Print version | History: r11 | r4 < r3 < r2 < r1 | Backlinks | Raw View | Raw edit | More topic actions...
Topic revision: r1 - 2006-05-12 - KimmoKoskenniemi
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback