Difference: AvoinSuomenKielenMorfologinenJasennin (1 vs. 11)

Revision 112008-11-21 - HennaRiikkaLaitinen

Line: 1 to 1
Changed:
<
<
META TOPICPARENT name="VirtualOrganizations"
>
>
META TOPICPARENT name="Old.VirtualOrganizations"
 

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

Revision 102008-11-05 - HennaRiikkaLaitinen

Line: 1 to 1
 
META TOPICPARENT name="VirtualOrganizations"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 37 to 37
 Kommentteja, lisää vapaasti:
 
<--/commentPlugin-->

-- KimmoKoskenniemi - 12 May 2006

Changed:
<
<
META TOPICMOVED by="AnssiYliJyra" date="1156926948" from="KitWiki.AvoinSuomenKielenMorfologinenJasennin" to="KitWiki.Challenge:AvoinSuomenKielenMorfologinenJasennin"
>
>
META TOPICMOVED by="HennaRiikkaLaitinen" date="1225878432" from="KitWiki.Challenge:AvoinSuomenKielenMorfologinenJasennin" to="KitWiki.AvoinSuomenKielenMorfologinenJasennin"

Revision 92006-09-05 - AnssiYliJyra

Line: 1 to 1
Changed:
<
<
META TOPICPARENT name="Community"
>
>
META TOPICPARENT name="VirtualOrganizations"
 

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

Revision 82006-08-30 - AnssiYliJyra

Line: 1 to 1
 
META TOPICPARENT name="Community"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 37 to 37
 Kommentteja, lisää vapaasti:
 
<--/commentPlugin-->

-- KimmoKoskenniemi - 12 May 2006

Changed:
<
<
META TOPICMOVED by="AnssiYliJyra" date="1155715943" from="KitWiki/Community.AvoinSuomenKielenMorfologinenJasennin" to="KitWiki.AvoinSuomenKielenMorfologinenJasennin"
>
>
META TOPICMOVED by="AnssiYliJyra" date="1156926948" from="KitWiki.AvoinSuomenKielenMorfologinenJasennin" to="KitWiki.Challenge:AvoinSuomenKielenMorfologinenJasennin"

Revision 72006-08-16 - AnssiYliJyra

Line: 1 to 1
Changed:
<
<
META TOPICPARENT name="KitWiki.Community"
>
>
META TOPICPARENT name="Community"
 

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

Line: 37 to 37
 Kommentteja, lisää vapaasti:
 
<--/commentPlugin-->

-- KimmoKoskenniemi - 12 May 2006 \ No newline at end of file

Added:
>
>
META TOPICMOVED by="AnssiYliJyra" date="1155715943" from="KitWiki/Community.AvoinSuomenKielenMorfologinenJasennin" to="KitWiki.AvoinSuomenKielenMorfologinenJasennin"

Revision 62006-08-14 - AnssiYliJyra

Line: 1 to 1
Changed:
<
<
META TOPICPARENT name="WebHome"
>
>
META TOPICPARENT name="KitWiki.Community"
 

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

Revision 52006-06-05 - KimmoKoskenniemi

Line: 1 to 1
 
META TOPICPARENT name="WebHome"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 7 to 7
 
  • SFST -
  • MALAGA
  • Hannu Väisäsen MALAGA-formalismin mukainen sanalista
Changed:
<
<
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista, jonka saattamisesta yleisemmin käytettäväksi tietää eniten Kotuksen Ritva Paananen, jonka s-postiosoite on muotoa etunimi.sukunimi@kotus.fi
>
>
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista, jonka saattamisesta yleisemmin käytettäväksi tietävät eniten Kotuksen Toni Nykänen ja Ritva Paananen, joide s-postiosoite on muotoa etunimi.sukunimi@kotus.fi (pisteettömillä ääkkösillä).
 

Tavoitteita

Revision 42006-06-05 - KimmoKoskenniemi

Line: 1 to 1
 
META TOPICPARENT name="WebHome"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 6 to 6
 
  • SFST -
  • MALAGA
Changed:
<
<
  • Mikko Väisäsen MALAGA-formalismin mukainen sanalista
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista
>
>
  • Hannu Väisäsen MALAGA-formalismin mukainen sanalista
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista, jonka saattamisesta yleisemmin käytettäväksi tietää eniten Kotuksen Ritva Paananen, jonka s-postiosoite on muotoa etunimi.sukunimi@kotus.fi
 

Tavoitteita

Line: 23 to 23
 ...

Kommentteja, lisää vapaasti:

 
<--/commentPlugin-->
Added:
>
>
  • Tietysti ... alitajunnastani pulpahti toisen henkilön nimi. -- KimmoKoskenniemi - 05 Jun 2006 - 10:43
 
  • Oletan, että yllä mainittu MALAGA-kehittäjä Väisänen on Hannu, ei Mikko. -- EliasAarnio - 02 Jun 2006 - 11:06

Nykyisen osaamisen mukainen suunnitelma korkealaatuiseksi ja ylläpidettäväksi jäsentimeksi

Revision 32006-06-02 - EliasAarnio

Line: 1 to 1
 
META TOPICPARENT name="WebHome"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 23 to 23
 ...

Kommentteja, lisää vapaasti:

 
<--/commentPlugin-->
Added:
>
>
  • Oletan, että yllä mainittu MALAGA-kehittäjä Väisänen on Hannu, ei Mikko. -- EliasAarnio - 02 Jun 2006 - 11:06
 

Nykyisen osaamisen mukainen suunnitelma korkealaatuiseksi ja ylläpidettäväksi jäsentimeksi

Revision 22006-05-14 - KimmoKoskenniemi

Line: 1 to 1
 
META TOPICPARENT name="WebHome"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Line: 22 to 22
  ...
Added:
>
>
Kommentteja, lisää vapaasti:
 
<--/commentPlugin-->
 

Nykyisen osaamisen mukainen suunnitelma korkealaatuiseksi ja ylläpidettäväksi jäsentimeksi

Changed:
<
<
...
>
>
Äärellisiin transduktoreihin perustuvalla ratkaisulla saavutetaan kaksisuuntaisuus ilman eri toimenpiteitä, siis morfologiseen analyysiin pystyvä transduktorileksikko käy sellaisenaan myös taivutettujen sananmuotojen tuottamiseen. Jo pelkästään tästä syystä tällaine ratkaisu on toivottava.

Äärellisten transduktorien käsittelyä esim. morfologista analyysiä varten on olemassa useita ohjelmia ks. Wikipedia (http://en.wikipedia.org/wiki/Finite_state_machine), josta jotkut kuten Xeroxin XFST (ks. http://www.xrce.xerox.com/competencies/content-analysis/fst/) ja ATT:n FSM Library (ks. http://public.research.att.com/~fsmtools/fsm/) ovat kaupallisia, mutta rajattuun akateemiseen käyttöön saatavilla. On myös avoimeen lähdekoodiin perustuvia täysin vapaita transduktoreita käsitteleviä ohjelmia, mm. SFST (ks. http://www.ims.uni-stuttgart.de/projekte/gramotron/SOFTWARE/SFST.html), joiden etuna on se että niillä tehtyjä transduktorileksikoita voidaan hyödyntää kaikkiin tarkoituksiin ilman rajoituksia.

Kommentteja, lisää vapaasti:

 
<--/commentPlugin-->
  -- KimmoKoskenniemi - 12 May 2006 \ No newline at end of file

Revision 12006-05-12 - KimmoKoskenniemi

Line: 1 to 1
Added:
>
>
META TOPICPARENT name="WebHome"

Avoimen lähdekoodin morfologinen jäsennin suomen kielelle: kaavailuja, osasia ja osapuolia

Olemassa olevia osasia

  • SFST -
  • MALAGA
  • Mikko Väisäsen MALAGA-formalismin mukainen sanalista
  • Kotuksen luettelo Kielitoimiston sanakirjan hakusanoista ja niiden taivutusluokista
  • HunSpell

Tavoitteita

  • OpenOffice -ohjelmaan avoin suomen kielen oikeinkirjoituksen tarkistusohjelma. Tällaisen ohjelman pitäisi tunnistaa sananmuotoja ja ilmaista, mitkä niistä ovat (todennäköisesti) oikein kirjoitettuja ja mitkä väärin kirjoitettuja.
  • Täysimittainen ja kaksisuuntainen morfologinen analysaattori eli -jäsennin, joka tunnistaa sananmuodolle perusmuodon sekä taivutusta koskevat piirteet, mutta myös osaa tällaisesta perusmuodosta ja piirteistä tuottaa taivutusmuodon.
  • Voisi myös jaoitella siten, että toisaalta halutaan aika pian jotakin, joka toimii auttavasti ja toisaalta vähän pitemmän ajan kuluessa jotakin, jota voi kehittää kohti parempaa täydellisyyttä (ilman että pitää kokonaan aloittaa alusta).

Suunnitelmia

MALAGA-ohjelmaan perustuva suunnitelma

...

Nykyisen osaamisen mukainen suunnitelma korkealaatuiseksi ja ylläpidettäväksi jäsentimeksi

...

-- KimmoKoskenniemi - 12 May 2006

 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback