Difference: OFiTwol (8 vs. 9)

Revision 92012-02-26 - KimmoKoskenniemi

Line: 1 to 1
 

OFiTwol: Avoimen lähdekoodin morfologinen jäsennin suomen kielelle

Tämän hankkeen tavoitteena on laatia kohtuullisen helposti ylläpidettävä suomen kielen morfologinen jäsennin, jonka mallin mukaan lingvistit voisivat ylläpitää ja kehittää muidenkin kielten morfologisia jäsentimiä. Ylläpidettävyyteen sisältyy myös tavoite muunneltavuudesta ja joustavuudesta.

Line: 9 to 9
 digraph OFiTwol { rankdir=LR; size="8,5"
Added:
>
>
NSL [ shape=box, color=white ];
  WordsCSV [ shape=box ]; Rules [ shape=box ]; subgraph cluster_1 { rank=same ; color=white ;
Line: 33 to 34
 }
Added:
>
>
Jäsennintä ylläpidettäessä ja täydennettäessä päivitetään yleensä vain sanastoa (WordsCSV). Jäsentimen rakentamisen alkuvaiheessa laaditaan symboleja, piirteitä, affikseja ja sääntöjä koskevat tiedostot ja viritellään ne toimiviksi. Työn edetessä ne toimivat lähinnä dokumentaationa, josta voi tarkistaa symbolien, piirteiden ja esim. taivutusluokkien käyttöä ja määritelmiä.
 

Symbolien ja piirteiden taulukot

Merkistön dokumentointia varten olisi oma taulukko SymbolCSV, jossa määritellään ainakin kaikki äännevaihteluita kuvaavat morfofoneemit ja rajasymbolit (jotka voivat olla useammasta merkistä koostuvia symboleja). Kieliopillisia kategorioita kuvaavat morfosyntaktiset piirteet sekä morfologista kombinatoriikkaa ohjaavat yhdistelypiirteet (flag diacritics) esitetään erillisessä taulukossa FeatureCSV. Merkistö on usein sen verran moninainen ja sisältää paljon päätöksiä käytännöistä, että se kannattanee dokumentoida selkeästi ja tällainen taulukko tarjoaisi siihen hyvät puitteet. Samoja symboleja (samoilla määritelmillä) tulisi käyttää sekä säännöstössä että leksikossa (ja symbolilista voidaan viedä taulukosta mekaanisesti säännöstöön ja leksikkoon). Symbolien taulukkoon voi mukavasti sijoittaa esimerkkejä ja vastaesimerkkejä ainakin morfofoneemien käytöstä. Esimerkit toimivat lingvistin tukena mutta ne voidaan myös poimia mekaanisesti sieltä ja testata säännöstöä vastaan. Symbolien ja piirteiden taulukoista on oma erillinen sivunsa.

Line: 54 to 57
 -- KimmoKoskenniemi - 2012-02-04
Changed:
<
<
META FILEATTACHMENT attachment="DirectedGraphPlugin_1.png" attr="h" comment="DirectedGraphPlugin: DOT graph" date="1330196967" name="DirectedGraphPlugin_1.png" size="5423" stream="GLOB(0xae683d8)" tmpFilename="/opt/twiki/working/tmp/DGPKdQKa3E9P5.png" user="KimmoKoskenniemi" version="32"
>
>
META FILEATTACHMENT attachment="DirectedGraphPlugin_1.png" attr="h" comment="DirectedGraphPlugin: DOT graph" date="1330244709" name="DirectedGraphPlugin_1.png" size="5332" stream="GLOB(0x9fe6b18)" tmpFilename="/opt/twiki/working/tmp/DGPscgzWw6EXY.png" user="KimmoKoskenniemi" version="33"
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback