Symbolien ja piirteiden taulukot

LEXICAL SURFACE DESCRIPTION             EXAMPLES
{k}     k 0     A, D gradating stop k~0 t a k {k}:0 {ie}i n ; h a k {k}:0 e {C}:0 ; 
{p}     p 0     B gradating stop p~0    k a a p {p}:0 {ie}:i n ; o p {p}:p a {V}:a n
{t}     t 0     C gradating stop t~0    t y t {t}:0 ö n
{pv}    p v     E gradating stop p~v    s o {pv}:v u n
{td}    t d     F gradating stop t~d    s a {td}:d u n
...

Morfofoneemit on kuvattu yllä olevassa symbolien taulukossa siten, että niistä on sekä ensimmäisessä että toisessa sarakkeessa merkintä. Toisessa sarakkeessa voi olla monta vastinetta yhdelle ensimmäisen sarakkeen morfofoneemille. Jokaisesta symbolista voidaan antaa (ja mielellään myös annetaan) kuvailu, jonka perusteella leksikon ja säännöstön ylläpitäjille on selvää, mitä symbolit tarkoittavat ja mihin niitä on tarkoitus käyttää. Esimerkkisarakkeeseen laitetaan hfst-pair-test ohjelman muodossa olevia positiivisia esimerkkejä (symbolipareina, ks. HfstPairTest), jotka voidaan tarkistaa ohjelmallisesti kontrolloitaessa säännöstön oikeellisuutta. Esimerkit palvelevat myös täydentävänä dokumentaationa siitä, mitä symboleilla tarkoitetaan.

Morfosyntaktisista piirteistä kuvataan toisaalta käytetyt piirteet, mutta myös ne järjestykset, joissa piirteet halutaan tulostuksessa näkyville.

ATTRIBUTE  VALUE            NEXT
---------  ---------------  ----------
WCL        A                COMPARISON
WCL        N                NUMBER
COMPARISON POS CMP SUP      NUMBER
NUMBER     SG               CASE
NUMBER     PL               CASE
NUMBER     NUMBER.PL
           CASE.CMT         CASE
CASE       NOM GEN PTV ESS
           TRA INE ELA ILL
           ADE ABL ALL ABE
           INS              POSS
POSS       SG1 SG2 SG3
           PL1 PL2 PL3      CLITIC
POSS                        CLITIC
...   

Ajatuksena on, että piirteet ilmaistaan yhdistelydiakriiteilla (flag diacritic) siellä, missä tieto piirteestä on ilmaistavissa, mutta siellä ei oteta kantaa piirteiden tulostamisjärjestykseen eikä ulkoasuun. Yllä olevan taulukon perusteella tehdään Lexc:n mukaisia osaleksikoita ja merkintöjä (entry), joissa piirteiden ilmiasut ja niiden sallitut tulostusjärjestykset ja yhdistelmät annetaan. Leksikkomerkinnässä voi siis olla @P.WCL.N@ -tyyppisiä piirteitä, joista ei jää jälkeä tulokseen. Piirteiden perusteella kuitenkin sananmuodon lopussa tulostuu piirteitä vastaavat piirteiden nimet esim. ehdolla @R.WCL.N@. Ensimmäisen sarakkeen tunnukset vastaavat tiloja tai osaleksikoita. Toisen sarakkeen symbolit edustavat merkkejä joilla siirrytään kolmannen sarakkeen ilmaisemaan tilaan. Jokainen toisen sarakkeen piirrearvo kuuluu johonkin attribuuttiin, joka oletuksena on saman rivin vasemmassa sarakkeessa oleva osaleksikon nimi. Huomaa komitatiivia CMT kuvaava rivi, jolla piirteille osoitetaan eksplisiittisesti, että PL on NUMBER -attribuutin ja CMT on CASE -attribuutin arvo.

Sivutuotteena taulukosta voisi tuottaa myös Graphviz-ohjelman mukaisen graafin sallituista piirreyhdistelmistä dokumentoinnin tueksi.

-- KimmoKoskenniemi - 2012-02-06

Topic revision: r4 - 2012-02-29 - KimmoKoskenniemi
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback