Symbolien ja piirteiden taulukot

LEXICAL SURFACE DESCRIPTION       EXAMPLES
{k}   k 0   A, D gradating stop k~0 t a k {k}:0 {ie}i n ; h a k {k}:0 e {C}:0 ; 
{p}   p 0   B gradating stop p~0  k a a p {p}:0 {ie}:i n ; o p {p}:p a {V}:a n
{t}   t 0   C gradating stop t~0  t y t {t}:0 ö n
{pv}  p v   E gradating stop p~v  s o {pv}:v u n
{td}  t d   F gradating stop t~d  s a {td}:d u n
...

Morfofoneemit on kuvattu yllä olevassa symbolien taulukossa siten, että niistä on sekä ensimmäisessä että toisessa sarakkeessa merkintä. Toisessa sarakkeessa voi olla monta vastinetta yhdelle ensimmäisen sarakkeen morfofoneemille. Jokaisesta symbolista voidaan antaa (ja mielellään myös annetaan) kuvailu, jonka perusteella leksikon ja säännöstön ylläpitäjille on selvää, mitä symbolit tarkoittavat ja mihin niitä on tarkoitus käyttää. Esimerkkisarakkeeseen laitetaan hfst-pair-test ohjelman muodossa olevia positiivisia esimerkkejä (symbolipareina, ks. HfstPairTest), jotka voidaan tarkistaa ohjelmallisesti kontrolloitaessa säännöstön oikeellisuutta. Esimerkit palvelevat myös täydentävänä dokumentaationa siitä, mitä symboleilla tarkoitetaan.

Morfosyntaktisista piirteistä kuvataan toisaalta käytetyt piirteet, mutta myös ne järjestykset, joissa piirteet halutaan tulostuksessa näkyville.

ATTRIBUTE VALUE      NEXT
--------- --------------- ----------
WCL    A        COMPARISON
WCL    N        NUMBER
COMPARISON POS CMP SUP   NUMBER
NUMBER   SG        CASE
NUMBER   PL        CASE
NUMBER   NUMBER.PL
      CASE.CMT     CASE
CASE    NOM GEN PTV ESS
      TRA INE ELA ILL
      ADE ABL ALL ABE
      INS       POSS
POSS    SG1 SG2 SG3
      PL1 PL2 PL3   CLITIC
POSS            CLITIC
...  

Ajatuksena on, että piirteet ilmaistaan yhdistelydiakriiteilla (flag diacritic) siellä, missä tieto piirteestä on ilmaistavissa, mutta siellä ei oteta kantaa piirteiden tulostamisjärjestykseen eikä ulkoasuun. Yllä olevan taulukon perusteella tehdään Lexc:n mukaisia osaleksikoita ja merkintöjä (entry), joissa piirteiden ilmiasut ja niiden sallitut tulostusjärjestykset ja yhdistelmät annetaan. Leksikkomerkinnässä voi siis olla @P.WCL.N@ -tyyppisiä piirteitä, joista ei jää jälkeä tulokseen. Piirteiden perusteella kuitenkin sananmuodon lopussa tulostuu piirteitä vastaavat piirteiden nimet esim. ehdolla @R.WCL.N@. Ensimmäisen sarakkeen tunnukset vastaavat tiloja tai osaleksikoita. Toisen sarakkeen symbolit edustavat merkkejä joilla siirrytään kolmannen sarakkeen ilmaisemaan tilaan. Jokainen toisen sarakkeen piirrearvo kuuluu johonkin attribuuttiin, joka oletuksena on saman rivin vasemmassa sarakkeessa oleva osaleksikon nimi. Huomaa komitatiivia CMT kuvaava rivi, jolla piirteille osoitetaan eksplisiittisesti, että PL on NUMBER -attribuutin ja CMT on CASE -attribuutin arvo.

Sivutuotteena taulukosta voisi tuottaa myös Graphviz-ohjelman mukaisen graafin sallituista piirreyhdistelmistä dokumentoinnin tueksi.

-- KimmoKoskenniemi - 2012-02-06

Topic revision: r4 - 2012-02-29 - KimmoKoskenniemi
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback