Ohjelman suoritus sekvenssi

Sanalistan lukeminen:

Oletetaan toistaiseksi, että sanalista on muotoa, jossa on riveittäin sanoja. Sanat ovat sanakirja muodossa, eli infinitiivissä. Jokaiseen sanaan on liitetty taivutuskategorian numero, joka ilmaisee miten sana taipuu. Taivutusgategorioiden identifikaattoreita ei tiedetä, joten niihin ei toistaiseksi oteta kantaa, ne voidaan määritellä asettaa myöhemmin, oleellista on tällähetkellä, että ne erottavat erilailla taipuvat sanat toisistaan. Esimerkki lista:

Astevaihtelun alaisia:

  • karppi
  • tonttu
  • ilta
  • pilli
  • laskin
  • rätti
  • koti
  • näky

Sanan analysointivaihe:

Analysointivaiheen tarkoituksena on lisätä sanakirjamuotoon riittävä määrä lisäinformaatiota, että se voidaan taivuttaa kaikkiin tarpeellisiin muotoihin. Oleellista olisi siis löytää astevaihtelun kohta.

Jos ymmärsin oikein, tarkoituksena on ainoastaan merkitä astevaihtelun kohta, esimerkiksi seuraavasti:

  • karp[p]i
  • tont[t]u
  • il[t]a
  • pill[i] (tämä muutos ei taida olla vartaloon liittyvää astevaihtelua, vaan voidaan ratkaista muilla säännöillä
  • laski[n]
  • rät[t]i
  • nä[k]y

Ylläoleva tehtävä kohtalaisen helppo, varsinkin kun taivutusluokka tiedetään. (tämä helppous aiheuttaa nimenomaan epävarmuutta siitä, onko esitetty merkintä riittävä, vai pitääkö tehdä jotain lisää ??) Taivutusluokan specifiointi tarkkuus vaikuttaa toteutukseen.

Astevaihtelun (eli siis hakasuluissa olevan kirjaimen) lopullinen ilmeneminen ratkaistaan erikseen tarvittavilla säännöillä. Näitä sääntöjä ei ilmeisesti tarvitse kokonaisuudessaan tuottaa täällä.

Muunnos haluttuun formalismiin

Tarkoituksena olisi siis muuttaa edellä esitetty muoto annetun jäsenninkääntäjän ymmärtämään muotoon. Jos esimerkiksi olisi kyse LEXC:n formaatista, edellä esitetty voisi esimerkiksi tuottaa seuraavanlaisen lopputuloksen:

Varatut sanat ^Pto0,^Tto0,^LTto0

LEXICON root
karp^PPto0i  Noun;
tont^TTto0u  Noun;
il^LTto0 Noun;

Noun on siis oma leksikko, joka tuottaa substantiivien taivutuksen. En ole varma pitääkö asianomainen taivutus tuottaa tällä samalla ohjelmalla. Taivutushan voidaan helposti lisätä tuotettuun leksikkoon erikseen (includella tai vastaavalla omasta tiedostostaan). Lisäksi taivutuksen tuottaminen olisi jokatapauksessa työlästä, koska ne taidetaan tuottaa eri formalismeilla melko eriävillä tavoilla. Mutta voi tietysti olla, että ne olisi helposti tuotettavissa, ongelmana on, että joidenkin substantiivien tapauksessa on erikoistapauksia, ja on hieman kyseenalaista onko asianomaista erikoistapausta merkitty erikseen annetussa sanalistassa.

-- PetriUusitalo - 28 Sep 2006

Topic revision: r4 - 2008-11-25 - HennaRiikkaLaitinen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback