Warn Tämä sivu sisältää lähinnä vanhentutta tietoa; jos haluat käyttää omorfin uusinta versiota hipulla, sen voi noutaa ja asentaa osoitteesta <http://code.google.com/p/omorfi>. Lähin korvaava tuote on HFST-paketin finnish-analyse, jonka pitäisi toimia kaikilla käyttäjillä automaattisesti ja joka on dokumentoitu HfstHome-sivuilla.

WarnWarnWarnWarnWarnWarnWarnWarnWarnWarnWarn


OMorFi: Lyhyet käyttöohjeet Omorfille hippu.csc.fi-palvelimella

Hippu on keskeisin aineisto- ja sovelluspalvelin lingvisteille. Tommi Pirisen HFST-hankkeen yhteydessä kehittämästä ja ylläpitämästä avoimen lähdekoodin suomen kielen morfologisesta jäsentimestä Omorfista asennetaan jakeluun käyttöversiot sinne.

Omorfin sijasta kannattaa käyttää HFST-projektin kielipaketteja jotka on paremmin dokumentoituja ja ylläpidettyjä. Lisätietoa ks. HfstHome

Omorfin saa käyttöön, kunhan HFST-ohjelmat ovat käytössä, kuten ne oletuksena ovatkin Hipun lingvisti- ja kieliteknologikäyttäjille ja ne saa käyttöönsä module -komennolla. Omorfin voi käynnistää esim. komennolla:

omorfi-interactive.sh

Tällöin ohjelma tulostaa interaktiivisessa käytössä seuraavanmuotoista tulosta:

kissa
kissa kissaNSgNom

koira
koira  koiraNSgNom

Ulkoasu riippuu versioista ja täggäysvalinnoista, niitä voi säätää lisää käsin etsimällä sopivia automaatteja, vaikkapa:

hfst-lookup -O xerox /v/linux26_x86_64/appl/ling/omorfi/20110505-gcc4.6/share/hfst/fi/morphology.finntreebank.hfstol

joka toimi joskus näin:

talosta
talosta talo<N><Sg><Ela><cap>  0.000000

tuli
tuli  tulla<V><Act><Ind><Prt><Sg3><cap>    0.000000
tuli  tuli<N><Sg><Nom><cap>  0.000000

kuusi
kuusi  kuu<N><Pl><Nom><PxSg2><cap>   0.000000
kuusi  kuu<N><Sg><Gen><PxSg2><cap>   0.000000
kuusi  kuu<N><Sg><Nom><PxSg2><cap>   0.000000
kuusi  kuusi<N><Sg><Nom><cap> 0.000000
kuusi  kuusi<Num><Card><Sg><Nom><cap> 0.000000

miestä
miestä mies<N><Sg><Par><cap>  0.000000

LOOKUP-ohjelma voi tulostaa (sisällöltään samat) tulokset muutamassa muussakin muodossa: -O apertium tai -O cg.

Samassa hakemistossa, jossa yllä mainittu leksikkotransduktori sijaitsee, on muitakin vaihtoehtoisia leksikkotransduktoreita, jotka antavat erilaisia piirteistöjä kuin yllä mainittu. Alla komento, jolla saa listan transduktoreista:

ls /v/linux26_x86_64/appl/ling/omorfi/20110505-gcc4.6/share/hfst/fi


Jos module load -komento ei toimi, vaan sanoo esim. module: command not found, on asetuksissa jotain vikaa, mutta onneksi module-komennon voi myös säveltää itse:

eval `/opt/Modules/$MODULE_VERSION/bin/modulecmd bash load omorfi hfst/2.4.1 hfst/3`

Jos käyttää bashin sijasta muuta shelliä, joutunee komentoa soveltamaan tarpeen mukaan.

Module load -komennot on mahdollista ja suotavaa lisätä käynnistystiedoston loppuun, niin ne toimivat aina. Bashissa tämä tarkoittaa ~/.bashrc-tiedostoa. Jos .bashrc-tiedosto ei toimi, voi sen sijaan käyttää ~/.bash_profilea, tai yhdistellä niitä sopivalla tavalla.

Ks. tarvittaessa ohjetta Module-järjestelmän käytöstä ja ongelmista.


Topic revision: r8 - 2012-11-28 - MartinMatthiesen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback