-- PaulaPaakko - 27 Nov 2006

Hindi Morphological Tagger nimeää annetun tekstin saneet ja ilmoittaa ainakin niiden luokan, suvun, persoonan, luvun ja aikamuodon. Sille voi antaa vain normaalisti kirjoitettua tekstiä eikä esimerkiksi XML-merkittyä tekstiä tai tekstiä sane per rivi -muodossa. Vaihtoehtoisesti sille voi antaa vain yhden sanan tutkittavaksi. Teksti annetaan länsimaisissa aakkosissa, ehkä sitten sen mukaan, miltä kyseisen sanoman on tarkoitus kuulostaa. Taggeri nimeää vain tekstin saneet eikä tulosta esimerkiksi yhdyssanojen osia tai vartalon johtimia.

Oma hindin osaamiseni on hieman ruosteessa, joten jouduin turvautumaan annettuun tekstin pätkään ja vastaamaan tämän perusteella. Ohjelma ei näytä hyväksyvän virheellisiä sananmuotoja, sillä kun muutin saneen yhtä kirjainta, ohjelma ei enää tunnistanut sitä vaan antoi saneen nimeksi vain 'nul'.

Nopeudesta tai tilantarveesta ei ole sanottu mitään.

Topic revision: r1 - 2006-11-27 - PaulaPaakko
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback