This web is for holding topics deemed as old or irrelevant for KitWiki. If you think the topic doesn't belong here, please check that it's named properly (is a WikiWord) and descriptively, contains relevant data, and is put back to a relevant web.

Multilingual terminology of language technology (still experimental)

For the time being, see http://www.ling.helsinki.fi/filt/info/terminology/index-en.shtml where you can find a small set of multilingual keywords, a set of terms with Finnish definitions plus term denominations in English and Finnish, and occasionally in Swedish, French and German. In future, possibly those terms will be converted into a database here for joint editing and development. The entries below have been created jus for testing and even their structure might be altered if larger amounts of terms would be included. See also e.g. http://www.cse.unsw.edu.au/~billw/nlpdict.html for additional NLP terms.

Words in natural languages are inherently ambiguous, and the ambiguities are distributed in ways peculiar to each language. In order to compile useful multilingual collections of terms, it is reasonable to group the terminological information into units according to concepts rather than the words themselves. Thus, in the following sample, we have identified a few concepts, anchored the concepts using a short English and Finnish description, and given the Enlish and the Finnish denomination (term) that can be used for the concept. In this way, the entries can be widened to more and more languages just by adding new fields for denominations (and possibly definitons) in those languages.

All terms (Language technology, Computer science, Linguistics and Other)

  • EN: active edge ; FI: aktiivinen kaari : Active edges represent incomplete constituents in chart parsing, i.e. they are hypotheses for which some parts still need to be found. : LanguageTechnology
  • EN: ambiguity packing ; FI: moniselitteisyyksien pakkaaminen : a dynamic programming technique that buckets alternative trees sharing the same category and projection and represents them as a tree whose internal structure is ambiguous. : ComputerScience
  • EN: chart parsing ; FI: taulukkojäsennys : A parsing method based on a chart which stores intermediate results as inactive edges and predictions as active edges and uses an agenda for controlling its execution. : LanguageTechnology
  • EN: CKY parser ; FI: CKY-jäsennin : A simple and general bottom-up parsing algorithm for context-free grammars in Chomsky normal form. CKY refers to Cocke, Kazami and Younger who invented the method. The names/letters are often given in other orders, e.g. CYK. : ComputerScience
  • EN: context-free ; FI: kontekstista riippumaton : Property of e.g phrase structure rules and grammars where the application of rules does not depend on the neighbourhood of the symbol to be replaced. : LanguageTechnology, ComputerScience
  • EN: edge (of a chart) ; FI: kaari (jäsennystaulukon) : A structure connecting two vertices of a chart in chart parsing. : LanguageTechnology
  • EN: Humanities ; FI: ** : Definition by European Science Foundation: Humanities research explores the origins and products of the human capacity for creativity and communication. Within ESF, the Humanities cover the following fields: Anthropology, Ethnology and Folklore, Heritage Studies, Paedagogical & Educational Research, Archaeology, History, Media Studies, Art & Art History, History & Philosophy of Science, Music & Musicology, Classical Studies, Literature, Philosophy, Cognitive Science, Linguistics, Psychology, Gender Studies, Oriental & African Studies, Religion and Theology : AnyOther
  • EN: inactive edge ; FI: inaktiivinen kaari : An edge which represents a complete constituent in the chart of a chart parser. : LanguageTechnology
  • EN: intransitive verb ; FI: intransitiivinen verbi : A verb which normally does not take a direct object. : Linguistics
  • EN: morphological parser ; morphological analyser ; FI: morfologinen jäsennin : A parser which assigns typically the base form, part of speech and codes for the inflectional form to a word form. : LanguageTechnology
  • EN: noun phrase ; FI: substantiivilauseke : A phrase which acts like a noun in syntactic structures : Linguistics
  • EN: parse ; FI: jäsentää : Assign structural information to a linguistic expression (such as a sentence or a word-form). : LanguageTechnology
  • EN: parser ; FI: jäsennin : A program or an algorithm which parses. : __
  • EN: surface parsing ; FI: pintajäsentäminen : Syntactic parsing which produces head-modifier relations or combines words into phrases. Surface parsing does not resolve all relations which would be needed for the correct semantic interpretation of a sentence. : LanguageTechnology
  • EN: vertex (of a chart) ; FI: solmu (jäsennystaulukon) : Positions in a chart between which edges are spanned. Vertices are usually depicted as circles in graphical representations of charts. : LanguageTechnology
  • EN: WER ; FI: sanavirhe : Word Error Rate. See entry in Wikipedia : LanguageTechnology
  • EN: word-form ; FI: sananmuoto : Either the base form or an inflected form of a lexeme, usually understood to be just a string of characters. : LanguageTechnology
  • EN: word formation ; FI: sananmuodostus : Process where new lexemes are created from existing ones, e.g. by derivation or compounding. : Linguistics
  • EN: word ; FI: sana : In mathematics, the elements of a formal language are called words or strings. : ComputerScience
  • EN: word ; FI: sana : Used informally for several related concepts such as (1) lexeme, (2) word-form and (3) word token when no cofusion is expected. To be avoided when the meaning is not clear from the context. : Linguistics
  • EN: eHumanities ; FI: ** : Humanities where computational methods have been or are applied in research : __


Kaikki termit (kieliteknologian, tietojenkäsittelyn, kielitieteen ja muitakin termejä)

  • FI: * ; EN: * Humanities :
  • FI: * ; EN: * eHumanities :
  • FI: CKY-jäsennin ; EN: CKY parser : Chomskyn normaalimuodossa oleville kontekstista riippumattomille kieliopeille soveltuva yleinen jäsennysalgoritmi.
  • FI: aktiivinen kaari ; EN: active edge : Aktiiviset kaaret kuvaavat taulukkojäsennyksessä keskeneräisiä osia, joiden valmiiksi saaminen edellyttää vielä joidenkin konstituenttien löytymistä.
  • FI: inaktiivinen kaari ; EN: inactive edge : Jäsennystaulukon kaari, joka edustaa kokonaista rakenneosaa.
  • FI: intransitiivinen verbi ; EN: intransitive verb : Verbi, joka ei normaalisti voi saada objektia.
  • FI: jäsennin ; EN: parser : Algoritmi tai ohjelma joka jäsentää.
  • FI: jäsentää ; EN: parse : Liittää kielelliseen ilmaukseen (kuten virkkeeseen tai sananmuotoon) sen rakennetta kuvaavaa tietoa.
  • FI: kaari (jäsennystaulukon) ; EN: edge (of a chart) : Kahta solmua yhdistävä graafisesti yleensä nuolella kuvattu rakenne, joka liittyy taulukkojäsennykseen.
  • FI: kontekstista riippumaton ; EN: context-free : Formaalien kielioppien tai toisinkirjoitussääntöjen ominaisuus, jossa säännön soveltaminen ei riipu toisinkirjotettavan merkin ympäristöstä.
  • FI: moniselitteisyyksien pakkaaminen ; EN: ambiguity packing : dynaamisen ohjelmoinnin tekniikka joka niputtaa saman kategorian ja projektion omaavat vaihtoehtoiset alipuut ja esittää ne puuna jonka sisäinen rakenne on moniselitteinen.
  • FI: morfologinen jäsennin ; EN: morphological parser ; morphological analyser :
  • FI: pintajäsentäminen ; EN: surface parsing : Pintajäsennys tuottaa virkkeen saneiden välisiä määrityssuhteita tai kokoaa yhteen kuuluvista saneista lausekkeita. Pintajäsennys ei ratkase kaikkia saneiden välisiä suhteita, jotka olisivat tarpeen virkkeen semanttiseksi tulkitsemiseksi.
  • FI: sana ; EN: word : Käytetään useista käsitteistä kuten (1) lekseemi, (2) sananmuoto ja (3) sane silloin, kun ei ole ilmeistä väärinkäsityksen mahdollisuutta. Ei suositella käytettäväksi, milloin asiayhteydestä ei ilmene suoraan, mitä käsitettä se vastaisi.
  • FI: sana ; EN: word : Formaalien kielten teoriassa merkkijonoja kutsutaan joskus sanoiksi eli silloin katsotaan, että kieli muodostuu sanoista.
  • FI: sananmuodostus ; EN: word formation : Prosessi, jossa uusia lekseemejä muodstetaan olemassa olevista esim. johtamalla tai yhdyssanoja muodostamalla.
  • FI: sananmuoto ; EN: word-form : Hakusanan (eli lekseemin) perusmuoto tai taivutettu muoto, jonka ymmärretään yleensä olevan pelkkä merkkijono. Esimerkiksi katto, katolla ja vesikatoilla ovat sananmuotoja.
  • FI: sanavirhe ; EN: WER : Mitta jolla ilmaistaan mm. puheentunnistimen virheitä.
Virhemitta koostuu korvautuneista (S), poisjääneistä (D) ja ylimääräisistä (I) sanatunnistuksista suhteessa lähteen sanamäärään (N).
  • FI: solmu (jäsennystaulukon) ; EN: vertex (of a chart) : Jäsennystaulukossa olevia kiinnekohtia, joiden välille kaaret asettuvat. Graafisesti solmuja kuvataan usein ympyröillä.
  • FI: substantiivilauseke ; EN: noun phrase :
  • FI: taulukkojäsennys ; EN: chart parsing : Jäsennysmenetelmä, joka perustuu aktiivisiin ja inaktiivisiin kaarin sekä tekemättä olevien tehtävien listaan.


Language technology terms

  • EN: morphological parser ; morphological analyser ; FI: morfologinen jäsennin : A parser which assigns typically the base form, part of speech and codes for the inflectional form to a word form.
  • EN: WER ; FI: sanavirhe : Word Error Rate. See entry in Wikipedia
  • EN: active edge ; FI: aktiivinen kaari : Active edges represent incomplete constituents in chart parsing, i.e. they are hypotheses for which some parts still need to be found.
  • EN: chart parsing ; FI: taulukkojäsennys : A parsing method based on a chart which stores intermediate results as inactive edges and predictions as active edges and uses an agenda for controlling its execution.
  • EN: edge (of a chart) ; FI: kaari (jäsennystaulukon) : A structure connecting two vertices of a chart in chart parsing.
  • EN: inactive edge ; FI: inaktiivinen kaari : An edge which represents a complete constituent in the chart of a chart parser.
  • EN: parse ; FI: jäsentää : Assign structural information to a linguistic expression (such as a sentence or a word-form).
  • EN: surface parsing ; FI: pintajäsentäminen : Syntactic parsing which produces head-modifier relations or combines words into phrases. Surface parsing does not resolve all relations which would be needed for the correct semantic interpretation of a sentence.
  • EN: vertex (of a chart) ; FI: solmu (jäsennystaulukon) : Positions in a chart between which edges are spanned. Vertices are usually depicted as circles in graphical representations of charts.
  • EN: word-form ; FI: sananmuoto : Either the base form or an inflected form of a lexeme, usually understood to be just a string of characters.


Entering new terms

Topic names already in use: TermActiveEdge, TermAmbiguityPacking, TermChartParsing, TermCockeYoungerKazamiParser, TermContextFree, TermEdgeOfChart, TermHumanities, TermInactiveEdge, TermIntransitiveVerb, TermMorphologicalParser, TermNounPhrase, TermParse, TermParser, TermSurfaceParsing, TermVertex, TermWER, TermWordForm, TermWordFormation, TermWordInComputerScience, TermWordInLinguistics, TermeHumanities,


Comments and suggestions

 


See also:


-- KimmoKoskenniemi - 05 Apr 2006
Topic revision: r28 - 2008-11-21 - HennaRiikkaLaitinen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback