Core Contents in the HLT Master's programme

Tavoitteena on kerätä tietoa kurssien ydinaineksesta tälle sivulle. Ydinaines kuvataan niiden käsitteiden joukkona, jotka opiskelijan odotetaan hallitsevan opintojakson suorittamisen jälkeen. Samoin kuvataan opintojakson edellyttämät esitiedot. Näiden käsitteiden avulla voidaan luoda mm. verkkoympäristö, jonka avulla opiskelija voi testata lähtötietonsa ennen ilmoittautumista kurssille. Käsitteet on otettu tutkintovaatimuksista tai kurssien kotisivuilta ja tarkoitus on, että kaikki voivat niitä editoida. Opintojaksojen nimet eivät suoraan vastaa kurssien nimiä, vaan yhtä opintojaksoa kohden voi olla montakin kurssia, jolla opitaan suunnilleen samat asiat.

Opintojaksoista tehdään erikseen graafinen näkymä, jonka avulla voi hahmottaa suoritusjärjestys ja johon voidaan linkittää tietoa tarjolla olevista, ao. sisällön tarjoavista kursseista tai muista suoritusmahdollisuuksista.

Alustava kaavio (iso kuva).

Toisessa muodossa:

Kieliopin rakentamista Äärellis-
tilaisten jäsennys-
menetelmien teoriaa
Ontologioita Kielitekno-
logisten sovellusten evaluointia
Toden-
näköisyys-
malleja
Tiedon louhintaa Kone-
oppimista
Puhe-
synteesiä
Puheen-
tunnistusta
Monikielisiä korpuksia Kone-
kääntämistä
|
|
|
\ \ / / \ / \ /
Luonnollisen kielen jäsennys-
menetelmiä
Äärellistilaisia jäsennysmenetelmiä
|
Kielen tilastollinen
mallinnus
Puheteknologian foneettiset
perusteet
Monikielistä kieliteknologiaa
/ \
|
|
|
|
|
Luonnollisen kielen jäsentämisen teoriaa Morfologista jäsennystä
|
Kieliaineistojen tilastomenetelmiä Toive: Puheen
akustiikkaa ja / fonetiikkaa
|
|
/
|
|
 
|
|
NLP-
menetelmiä
|
Skripti-
ohjelmointia
XML  
|
Monikielisten
dokumenttien hallinta
/
|
\
|
|
|
 
|
|
Seman-
tiikkaa
Syntaksia Fonologiaa ja morfologiaa Tekstityökaluja Rakenteisten dokumenttien perusteita/ verkkosivujen käsittelyä  
|
Kielitypologia
Diskurssin/keskustelun analyysi
\
|
/ \ /  
|
|
Yleistä kielitiedettä Unix-alkeita   Fonetiikkaa Windows-jatkeita

Ja alustavan alustava valtava ydinainesriippuvuuskaavio kuvaa allaolevat asiat graafisessa muodossa.

Pakollisia opintojaksoja:

Äärellistilaiset jäsennysmenetelmät
  • Ydinaines: (Clt270): äärellistilainen automaatti, transduktori, transduktorileksikko, morfologinen jäsennin, leksikko, sääntöformalismit , (Clt260): morfologinen rakenne, morfologisen jäsennyksen syöte, esitysmuodot
  • Esitietoina edellytetään: kielitieteen peruskäsitteet, morfologian peruskäsitteet | unix-järjestelmän peruskäsitteet, ohjelmointi | kieliteknologian peruskäsitteet

Luonnollisen kielen käsittely
  • Ydinaines: jäsentämisen työkalut, semantiikka, diskurssi, kontekstittomat kieliopit, puurakenteet, osittava (top-down) ja kokoava (bottom-up) jäsennys, taulukkojäsennys, leksikko, puurakenteet, piirrerakenteet, tekstin rakenteiden tunnistus
  • Esitietoina edellytetään: kielitieteen peruskäsitteet, syntaksin peruskäsitteet | ohjelmointi | kieliteknologian peruskäsitteet

Puheteknologian foneettiset menetelmät
  • Ydinaines: puhesynteesin peruskäsitteet TTS (vastuuyksikkö HY/puhetieteiden laitos, puheen tunnistuksen peruskäsitteet (vastuuyksikkö TKK/tietojenkäsittelytieteen laitos, edellyttää lisäkeskustelua)
  • Esitietoina edellytetään: mielellään fonetiikan perusteet, puheen akustiikan perusteet, (vastuuyksikkö HY/puhetieteiden laitos). Käsitteitä: perustaajuusanalyysi, autokorrelaatio, fourier-muunnos

Käännösteknologia
  • Ydinaines: kieliteollisuuden standardit ja työkalut: lokalisaatio, merkkikoodaus, monikieliset dokumentit, monikielinen sisällönhallinta, terminologia, ontologia, terminhallinta, käännösmuistit; rajoitetun kielen käännösteknologia: monikielinen generointi, monikielinen dialoginhallinta; rajoittamattoman kielen käännösteknologia: monikielinen sanastus ja terminologian hankinta, monikieliset korpukset, muistipohjainen konekäännös, tilastollinen konekäännös, konetulkkaus

  • Esitietoina edellytetään: -

Kielen tilastollinen mallinnus
  • Ydinaines: puheentunnistuksen perusmenetelmät, piilo-Markov-mallit, tilastolliset menetelmät tiedonhaussa, dokumenttien vektoriesitysmuoto, sana-dokumenttimatriisien käsittely ja dimension pienennys, latentit piilomuuttujamallit, monitulkintaisuuden mallintaminen, tilastolliset konekäännösmenetelmät
  • Esitietoina edellytetään: ehdollinen todennäköisyys, Bayesin sääntö, tilastollinen riippumattomuus, satunnaismuuttujan käsite, priori- ja posterioritodennäköisyys, tilastolliset malliperheet, mallien estimoinnin perusteet, informaatioteorian peruskäsitteet, entropia, yhteisinformaatio, kohinainen kanavamalli
  • Hyödyllisiä taustatietoja: yleisen kielitieteen peruskäsitteet

Tietojenkäsittelytieteen moduuli matemaattis-luonnontieteellisen tiedekunnan opiskelijoille (valitaan) :

Tiedonhakumenetelmät
Johdatus koneoppimiseen
Algoritmien suunnittelu
Tiedon louhinta
Todennäköisyysmallit

Valinnaisia opintojaksoja:

Tietojenkäsittelytieteen moduulin kurssit humanistisen tdk:n ja käyttäytymistieteellisen tdk:n opiskelijoille

Monikielinen kieliteknologia
  • Ydinaines: rajoitetun kielen monikielinen jäsennys ja generointi, monikielinen dialoginhallinta
  • Esitietoina edellytetään: kielitypologiaa, käännösteknologia, ohjelmointi

Monikieliset korpukset ja konekäännös
  • Ydinaines: monikieliset korpukset, käännösmuistit, monikielinen sanastus, muistipohjainen ja tilastollinen konekäännös, käännöksen evaluaatio
  • Esitietoina edellytetään: kielitypologiaa, käännösteknologia, dokumenttien hallinta

Ontologiat
  • Ydinaines: ontologia, ontologiakielet, semanttiset verkot, ontologioiden käyttötarkoitukset, syntaktiset verkot, deskriptiologiikka, ontologiaohjelmakirjastot, ontologioiden rakennus ja käsittely, ontologiat kieliteknologiassa
  • Esitietoina edellytetään: XML

Dialogin mallinnus
  • Ydinaines: keskustelunanalyysi, dialogin mallinnus, dialogijärjestelmän komponentit, dialoginhallinnan arkkitehtuurit, voiceXML, monikielinen dialoginhallinta, adaptiivisuus, dialogijärjestelmien evaluointi
  • Esitietoina edellytetään: pragmatiikka, diskurssin/keskustelun tutkmus

Puhesynteesi

Esitietoina edellytettäviä opintojaksoja:

Kieliaineistojen tilastomenetelmiä
  • Ydinaines: tilastollisen testaamisen perusteet, tilastollisia testejä, tilastollinen merkitsevyys, tilastollinen aineisto
  • Esitietoina edellytetään: -

XML
  • Ydinaines: XML-dokumentti, transformaatio, XML-standardi, yksiselitteinen tunnus, nimiavaruus, validointi, DTD, skeema, XSLT-muunnos
  • Esitietoina edellytetään: XHTML, CSS

Ohjelmointi
  • Ydinaines: toisto, ehdollisuus, aliohjelma, parametri, ohjelmien laatiminen
  • Esitietoina edellytetään: unix-järjestelmän peruskäsitteet

Unix-järjestelmä
  • Ydinaines: kirjoittautuminen, istunnon päättäminen, verkkoselain, sähköposti, tiedostojärjestelmä, emacs, työasema, palvelimen etäkäyttö, tiedostojen suojaukset
  • Esitietoina edellytetään: -

Kieliteknologia
  • Ydinaines: kirjoittajan apuvälineet, tiedonhaku, puheentunnistus, puhesynteesi, kielellinen vuorovaikutus ihmisen ja tietokoneen välillä, tietokoneavusteinen kääntäminen, automaattinen kielten kääntäminen, tietokoneavusteinen kielen oppiminen(CALL), tietokoneavusteinen kielen opetus
  • Esitietoina edellytetään: -

Puheteknologian fonetiikka
  • Ydinaines:
  • Esitietoina edellytetään:

Kielitiede ja fonetiikka
  • Ydinaines: fonetiikka, fonologia, syntaksi, morfologia, semantiikka, perusterminologia
  • Esitietoina edellytetään: -

-- HannaWesterlund - 28 Jan 2008

Topic attachments
I Attachment Action Size Date Who Comment
JPEGjpg kpk_kasitteet.jpg manage 100.6 K 2008-01-29 - 14:14 UnknownUser  
JPEGjpg kpk_ydinriippuvuus.jpg manage 319.2 K 2008-01-30 - 13:00 UnknownUser  
Topic revision: r19 - 2008-02-11 - HannaWesterlund
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback