FiLRC: FIN-CLARIN-johtoryhmän videoneuvottelukokous

ma 26.10.2009 klo 10-~11.30

PÖYTÄKIRJA

Kokous alkoi klo 10.11.

Osanottajat:

 • HY: Kimmo Koskenniemi (pj), Antti Arppe, Mirja Nissinen (siht.), Jussi Piitulainen
 • CSC:
 • JY: Ari Huhta
 • JoY:
 • Kotus: Pirkko Nuolijärvi
 • OY: Marketta Harju-Autti
 • TaY: Jaana Kekäläinen, Mikhail Mikhailov

1. Yleistä - ilmoitusasioita

 • Kuulumisia CLARIN-projektista (KK):
  • NEERI: Networking Event for European Research Infrastructures + Standards Workshop pidettiin Helsingissä 30.9.-2.11.2009. Lisätietoa, konferenssiesitykset ja kuvia konferenssista löytyy NEERI-nettisivulta.
  • EU-CLARINin johtoryhmän kokouksia: Kööpenhamina 22.-23.10.2009
   • ERIC (European Research Infrastructure Consortium) - EU-CLARIN pyrkii ERICiksi; ERICin osapuolia ovat valtiot; ERICin tehtävänä on pitää huolta siitä, että keskukset (kuten CSC, MPI) ovat yhteensopivia; pyritään siihen, että saataisiin Suomi mukaan tähän infrastruktuuriin > aiesopimus; ERICin aikataulu: CLARIN haluaa edetä niin nopeasti kuin mahdollista, keskustelut aloitettu, ensi vuoden aikana (kesällä) lopullisiin ratkaisuihin?

2. FIN-CLARINin kansallisen rahoituksen tilannekatsaus ja lähitulevaisuus (KK)

a. Kieliaineistojen tiekartan toteuttaminen (KK:n pohjustus)

 • Helsingin yliopisto (yleisen kielitieteen laitos) olisi toteuttamista koordinoiva instanssi < HY anoo valtakunnalliseen tehtävään rahoitusta OPM:ltä - ei muuta tapaa anoa rahaa; FIN-CLARINin valmisteluvaiheen loppuunsaattamiseen (palkkarahaa ja loput nk. ulkoa hankittaviin töihin eli kaikkea ei käytetä HY:ssa)
 • tiekartan mukaisia resursseja kehitettäisiin niissä yliopistoissa, joilla on siihen parhaat edellytykset
 • FIN-CLARIN-johtoryhmä priorisoisi ja ohjaisi tiekartan komponenttien toteuttamista
 • kaikkien kannattaisi omissa tulosneuvotteluissaan mainita aina FIN-CLARIN ja viitata myös HY:n tilanteeseen

b. FIN-CLARINin virallisempi järjestäytyminen

 • kirjallinen johtosääntö konsortion toiminnalle (mistä HY/koordinoiva taho vs. FIN-CLARIN-johtoryhmä vs. osasia suorittavat yliopistot vastaavat; kuinka päätöksiä tehdään)
 • kohdan 1 periaatteet
 • vastuut, toimintasuunnitelma, toimintakertomukset vuosittain

 • Periaatteet kannattaa lyödä lukkoon, vaikka pitempiaikainen jatkorahoitus vielä epävarma
 • Järjestäytymisestä hyötyä myös tulevassa rahanjaossa
 • AA ehdottaa, että HY:ssa tehdään johtosäännön luonnos, joka tulee johtoryhmän käsittelyyn ja hyväksyttäväksi
 • Kotus voi tehdä tässä yhteistyötä HY:n kanssa
 • Johtoryhmän seuraavaan kokoukseen mennessä jonkinlainen luonnos (parin kk:n kuluessa) (AA ja MN)

3. FIN-CLARIN-autentikointi- ja auktorisointi-infrastruktuurin kehitystyön eteneminen CSC:llä (AA)

 • työ päästy aloittamaan hieman myöhässä mutta ollaan aikataulussa
 • koodaustyö on alkanut kesällä
 • järjestelmän betatestaus vuodenvaihteessa; johtoryhmän jäsenet voisivat osallistua testaukseen
 • järjestelmän ensimmäisen version pitäisi olla valmis Suomen osalta maaliskuussa
 • järjestelmää pääsee käyttämään oman kotiyliopiston tunnuksilla
 • EU-tasolla vireillä yhteistyöprojekti: pari keskusta Hollannista ja pari Saksasta + CSC - tarkoitus tarjota näiden kolmen maan kielentutkijoille pääsy toisen maan aineistoihin > laajennetaan myöhemmin, nyt tekeillä prototyyppi
 • HY osallistuu kustannuksiin

4. FinWordNetin ja suomenkielisen puupankin prototyypin kehittämisprojektit Helsingin yliopistolla Krister Lindénin johdolla loppuvuodesta 2009 (KK/AA)

 • WordNet: elektroninen synonyymisanakirja, käytetty myös esim. semanttiseen luokitteluun
  • ensin käännetään englanninkielinen versio suomeksi, sitten tehdään kakkosversio, jossa otetaan huomioon myös mm. kulttuurisidonnaisuus > lopputulos pyrkii olemaan oikeasti suomenkielinen WordNet
  • KL valmistellut asiaa
  • 1. vaihe noin kuudesosa koko työstä
  • tutkimuskäyttöön (kaupallisia versioita mm. Lingsoftilla ja Kielikoneella)
  • monikielinen tiedonhaku
  • jatkokehittelyssä lisää yhteistyötä - nyt tekeillä prototyyppi
 • puupankki
  • prototyyppi
  • ISK:sta esimerkkivirkkeet
  • selvitetään ongelmia, mitä puupankin luomisessa voi tulla
  • jatkokehittelyssä tässäkin lisätään yhteistyötä, vain prototyyppiä aloiteltu HY:ssa

5. Mahdollinen FIN-CLARIN-työpaja

 • kun kansallinen jatkorahoitus selviää
 • esim. Kotuksen tarpeita kieliaineistojen talletuksen suhteen voisi työstää yhteisessä työpajassa, missä voisi miettiä, miten CSC:llä luotavaa AA-infraa käytetään oikeasti; tämä voisi kiinnostaa muitakin
 • CLARIN-tiedotusta ja -markkinointia lisättävä: kokousten kautta, road show, muuta?
 • road show? < kutsuttaisiin humanististen aineiden edustajia katsomaan miten infrastruktuuri toimii; ensi keväänä; esim. kielten jatkokoulutusseminaarien yhteydessä; Kielitieteen päivät Helsingissä + Fonetiikan päivät Joensuussa (AA ja MN selvittävät asiaa), AFinLAn syyssymposium marraskuussa Tampereella (AH menossa, esittelee FIN-CLARINia; selvitetään posteritilanne ym.; AH ja AA)
 • työskentelyyn tähtäävä johtoryhmän kokous ja johtoryhmä levittäisi tätä tietoa myös ympärilleen
 • työpaja kevättalvella Helsingissä?
 • tiekarttasuunnitelman läpikäynti marras-joulukuun vaihteessa, viimeistään helmikuussa; matkoja voidaan maksaa OPM:n rahasta; (AA ja MN selvittävät päivämäärää Doodlella); samalla voitaisiin katsoa johtosäännön luonnosta ja vilkaista hieman CSC:n AA-infraa

6. Konsortion mahdolliset uudet jäsenet tai yhteistyötahot

 • tilannekatsaus ja mahdolliset uutiset yhteydenottojen suhteen (PN, KK, AA)
Tilanne 22.9.2008 pidetyn kokouksen pöytäkirjan mukaan (tämän jälkeen pöytäkirjoissa ei merkintää uusista tiedoista; yhteydenottoja on jatkettu):
 • TY < Pirkko Nuolijärvi: yhteydet Kaisa Häkkiseen (Suomen kielen oppiaine) ja Anneli Pajuseen (TS-korpus); mutta ei vielä responssia alkukiinnostuksen jälkeen; seuraavaksi konsortio/aiesopimuksen lähettäminen asioiden edistämiseksi.
  • humanisteista ei tietoa; Tapio Salakoski ja Filip Ginter tietotekniikan puolella; lähetetään muistutus ja aiesopimus (MN)
 • VY < PN: yhteydet Merja Koskelaan (vararehtori) kielikylpyaineistoista ja Nykysuomen laitokseen (Anita Nuopponen, Birgitta Romppainen & Esa Lehtinen); seuraavaksi aiesopimuksen lähettäminen.
  • lähetetään muistutus ja aiesopimus (MN)
 • SKS < PN; puhe statuksesta yhteistyökumppanina, jolloin aiesopimuksen allekirjoittamista ei tarvita.
 • Svenska Litteratursällskapet i Finland < Kimmo Koskenniemi: virallinen kirje yhteistyökumppaniksi kutsumisesta; tilanne edelleen kesken.
 • ÅA: Urpo Nikanne < Antti Arppe: yhteydenotto ruotsin kielen laitoksen (Svenska språket) johtajaan Saara Haapamäkeen.
 • OY: Giellagas-instituutti ja saamenkielisten aineistot mukana Oulun kautta FIN-CLARINissa; neuvottelevat YLE:n kanssa saamelaisradion aineistojen sisällyttämisestä
  • MH-A: Giellagas-instituutti tehnyt oman arkiston
 • jäsenet ja liitännäisjäsenet erikseen; kaikkien jäsenten ei tarvitse olla FIN-CLARINin jäseniä

Lisäksi:

 • TKK < Antti Arppe: TKK:lta Timo Honkela on ilmoittanut, että heidän liittymisensä on etenemässä.
  • TKK:n myötä myös Aalto tulossa mukaan

7. Muut esille tulevat asiat

Muita asioita ei tullut esille.

8. Seuraava kokous

 • työpaja marras-joulukuussa? (AA ja MN selvittävät ajankohtaa; ks. kohta 5.)

Tehtävälista

Mitä / kuka / milloin

1) Johtosäännön luonnos / AA ja MN / parin kk:n kuluessa eli seuraavaan kokoukseen mennessä

2) Road show'n osallistuminen Kielitieteen päiville toukokuussa Helsingissä + Fonetiikan päiville 25.-26.2.2010 Joensuussa / AA ja MN selvittävät asiaa / seuraavaan kokoukseen mennessä

3) Road show'n osallistuminen AFinLAn syyssymposiumiin marraskuussa Tampereella / AH menossa, AH ja AA selvittävät posteritilanteen / pian

4) Konsortion mahdolliset jäsenet ja yhteistyötahot - muistutukset ja aiesopimukset / MN / lähiaikoina

5) Seuraavan kokouksen (työpajan) järjestäminen marras-joulukuussa / AA ja MN selvittävät päivämäärää Doodlella / pian

Kokous päättyi klo 12.07.


Liite:

Tiekarttasuunnitelma, joka aikanaan jätettiin:

Timetable

Years for construction/major upgrade: 2009-2020

Estimation of distribution of the costs/years:

2009: 425,000 ¤, 2010: 525,000 ¤, 2011: 500,000 ¤, 2012: 550,000 ¤, 2013: 450,000 ¤, 2014: 450,000 ¤, 2015-2020: 350,000 ¤ per year

1. Technical construction of the CLARIN-compatible Authentication and Authorization Infrastructure for language resources in Finland: 200,000 ¤ (2009-2010),

2.

2a. web-based search and browsing interface: 100,000 ¤ (2009-2010),

2b. linguistic analysis tools: 300,000 ¤ (2009-2011), (aloitettu, ei käytetty FIN-CLARIN-rahaa)

2c. adaptation and development of annotation and editing tools: 100,000 ¤ (2011-2012),

3. Basic Linguistic resources for the languages of Finland (missing components of BLARK):

3a. grammatically annotated text corpus (tree bank) of Finnish text: 1,000,000 ¤ (2010-2020), (aloitettu alustavasti Kotuksen kanssa > annotoinnin mallikorpus, mukana kaikki kieliopilliset ilmiöt)

3b. comprehensive lexical database with synonym sets (WordNet) for Finnish: 300,000 ¤ (2010-2013), (käynnistetty, pyydetty tarjouksia, muutamia kymmeniä tuhansia euroja ensimmäiseen vaiheeseen)

3c. conversion and upgrading of existing linguistic resources to conform CLARIN standards: 100,000 ¤ (2009-2010),

3d. digitizing and integrating nationally important text collections, audio and video recordings into CLARIN: 1,900,000 ¤ (2010-2020) and

4. project administration and contractual affairs: 1,000,000 ¤ (2009-2015)-- MirjaNissinen - 2009-10-26