Yhteystiedot

FIN-CLARIN
Digitaalisten ihmistieteiden osasto
PL 24 (Unioninkatu 40)
00014 Helsingin yliopisto

fin-clarin ( ATT ) helsinki.fi


Kielipankissa on käytössä
138 aineistoa
13 työkalua

Tulossa 91 kielivaraa

Kerro meille omasta kieliaineistostasi!




FIN-CLARIN    CSC - Tieteen tietotekniikan keskus
Kansainvälinen CLARIN-projekti



Tuottajan ohjeet: Aineistonhallintasuunnitelma

Tutkimusrahoitusta jakavat tahot edellyttävät yleensä aineistonhallintasuunnitelman esittämistä rahoitushakemuksen yhteydessä. Aineiston ja datan hallintaan liittyvien toimintatapojen tietoinen suunnittelu on hyödyllistä myös tutkijalle itselleen. Hyvä ja realistinen suunnitelma tehostaa työn etenemistä. Se varmistaa myös mahdollisuudet jatkotutkimuksiin ja muuhun aineiston jatkokäyttöön, jonka luonnetta ei välttämättä voi aineistoa kerätessä täysin ennakoida.

Esimerkiksi Suomen Akatemia ja useat säätiöt suosittelevat, että kieliaineistojen pitkäaikaissäilytys järjestetään FIN-CLARINin kautta. Tällä sivulla on neuvoja ja lisätietoja kielentutkimuksen alan aineistonhallintasuunnitelman taustaksi. Tarvittaessa voit ottaa FIN-CLARINiin yhteyttä ja kysyä lisää.

*Huomaa, että tämä sivu on vielä keskeneräinen ja puutteita voi esiintyä.*

Ks. myös DCC:n tarkistuslista

Hyvässä aineistonhallintasuunnitelmassa pitäisi vastata seuraaviin kysymyksiin:


Miten tutkimusaineisto hankitaan ja tallennetaan?

  • Noudata hyvää tieteellistä käytäntöä.
  • Kuvaa menetelmät, lähteet ja paikat, joista aineisto on tarkoitus kerätä.

  • Miten varmistetaan aineiston tekninen laatu ja tallennusformaattien yhteensopivuus Kielipankkiin tallentamista ja muuta jatkokäyttöä silmälläpitäen?
    • Suositeltavimpia ovat laajasti käytössä olevat ja monissa ohjelmissa tuetut formaatit.
    • Tiedostojen arkistokopiot on hyvä erottaa ns. käyttökopioista, jotka voivat olla tarpeen mukaan muissa formaateissa kuin pysyvät arkistokopiot.

Kuinka aineisto dokumentoidaan?

  • Aineistosta tulee kerätä riittävän tarkat kuvailutiedot, jotka voidaan julkaista mm. META-SHARE-palvelussa. Muista varata myös dokumentointiin tarvittavat resurssit hankkeen budjetissa ja aikataulussa.

Mitkä ovat aineiston omistus- ja käyttöoikeudet?

  • Liittyykö aineistoon henkilötietoja eli voiko siitä tunnistaa ihmisiä?
    • Millaisia henkilötietoja aineistoon voi sisältyä? Huomaa, että tutkittavista voi kerätä vain sellaisia tietoja, jotka ovat tutkimuksen kannalta tarpeellisia.
    • Mieti, kuka on rekisterinpitäjä ja määrittele henkilötietojen käsittelyn peruste.
    • Mieti, tarvitsetko eettisen toimikunnan myöntämää tutkimuslupaa.
    • Miten tutkittavia informoidaan?
    • Dokumentoi tutkimuksen alkaessa kaikki henkilötietojen käsittelyä koskevat päätökset ja toimet.

  • Kenellä on pääsy ja oikeus aineiston käyttöön tutkimuksen aikana ja myöhemmin?

Miten tutkimusaineistoa käytetään?

  • Mitä aiot tehdä aineistolla?

  • Millaisia ohjelmia ja välineitä käytät?

Miten aineisto tuodaan muiden tutkijoiden (ja mahdollisesti myös suuren yleisön) saataville jatkokäyttöä varten?

  • Kieliaineiston tai muun kielivaran tuottajan/omistajan on varmistettava riittävät oikeudet ja luvat aineiston käyttöön ja jatkokäyttöön sekä varauduttava tekemään kielivarasta tallennussopimus FIN-CLARINin kanssa.

  • Mikäli aineisto koostuu teksteistä, joita on mahdollisesti annotoitu, se voidaan tuoda saataville Kielipankin Korp-palvelun kautta.
  • Mikäli aineisto sisältää äänitteitä, kuvia ja/tai videoita, joita on mahdollisesti annotoitu, se voidaan tuoda saataville Kielipankin LAT-palvelun tai vastaavan järjestelmän kautta (LAT-palvelu poistuu käytöstä viimeistään vuonna 2020 ja se on tarkoitus korvata uudella).
  • Muista julkaisualustoista ja -tavoista kannattaa kysyä FIN-CLARINilta etukäteen.

  • Aineiston tuottaja toimittaa valmiin aineiston FIN-CLARINille (tai suoraan esim. Kielipankin LAT-alustalle) yhteensopivassa formaatissa.
  • Huomaa, että FIN-CLARIN tarjoaa lähtökohtaisesti neuvontaa sekä välttämättömät, ylläpitäjän oikeuksia edellyttävät siirtotoimenpiteet, joita aineiston julkaiseminen edellyttää. Mikäli FIN-CLARINilta halutaan lisäksi ostaa asiantuntijatyötä esimerkiksi aineiston konvertointiin, tästä on sovittava FIN-CLARINin kanssa etukäteen ja varauduttava kustannuksiin hankkeen budjetissa.

  • Tallennussopimuksessa määriteltävien lisenssiehtojen mukaisesti aineistot voivat olla em. palveluissa täysin julkisesti käytettävissä (CLARIN PUB) tai niiden käyttäjiltä voidaan vaatia kirjautumista (CLARIN ACA), tarvittaessa lisäksi henkilökohtaista käyttöoikeutta (CLARIN RES).

Miten aineisto suojataan (jos tämä on tarpeen)?

  • Aineiston riittävän tietoturvallinen säilytys keruuvaiheessa ja tutkimuksen aikana?

  • Anonymisoidaanko tai pseudonymisoidaanko aineisto ja miten? Muista varata tähän tarvittavat resurssit.

  • Kielipankin aineistojen käyttölupahallinnosta huolehtii teknisesti CSC - Tieteen tietotekniikan keskus, mikäli aineisto on käyttöoikeusluokaltaan CLARIN ACA tai CLARIN RES. Tällaisia aineistoja pääsee käyttämään ainoastaan sähköisen tunnistautumisen kautta.

  • Henkilökohtaista käyttöoikeutta edellyttäviin aineistoihin (CLARIN RES) on tunnistautumisen lisäksi haettava henkilökohtaista käyttöoikeutta. Kielipankkiin tallennettujen aineistojen käyttöoikeuksien hakeminen tapahtuu kokonaan sähköisesti. Mieti, kuka voi jatkossa toimia aineiston käyttöoikeuksien myöntäjänä.

  • Mikäli aineisto sisältää ns. arkaluonteisia henkilötietoja eli esimerkiksi henkilötunnuksia, etnistä alkuperää koskevia tietoja, potilastietoja, rikosrekisteritietoja tms. (lueteltu henkilötietolain 523/1999 11 §:ssä), eikä kyseisiä aineksia voida aineistosta täysin häivyttää, ei aineistoa ole kaikissa tapauksissa mahdollista tallentaa Kielipankin järjestelmiin. Ota yhteyttä FIN-CLARINiin ja varmistetaan asia.




Muut aineistojen tuottajan ohjeet





-- MiettaLennes - 2016-11-21