Aineistonhallintasuunnitelma

Tutkimusrahoitusta jakavat tahot edellyttävät yleensä aineistonhallintasuunnitelman esittämistä rahoitushakemuksen yhteydessä. Aineiston ja datan hallintaan liittyvien toimintatapojen tietoinen suunnittelu on hyödyllistä myös tutkijalle itselleen. Hyvä ja realistinen suunnitelma tehostaa työn etenemistä. Se varmistaa myös mahdollisuudet jatkotutkimuksiin ja muuhun aineiston jatkokäyttöön, jonka luonnetta ei välttämättä voi aineistoa kerätessä täysin ennakoida.

Esimerkiksi Suomen Akatemia ja useat säätiöt suosittelevat, että kieliaineistojen pitkäaikaissäilytys järjestetään FIN-CLARINin kautta. Tällä sivulla on neuvoja ja lisätietoja kielentutkimuksen alan aineistonhallintasuunnitelman taustaksi. Tarvittaessa voit ottaa FIN-CLARINiin yhteyttä ja kysyä lisää.

ks. myös DCC:n tarkistuslista

Hyvän aineistonhallintasuunnitelman pitäisi vastata seuraaviin kysymyksiin:

Miten tutkimusaineisto hankitaan ja tallennetaan?

  • Noudata hyvää tieteellistä käytäntöä.
  • Kuvaa menetelmät, lähteet ja paikat, joista aineisto on tarkoitus kerätä.
  • Miten varmistetaan aineiston tekninen laatu ja tallennusformaattien yhteensopivuus Kielipankkiin tallentamista ja muuta jatkokäyttöä silmälläpitäen?
    • Suositeltavimpia ovat laajasti käytössä olevat ja monissa ohjelmissa tuetut formaatit.
    • Tiedostojen arkistokopiot on hyvä erottaa ns. käyttökopioista, jotka voivat olla tarpeen mukaan muissa formaateissa kuin pysyvät arkistokopiot.

Kuinka aineisto dokumentoidaan?

  • Aineistosta tulee kerätä riittävän tarkat kuvailutiedot, jotka voidaan julkaista mm. META-SHARE-palvelussa. Muista varata myös dokumentointiin tarvittavat resurssit hankkeen budjetissa ja aikataulussa.

Mitkä ovat aineiston omistus- ja käyttöoikeudet?

  • Kuka on tuottanut alkuperäisen aineiston? Sisältääkö se tekijänoikeuslaissa tarkoitettuja teoksia? Hanki riittävät luvat käyttöön ja jatkokäyttöön.
  • Liittyykö aineistoon henkilötietoja eli voiko siitä tunnistaa ihmisiä?
    • Millaisia henkilötietoja aineistoon voi sisältyä? Huomaa, että tutkittavista voi kerätä vain sellaisia tietoja, jotka ovat tutkimuksen kannalta tarpeellisia.
    • Mieti, kuka on rekisterinpitäjä ja määrittele henkilötietojen käsittelyn peruste.
    • Mieti, tarvitsetko eettisen toimikunnan myöntämää tutkimuslupaa.
    • Miten tutkittavia informoidaan?
    • Dokumentoi tutkimuksen alkaessa kaikki henkilötietojen käsittelyä koskevat päätökset ja toimet.
  • Kenellä on pääsy ja oikeus aineiston käyttöön tutkimuksen aikana ja myöhemmin?

Miten tutkimusaineistoa käytetään?

  • Mitä aiot tehdä aineistolla?
  • Millaisia ohjelmia ja välineitä käytät?

Miten aineisto tuodaan muiden tutkijoiden (ja mahdollisesti myös suuren yleisön) saataville jatkokäyttöä varten?

  • Kieliaineiston tai muun kielivaran tuottajan/omistajan on varmistettava riittävät oikeudet ja luvat aineiston käyttöön ja jatkokäyttöön sekä varauduttava tekemään kielivarasta tallennussopimus FIN-CLARINin kanssa.
  • Mikäli aineisto koostuu teksteistä, joita on mahdollisesti annotoitu, se voidaan tuoda saataville Kielipankin Korp-palvelun kautta.
  • Muista julkaisualustoista ja -tavoista kannattaa kysyä FIN-CLARINilta etukäteen.
  • Aineiston tuottaja toimittaa valmiin aineiston FIN-CLARINille yhteensopivassa formaatissa.
  • Huomaa, että FIN-CLARIN tarjoaa lähtökohtaisesti neuvontaa sekä välttämättömät, ylläpitäjän oikeuksia edellyttävät siirtotoimenpiteet, joita aineiston julkaiseminen edellyttää. Mikäli FIN-CLARINilta halutaan lisäksi ostaa asiantuntijatyötä esimerkiksi aineiston konvertointiin, tästä on sovittava FIN-CLARINin kanssa etukäteen ja varauduttava kustannuksiin hankkeen budjetissa.
  • Tallennussopimuksessa määriteltävien lisenssiehtojen mukaisesti aineistot voivat olla em. palveluissa täysin julkisesti käytettävissä (CLARIN PUB) tai niiden käyttäjiltä voidaan vaatia kirjautumista (CLARIN ACA), tarvittaessa lisäksi henkilökohtaista käyttöoikeutta (CLARIN RES).

Miten aineisto suojataan (jos tämä on tarpeen)?

  • Aineiston riittävän tietoturvallinen säilytys keruuvaiheessa ja tutkimuksen aikana?
  • Anonymisoidaanko tai pseudonymisoidaanko aineisto ja miten? Muista varata tähän tarvittavat resurssit.
  • Kielipankin aineistojen käyttölupahallinnosta huolehtii teknisesti CSC – Tieteen tietotekniikan keskus, mikäli aineisto on käyttöoikeusluokaltaan CLARIN ACA tai CLARIN RES. Tällaisia aineistoja pääsee käyttämään ainoastaan sähköisen tunnistautumisen kautta.
  • Henkilökohtaista käyttöoikeutta edellyttäviin aineistoihin (CLARIN RES) on tunnistautumisen lisäksi haettava henkilökohtaista käyttöoikeutta. Kielipankkiin tallennettujen aineistojen käyttöoikeuksien hakeminen tapahtuu kokonaan sähköisesti. Mieti, kuka voi jatkossa toimia aineiston käyttöoikeuksien myöntäjänä.
  • Mikäli aineisto sisältää ns. arkaluonteisia henkilötietoja eli esimerkiksi henkilötunnuksia, etnistä alkuperää koskevia tietoja, potilastietoja, rikosrekisteritietoja tms. (lueteltu henkilötietolain 523/1999 11 §:ssä), eikä kyseisiä aineksia voida aineistosta täysin häivyttää, ei aineistoa ole kaikissa tapauksissa mahdollista tallentaa Kielipankin järjestelmiin. Ota yhteyttä FIN-CLARINiin ja varmistetaan asia.

Muut aineistojen tuottajan ohjeet

Hae Kielipankki-portaalista:
Harri Uusitalo
Kuukauden tutkija: Harri Uusitalo

 

Tulevat tapahtumat


Yhteystiedot

Kielipankin tekninen ylläpito:
kielipankki (ät) csc.fi
p. 09 4572001

Aineistoihin ja muuhun sisältöön liittyvät asiat:
fin-clarin (ät) helsinki.fi
p. 029 4129317

Tarkemmat yhteystiedot