Aineistonhallinnan suunnittelu

Aineistonhallinnan suunnittelu

Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaa. Suunnitelmaa voi täsmentää tutkimushankkeen aikana, mutta tärkeimmät suuntaviivat ja periaatteet täytyy miettiä jo ennen projektin alkua ja viimeistään ennen aineiston keräämistä.

Aineistonhallinnan suunnittelun tarkoitus on varmistaa, että tutkimusaineistojen suhteen noudatetaan hyvää tieteellistä käytäntöä, että tutkimusaineisto ei vaarannu missään vaiheessa ja että aineiston jatkokäyttö on mahdollista.

Ennen tutkimuksen aloitusta ja aineistokeruuta on tarkistettava, edellyttääkö oma tutkimus eettistä ennakkoarviointia. Kun aineistonkeruu tehdään Suomen ulkopuolella, on hyvä selvittää ennakkoon maan käytännöt eettisessä ennakkoarvioinnissa. Ulkomaisten yliopistojen sivuilta löytyy useimmiten ohjeet asiasta (hakufraasit 'ethics review board', 'ethics review committee', 'ethical review of research projects involving human participants').

Aineistonhallintasuunnitelma

Aineistonhallintasuunnitelmassa kuvataan miten tutkimusaineisto hankitaan, miten sitä käytetään ja säilytetään tutkimusprojektin aikana ja miten mahdollistetaan aineiston käyttö projektin päätyttyä. Tutkimussuunnitelmaan voi liittää esimerkiksi seuraavien mallien mukaiset tiiviit aineistonhallintasuunnitelmat:

Tutkimushankkeen alettua aineistonhallintasuunnitelmaa pitää tarkentaa ja olosuhteiden muuttuessa sitä pitää päivittää. Tutkimuksen aineistonhallinta on varmistettu, kun kaikki alla luetellut osa-alueet ovat selvillä.

1. Aineisto

  • Mitä aineistoa kerätään?
  • Miten aineisto kerätään?

Tutkimuskysymykset määrittävät keskeisimmin, mitä aineistoa kerätään. Tyypillisimpiä aineistoja ovat kyselyt, haastattelut, ryhmähaastattelut, kirjoitukset, asiakas- tai asiointitilanteet, viralliset dokumentit, arkistoaineistot, verkkosivustot, rekisteriaineistot ja media-aineistot.

Aineistotyyppi vaikuttaa aineiston keruutapaan. Kvantitatiivisia aineistoja voidaan kerätä haastattelemalla, postikyselyinä, verkkokyselyinä, poimimalla tiedot erilaisista lähdedokumenteista tai mittaamalla. Haastattelut, ryhmähaastattelut ja asiakas- ja asiointitilanteet kerätään yleensä tallentaen ne ääni- tai äänikuvatiedostoiksi. Kirjoitukset kerätään tavallisesti kirjoituspyyntöjen tai -kutsujen avulla sähköpostitse, maapostitse tai tarkoitusta varten luodun verkkosivuston kautta. Virallisista dokumenteista saa nykyisin suuren osan suoraan verkosta, mutta osan dokumenteista saa vain erikseen pyytämällä tai anomalla lupaa niiden tutkimuskäyttöön. Rekisteriaineistojen saaminen edellyttää lupamenettelyä. Ohjeita lupien hakemiseen saa Rekisteritutkimuksen tukikeskuksesta.

Tutkija tai projekti voi kerätä ja tallentaa aineiston itse, tai aineisto voidaan tilata joltain tiedonkeruu- tai haastatteluorganisaatiolta. Jos tutkimusprojekti päättää ostaa tiedonkeruun, tarjouspyyntö kannattaa lähettää usealle tiedonkeruuorganisaatiolle. Tarjouspyynnön laatimisessa voi ja kannattaa käyttää apuna tutkimusaineiston aineistonhallintasuunnitelmaa.

2. Oikeudet

  • Mitkä ovat tutkimusaineiston omistus-, hallinta- ja tekijänoikeudet?
  • Kuka antaa käyttöoikeudet aineistoon?
  • Miten tutkittavia informoidaan?

Aineistoon voi liittyä tekijänoikeuksia, vaikka suuri osa empiiristä aineistoa jää tekijänoikeuslain suojan ulkopuolelle. Jos aineistoon liittyy tekijänoikeuksia, aineiston tekijänoikeuden haltija määrää aineiston käyttötavat ja aineiston käyttöön on saatava oikeudenhaltijan suostumus. Riippumatta siitä, onko aineisto tekijänoikeudella suojattua vai ei on aineiston tekijöiden määrittäminen tärkeää, sillä arkistoidun aineiston jatkokäyttäjät viittaavat omissa tutkimuksissaan aineistoon ja sen tekijöihin.

Tutkimuksessa tulee aina erikseen sopia aineiston omistamisesta ja käyttöoikeuksista. Aineiston käyttöoikeuksista on hyvä sopia koskien sekä alkuperäistä tutkimusta että sen jälkeistä aikaa. Ennen tutkimussopimuksen laatimista tulee tarkistaa, mitkä ovat tutkimusrahoittajan tutkimusaineistoja koskevat vaatimukset, jotta aineistosta sovitaan rahoittajan edellyttämällä tavalla.

Kun käytetään ulkopuolista tiedonkeruu- tai haastatteluorganisaatiota, viimeistään keruusopimusta tehtäessä tulee määritellä ja sopia, kuka omistaa tutkimusaineiston tai hallinnoi sitä ja miten tutkittavia informoidaan aineiston käytöstä. Jos tutkimusaineisto on tarkoitus arkistoida jatkokäyttöä varten, voidaan sopia, että keruuorganisaatio toimittaa tutkimusaineistosta ja dokumentaatiosta kopiot suoraan Yhteiskuntatieteelliseen tietoarkistoon.

Arkistoaineistojen käyttöoikeudet määrittää kukin arkisto. Viralliset dokumentit ja asiakirjat ovat yleensä tutkijoiden vapaasti käytettävissä. Kun tutkimuksessa käytetään salassapidettäviä asiakirjoja, niiden käyttöoikeudet määrittää aineistojen luovuttaja. Avoimesti saatavilla olevat verkkoaineistot ovat vapaasti tutkimukseen käytettävissä, mutta niiden arkistointi jatkokäyttöä varten ei aina ole mahdollista esimerkiksi tekijänoikeuslain tai henkilötietolain perusteella.

Kun aineistoa kerätään suoraan tutkittavilla, heille annettu informaatio määrittää olellisesti aineiston käyttöoikeuksia.

3. Tietosuoja ja tietoturva

  • Miten varmistetaan tietosuoja?
  • Minkälaiset oikeudet eri käyttäjäryhmillä on aineistotiedostojen lukemiseen ja käsittelyyn?
  • Miten huolehditaan tietoturvasta?
  • Miten hoidetaan varmuuskopiointi?

Tutkimuksessa tietosuoja kiteytyy tutkittavia koskevien henkilötietojen käsittelyn suunnitelmallisuuteen ja huolellisuuteen. Henkilötietoja ei tule kerätä ja käsitellä tarpeettomasti ja tiedot tulee suojata niin, etteivät ulkopuoliset pääse niihin käsiksi. Mikäli tutkimusaineiston muodostamiseen tarvitaan henkilötunnusta, tulee sopia erikseen, ketkä ovat oikeutettuja tunnisteellisen aineiston käsittelyyn.

» Lisätietoa tutkimusaineistojen tunnisteellisuudesta ja anonymisoinnista.

Kun osana tutkimusta käsitellään tunnisteellisia tutkimusaineistoja, henkilötietolaki edellyttää, että tutkija laatii rekisteriselosteen. Rekisteriseloste lisää henkilötietojen käsittelyn avoimuutta ja se on annettava pyynnöstä tutkittavan nähtäväksi. Verkkopalvelun kautta kerättävän aineiston yhteydessä voidaan käyttää myös tietosuojaselostetta. Tietosuojaseloste on laajennettu rekisteriseloste, joka toteuttaa samalla myös laajemmin henkilötietolain mukaista informointivelvollisuutta. Tutustu tietosuojavaltuutetun laatimiin ohjeisiin.

Epäselvyyksien välttämiseksi rekisteriselosteen tulisi sisältää kaikki se tieto, mitä tutkittavalle annetaan aineistosta, sen käsittelystä ja käytöstä. Mikäli tutkimusaineisto halutaan luovuttaa tunnisteellisena Yhteiskuntatieteelliseen tietoarkistoon, on tästä hyvä mainita myös rekisteriselosteessa samalla tavalla kuin tutkittavia asiasta informoidaan.

Tietoturvalla tai tietoturvallisuudella tarkoitetaan tietojen, järjestelmien ja tietoliikenteen suojausta. Sähköisen tutkimusaineiston kopioiminen ja levittäminen on helppoa, samoin esimerkiksi tahaton tuhoaminen tai muuttaminen. Varmuuskopiointi on osa tietoturvaa, mutta lisäksi on varmistettava, että aineiston ulkopuolinen (luvaton) käyttö on estetty.

Suurta tallennuskapasitettia vaativat aineistot kannattaa säilyttää tutkimuksen ajan Opetus- ja kulttuuriministeriön tarjoamassa IDA-säilytyspalvelussa. IDA-säilytyspalvelu on hyödyllinen ja tietoturvallinen ratkaisu myös eri yliopistojen välisille yhteisprojekteille, joissa analysoidaan samaa aineistoa. Palvelu on tarkoitettu Suomen korkeakouluille ja Suomen Akatemian projekteille (akatemiahankkeet, huippuyksiköt, tutkimusohjelmat, tutkimusinfrastruktuurit).

» Lisätietoa tietoturvasta.

4. Tiedostoformaatit ja ohjelmistot

  • Mitä ohjelmistoja käytetään aineiston tallentamiseen ja prosessointiin?
  • Mitä tiedostoformaatteja ja tallennusmedioita käytetään?

Kvantitatiivisten aineistojen käsittelyyn on olemassa useita tilasto-ohjelmia. Myös laadullisten aineistojen käsittelyyn ja jäsentelyyn on omat ohjelmansa, vaikka esimerkiksi tekstien analyysissä käytetään edelleen usein tavallisia tekstinkäsittelyohjelmia. Valittu ohjelma määrittää käytettävät tiedostoformaatit. Koska ohjelmistot uusiutuvat koko ajan, aineistosta on hyvä tallentaa yksi täysin ohjelmistoriippumaton versio tai ainakin versio, jota useat eri ohjelmistot tukevat.

» Lisätietoa tiedostoformaateista ja ohjelmistoista

Aineistotiedostoja voidaan tallentaa ja siirtää optisilla medioilla (esim. CD, DVD, Blu-ray) ja haihtumattoman muistin medioilla (esim. USB-muistitikut). Varmin tapa säilyttää aineistotiedostoja on tallentaa ne magneettisille medioille (esim. kiintolevyt ja magneettiset nauhat).

» Lisätietoa tallennusmedioista.

5. Aineiston käsittelyn ja sisällön kuvaus

  • Miten varmistetaan aineiston (tekninen) laatu?
  • Miten aineiston käsittely dokumentoidaan?
  • Miten tallennetaan aineiston keruuta ja sisältöä kuvaava tieto (metadata)?

Aineiston laatuun vaikuttavat tallennusvaiheessa tehtävät sisällölliset ja tekniset ratkaisut. Niitä ovat esimerkiksi tietojen syöttö havaintomatriisiin tai ääni- ja äänikuvatallennuksen tekninen toteutus. Myös aineiston keruun jälkeen tehtävät aineiston käsittelyn ratkaisut vaikuttavat aineiston laatuun. Niitä ovat esimerkiksi aineistotiedostojen nimeäminen ja järjestäminen, puuttuvien tietojen määrittäminen ja muuttujien nimeäminen kvantitatiiviselle aineistolle ja tekstintäminen eli litterointi kvalitatiiviselle aineistolle.

» Lisätietoa ja ohjeita kvantitatiivisen aineiston käsittelyyn ja kvalitatiivisen aineiston käsittelyyn.

Huolellinen dokumentaatio aineiston keruun vaiheista ja aineiston käsittelystä varmistaa tutkimuksen laadun. Aineiston dokumentointi on elintärkeää myös aineiston pitkäaikaissäilyttämisessä. Aineiston kattava kuvailu eli huolella tehty metadata mahdollistaa aineiston informoidun jatkokäytön ja pitkän elinkaaren.

6. Elinkaari

  • Mitä aineistolle tapahtuu tutkimuksen päätyttyä?

Tutkimusaineiston käyttöarvo perustuu pitkälti tutkimushankkeen aikana tehtävään aineistonhallintatyöhön. Kun se on tehty suunnitelmallisesti, aineisto voi olla hyvin käyttökelpoinen tutkimuksen päätyttyä jatkotutkimuksissa tai menetelmien opetuksessa ja opiskelussa.

Mikäli tutkimusaineisto jää tutkimuksen päätyttyä yksittäiselle tutkijalle, yliopistolaitokselle, tutkimusyksikölle tai organisaatiolle, aineiston haltijan tulee ratkaista aineistonhallinnan perusasiat: säilytys, käyttö- ja arkistokopiot, aineistosta tiedottaminen, käyttöehdot ja jakelu. Kun aineisto arkistoidaan tietoarkistoon, huolehtii tietoarkisto kaikista mainituista tehtävistä ja varmistaa aineiston tietosuojan ja tietoturvan.

Kaikkia tutkimusaineistoja ei kannata säilyttää pysyvästi. Arkistointia harkittaessa on arvioitava muun muassa aineiston ainutkertaisuutta, käytettävyyttä, käyttörajoituksia, jatkokäyttöarvoa opetuksessa ja tutkimuksessa sekä arkistoinnin kustannuksia. Arkistoinnin kustannuksia lisää huomattavasti puutteellinen aineistonhallinta tutkimuksen aikana, sillä tutkimuksen päätyttyä aineiston perustietojen hankkiminen ja aineiston järjestäminen voi viedä kohtuuttoman paljon aikaa. Aineiston tuhoamisen tulee silti aina olla tietoinen päätös eikä seurausta puutteellisesta tai huolimattomasta aineistonhallinnasta.

Aiheesta lisää:

Avaa lukutila
viimeksi päivitetty 2014-09-11