Aineistonhallinnan suunnittelu

Aineistonhallinnan suunnittelu

Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaa. Suunnitelmaa voi täydentää tutkimushankkeen alettua ja sen aikanakin, joskin tärkeimmät suuntaviivat ja periaatteet täytyy miettiä jo ennen projektin alkua ja viimeistään ennen aineiston keräämistä.

Aineistonhallinnan suunnittelun tarkoitus on varmistaa, että tutkimusaineistojen suhteen noudatetaan hyvää tieteellistä käytäntöä, että tutkimusaineisto ei vaarannu missään vaiheessa ja että informoitu jatkokäyttö on mahdollista.

Hyvän tieteellisen käytännön mukaisesti ennen tutkimuksen aloitusta ja aineistokeruuta on tarkistettava, edellyttääkö oma tutkimus eettistä ennakkoarviointia. Kun aineistonkeruu tehdään Suomen ulkopuolella, on hyvä selvittää ennakkoon maan käytännöt eettisessä ennakkoarvioinnissa. Ulkomaisten yliopistojen sivuilta löytyy useimmiten ohjeet asiasta (hakufraasit 'ethics review board', 'ethics review committee', 'ethical review of research projects involving human participants').

Aineistonhallintasuunnitelma

Aineistonhallintasuunnitelmassa kuvataan miten tutkimusaineisto hankitaan, miten sitä käytetään ja säilytetään tutkimusprojektin aikana ja miten mahdollistetaan aineiston käyttö projektin päätyttyä. Tutkimussuunnitelmaan voi liittää esimerkiksi seuraavien mallien mukaiset tiiviit aineistonhallintasuunnitelmat:

Tutkimushankkeen alettua aineistonhallintasuunnitelmaa pitää tarkentaa ja olosuhteiden muuttuessa sitä pitää päivittää. Tutkimuksen aineistonhallinta on varmistettu, kun kaikki alla luetellut osa-alueet ovat selvillä.

1. Aineisto

 • Mitä aineistoa kerätään?
 • Miten aineisto kerätään?

Tutkimuskysymykset ja tutkimuksen suunniteltu kesto määrittävät keskeisimmin, mitä aineistoa kerätään. Tyypillisimpiä aineistoja ovat kyselyt, haastattelut, ryhmähaastattelut, kirjoitukset, asiakas- tai asiointitilanteet, viralliset dokumentit, arkistoaineistot, verkkosivustot, rekisteriaineistot ja media-aineistot.

Aineistotyyppi vaikuttaa aineiston keruutapaan. Kvantitatiivisia aineistoja voidaan kerätä haastattelemalla, postikyselyinä, verkkokyselyinä tai poimimalla tiedot erilaisista lähdedokumenteista. Haastattelut, ryhmähaastattelut ja asiakas- ja asiointitilanteet kerätään yleensä tallentaen ne ääni- tai äänikuvatiedostoiksi. Kirjoitukset kerätään tavallisesti kirjoituspyyntöjen tai -kutsujen avulla sähköpostitse, maapostitse tai tarkoitusta varten luodun verkkosivuston kautta. Virallisista dokumenteista saa nykyisin suuren osan suoraan verkosta, mutta osan dokumenteista saa vain erikseen pyytämällä tai anomalla lupaa niiden tutkimuskäyttöön. Rekisteriaineistojen saaminen edellyttää lupamenettelyä. Ohjeita lupien hakemiseen saa Rekisteritutkimuksen tukikeskuksesta

Tutkija tai projekti voi kerätä ja tallentaa aineiston itse, tai aineisto voidaan tilata joltain tiedonkeruu- tai haastatteluorganisaatiolta. Jos tutkimusprojekti päättää ostaa tiedonkeruun, tarjouspyyntö kannattaa lähettää usealle tiedonkeruuorganisaatiolle. Tarjouspyynnön laatimisessa voi ja kannattaa käyttää apuna tutkimusaineiston aineistonhallintasuunnitelmaa.

2. Oikeudet

 • Mitkä ovat tutkimusaineiston omistus-, hallinta- ja tekijänoikeudet?
 • Kuka antaa käyttöoikeudet aineistoon?
 • Miten tutkittavia informoidaan?

Empiirinen aineisto saa teossuojan, jos se on tekijänsä luovan työn omaperäinen tulos. Tällöin arviointikriteerinä käytetään sitä, olisiko kukaan muu samaan työhön ryhtyessään voinut päätyä samanlaiseen lopputulokseen. Vaikka suuri osa empiirisistä tutkimusaineistoista ei tässä mielessä ylitä teoskynnystä, aineiston tekijöiden määrittäminen on olennaista, sillä arkistoidun aineiston jatkokäyttäjät viittaavat omissa tutkimuksissaan aineistoon ja sen tekijöihin. Lisätietoa aineistoihin viittaamisesta ja lisätietoa tekijänoikeudesta.

Kun tutkimuksessa kerätään empiirinen tutkimusaineisto, tulee sen omistamisesta ja käyttöoikeuksista erikseen sopia. Tutkimussopimuksissa empiiriseen aineistoon viitataan usein termillä tausta-aineisto. Ennen tutkimussopimuksen laatimista tulee tarkistaa, mitkä ovat tutkimusrahoittajan tutkimusaineistoja koskevat vaatimukset. Aineiston käyttöoikeuksista on hyvä sopia koskien sekä alkuperäistä tutkimusta että sen jälkeistä aikaa.

Kun käytetään ulkopuolista tiedonkeruu- tai haastatteluorganisaatiota, viimeistään keruusopimuksessa tulee määritellä, kuka omistaa tutkimusaineiston tai hallinnoi sitä, minkälaiset ehdot tutkimusaineiston käytölle on ja miten tutkittavia informoidaan. Jos tutkimusaineisto on tarkoitus arkistoida jatkokäyttöä varten, voidaan sopia, että keruuorganisaatio toimittaa tutkimusaineistosta ja dokumentaatiosta kopiot suoraan Yhteiskuntatieteelliseen tietoarkistoon.

Arkistoaineistojen käyttöoikeudet määrittää kukin arkisto. Viralliset dokumentit ja asiakirjat eivät tavallisesti saa tekijänoikeussuojaa ja ne ovat tutkijoiden vapaasti käytettävissä. Kun tutkimuksessa käytetään salassapidettäviä asiakirjoja, niiden käyttöoikeudet määrittää aineistojen luovuttaja. Avoimesti saatavilla olevat verkkoaineistot ovat vapaasti tutkimukseen käytettävissä, mutta niiden arkistointi jatkokäyttöä varten ei aina ole mahdollista esimerkiksi tekijänoikeudellisesti tai henkilötietolain perusteella.

Kun aineistoa kerätään suoraan tutkittavilla, heille annettu informaatio määrittää olellisesti aineiston käyttöoikeuksia. Lisätietoa tutkittavien informoinnista

3. Tietosuoja ja tietoturva

 • Miten varmistetaan tietosuoja?
 • Minkälaiset oikeudet eri käyttäjäryhmillä on aineistotiedostojen lukemiseen ja käsittelyyn?
 • Miten huolehditaan tietoturvasta?
 • Miten hoidetaan varmuuskopiointi?

Tutkimuksessa tietosuoja kiteytyy tutkittavia koskevien henkilötietojen käsittelyn suunnitelmallisuuteen ja huolellisuuteen. Henkilötietoja ei tule kerätä ja käsitellä tarpeettomasti ja tiedot tulee suojata niin, etteivät ulkopuoliset pääse niihin käsiksi. Mikäli tutkimusaineiston muodostamiseen tarvitaan henkilötunnusta, tulee sopia erikseen, ketkä ovat oikeutettuja tunnisteellisen aineiston käsittelyyn. Lisätietoa tutkimusaineistojen tunnisteellisuudesta ja anonymisoinnista.

Kun osana tutkimusta käsitellään tunnisteellisia tutkimusaineistoja, henkilötietolaki edellyttää tutkijaa laatimaan rekisteriselosteen. Rekisteriseloste lisää henkilötietojen käsittelyn avoimuutta ja se on annettava pyynnöstä tutkittavan nähtäväksi. Verkkopalvelun kautta kerättävän aineiston yhteydessä voidaan käyttää myös tietosuojaselostetta. Tietosuojaseloste on laajennettu rekisteriseloste, joka toteuttaa samalla myös laajemmin henkilötietolain mukaista informointivelvollisuutta. Tutustu tietosuojavaltuutetun laatimiin ohjeisiin täällä.

Epäselvyyksien välttämiseksi rekisteriseloste tulisi laatia sisällöltään vastaamaan sitä, miten tutkittavia informoidaan tutkimuksesta. Mikäli tutkimusaineisto halutaan luovuttaa tunnisteellisena Yhteiskuntatieteelliseen tietoarkistoon, on tästä hyvä mainita myös rekisteriselosteessa ja tietosuojaselosteessa samalla tavalla kuin tutkittavia asiasta informoidaan.

Tietoturvalla tai tietoturvallisuudella tarkoitetaan tietojen, järjestelmien ja tietoliikenteen suojausta. Sähköisen tutkimusaineiston kopioiminen ja levittäminen on helppoa, samoin esimerkiksi tahaton tuhoaminen tai muuttaminen. Varmuuskopiointi on osa tietoturvaa, mutta lisäksi on varmistettava, että aineiston ulkopuolinen (luvaton) käyttö on estetty. Lisätietoa tietoturvasta.

4. Tiedostoformaatit ja ohjelmistot

 • Mitä ohjelmistoja käytetään aineiston tallentamiseen ja prosessointiin?
 • Mitä tiedostoformaatteja ja tallennusmedioita käytetään?

Kvantitatiivisten aineistojen käsittelyyn on olemassa useita tilasto-ohjelmia. Myös laadullisten aineistojen käsittelyyn ja jäsentelyyn on omat ohjelmansa, vaikka esimerkiksi tekstien analyysissä käytetään edelleen usein tavallisia tekstinkäsittelyohjelmia. Valittu ohjelma määrittää käytettävät tiedostoformaatit. Koska ohjelmistot uusiutuvat koko ajan, aineistosta on hyvä tallentaa yksi täysin ohjelmistoriippumaton versio tai ainakin versio, jota useat eri ohjelmistot tukevat. Lisätietoa tiedostoformaateista ja ohjelmistoista

Aineistotiedostoja voidaan tallentaa ja siirtää optisilla medioilla (esim. CD, DVD, Blu-ray) ja haihtumattoman muistin medioilla (esim. USB-muistitikut). Varmin tapa säilyttää aineistotiedostoja on tallentaa ne magneettisille medioille (esim. kiintolevyt ja magneettiset nauhat). Lisätietoa tallennusmedioista.

5. Aineiston käsittelyn ja sisällön kuvaus

 • Miten varmistetaan aineiston (tekninen) laatu?
 • Miten aineiston käsittely dokumentoidaan?
 • Miten tallennetaan aineiston keruuta ja sisältöä kuvaava tieto (metadata)?

Aineiston laatuun vaikuttavat tallennusvaiheessa tehtävät sisällölliset ja tekniset ratkaisut. Niitä ovat esimerkiksi tietojen syöttö havaintomatriisiin tai ääni- ja äänikuvatallennuksen tekninen toteutus. Myös aineiston keruun jälkeen tehtävät aineiston käsittelyn ratkaisut vaikuttavat aineiston laatuun. Niitä ovat esimerkiksi aineistotiedostojen nimeäminen ja järjestäminen, puuttuvien tietojen määrittäminen ja muuttujien nimeäminen kvantitatiiviselle aineistolle ja tekstintäminen eli litterointi kvalitatiiviselle aineistolle. Lisätietoa ja ohjeita kvantitatiivisen aineiston käsittelyyn ja kvalitatiivisen aineiston käsittelyyn.

Huolellinen dokumentaatio aineiston keruun vaiheista ja aineiston käsittelystä varmistaa tutkimuksen laadun. Aineiston dokumentointi on elintärkeää myös aineiston pitkäaikaissäilyttämisessä. Aineiston kattava kuvailu eli huolella tehty metadata mahdollistaa aineiston informoidun jatkokäytön ja pitkän elinkaaren.

6. Elinkaari

 • Mitä aineistolle tapahtuu tutkimuksen päätyttyä?

Tutkimusaineiston käyttöarvo perustuu pitkälti tutkimushankkeen aikana tehtävään aineistonhallintatyöhön. Kun se on tehty suunnitelmallisesti, aineisto voi olla hyvin käyttökelpoinen tutkimuksen päätyttyä jatkotutkimuksissa tai menetelmien opetuksessa ja opiskelussa.

Mikäli tutkimusaineisto jää tutkimuksen päätyttyä yksittäiselle tutkijalle, yliopistolaitokselle, tutkimusyksikölle tai organisaatiolle, aineiston haltijan tulee ratkaista aineistonhallinnan perusasiat: säilytys, käyttö- ja arkistokopiot, aineistosta tiedottaminen, käyttöehdot ja jakelu. Kun aineisto arkistoidaan tietoarkistoon, huolehtii tietoarkisto kaikki mainitut tehtävät ja varmistaa aineiston tietosuojan ja tietoturvan.

Kaikkia tutkimusaineistoja ei kannata säilyttää pysyvästi. Arkistointia harkittaessa on arvioitava muun muassa aineiston ainutkertaisuutta, käytettävyyttä, käyttörajoituksia, jatkokäyttöarvoa opetuksessa ja tutkimuksessa sekä arkistoinnin kustannuksia. Arkistoinnin kustannuksia lisää huomattavasti puutteellinen aineistonhallinta tutkimuksen aikana, sillä tutkimuksen päätyttyä aineiston perustietojen hankkiminen ja aineiston järjestäminen voi viedä kohtuuttoman paljon aikaa. Aineiston tuhoamisen tulee silti aina olla tietoinen päätös eikä seurausta puutteellisesta tai huolimattomasta aineistonhallinnasta.

Aiheesta lisää:

Avaa lukutila
viimeksi päivitetty 2014-09-11