Miksi tiedonhallintaa ja jatkokäyttöä?
Tutkimusaineistojen tiedonhallinnalla tarkoitetaan sitä, että tutkimusaineistot (data) ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että aineiston säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu aineiston koko elinkaaren ajan.
Jatkokäytöllä tarkoitetaan toisten kokoaman, johonkin muuhun tarkoitukseen kerätyn aineiston hyödyntämistä. Jatkokäytössä käytetään usein myös erilaisia menetelmiä kuin mitä alkuperäiset tutkijat ovat käyttäneet. Jatkokäyttöön viitataan usein myös termillä sekundaarianalyysi.
Osa hyvää tieteellistä käytäntöä
Yksi tieteellisen tutkimuksen luotettavuuden edellytys on, että tutkimus on suoritettu hyvän tieteellisen käytännön edellyttämällä tavalla. Tutkimusaineistot ovat keskeinen osa tutkimusprosessia ja tutkimushanketta.
Tutkimuseettisen neuvottelukunnan ohjeiden mukaan hyvään tieteelliseen käytäntöön kuuluu muun muassa eettisesti kestävien tiedonhankintamenetelmien käyttö ja se, että tutkimusryhmän jäsenten asema, oikeudet, osuus tekijyydestä, vastuut ja velvollisuudet sekä tutkimustulosten omistajuutta ja aineistojen säilyttämistä koskevat kysymykset määritellään ja kirjataan kaikkien osapuolten hyväksymällä tavalla jo tutkimusprojektin alussa.
Suomen Akatemia puolestaan edellyttää, että rahoitushakemuksen liitteenä olevassa tutkimussuunnitelmassa kuvataan tutkimusmenetelmät ja tutkimusaineistojen aineistonhallintasuunnitelma (aiemmin tiedonhallintasuunnitelma). Suunnitelmassa kerrotaan, miten tutkimuksessa käytettävät aineistot hankitaan, miten aineistoja käytetään ja säilytetään ja miten mahdollistetaan aineistojen käyttö tutkimuksen päätyttyä.
Tutkimusaineiston elinkaari
Tutkimusaineiston elinkaari on tavallisesti pidempi kuin aineiston tuottaneen tutkimushankkeen elinkaari. Hanke päättyy, kun rahoitus loppuu, mutta aineistoa voi ja kannattaa hyödyntää myöhemminkin.
Tutkimusaineiston elinkaari. Suurempi kuva ja lista eri elinkaarimalleista.
Kuvassa on esitetty tutkimusaineiston elinkaaren eri vaiheet. Tutkimushanke luovuttaa keräämänsä aineiston arkistoitavaksi ja jatkokäyttöön hankkeen päätyttyä. Tutkimusaineistoa käsitellään ja dokumentoidaan sekä tutkimusprojektin aikana että arkistointivaiheessa. Päällekkäiseltä työltä ja informaation katoamiselta vältytään, kun tutkimusaineiston elinkaaren eri vaiheet suunnitellaan jo tutkimussuunnitelmaa laadittaessa.
Esimerkiksi tutkimusaineistoa kuvaileva metadata on helpointa ja kustannustehokkainta tallentaa vaiheittain aineiston elinkaaren aikana. Puutteellisen metadatan täydentäminen ja korjaaminen vuosia aineistonkeruun jälkeen ei ole välttämättä edes mahdollista tai ainakin maksaa monikymmenkertaisesti sen, mitä maksaisi metadatan tuottaminen aineiston elinkaaren alkuvaiheissa.
Jatkokäytön ja avoimen saatavuuden hyödyt
Tieteen kehityksen ja tutkimuksen johtopäätösten tieteellisten luotettavuuden arvioimiseksi on välttämätöntä, että julkaisuissa käytetyt tutkimusaineistot ovat saatavilla tiedeyhteisön käyttöön. Aineistojen mahdollisimman laaja ja avoin saatavuus tukee myös tutkimuksen innovatiivisuutta ja verkostoitumista, lisää tutkimusorganisaatioiden ja tutkijoiden tunnettuutta ja mahdollistaa eri tieteenalojen tuottamien aineistojen monipuolisen käytön. OECD:n datasuosituksen mukaan julkisrahoitteisen tutkimusdatan avoin saatavuus on olennainen edellytys myös tulokselliselle kansainväliselle yhteistyölle.
Arkistoidut aineistot mahdollistavat ajalliset vertailut, ja ennen koottujen tutkimusaineistojen valossa voi tarkastella monipuolisia ja vaihtoehtoisia tutkimusongelmia. Lisäksi aineistojen saatavuus voi edistää tutkimusmenetelmien kehittämistä. Kehittyvät menetelmät, ohjelmistot ja teknologia tarjoavat puolestaan uusia mahdollisuuksia tutkimukseen. Arkistoiduista aineistoista on hyötyä myös opetuksessa ja opiskelussa.
Aineistojen jatkokäyttö on taloudellista ja säästää rajallisia resursseja. Aikaa ja rahaa ei tarvita uuden materiaalin keräämiseen, jos sopiva aineisto on jo saatavilla. Lisäksi laajat kysely- ja haastatteluaineistot sisältävät usein täysin analysoimatonta materiaalia. Jo olemassa olevien aineistojen käytöllä voidaan myös välttää päällekkäiset tiedonkeruut.
Arvokkaista tutkimusaineistoista ei ole tutkimusyhteisölle ja tulevaisuudessa tehtävälle tutkimukselle hyötyä, jos tiedot aineistoista ovat ensisijaisesti alkuperäisten tutkijoiden mielissä ja häviävät sitä mukaa, kun kyseiset henkilöt siirtyvät muihin tehtäviin tai eläkkeelle.
Aiheesta lisää:
- Suomen Akatemian hakuohjeet
- Hyvä tieteellinen käytäntö ja sen loukkausten käsitteleminen. Helsinki: Tutkimuseettinen neuvottelukunta, 2002.h
- Borg, Sami & Arja Kuula (2007). Julkisrahoitteisen tutkimusdatan avoin saatavuus ja elinkaari. Valmisteluraportti OECD:n datasuosituksen toimeenpanomahdollisuuksista Suomessa. Tampere: Tampereen yliopisto. Yhteiskuntatieteellisen tietoarkiston julkaisuja; 6.h
- Nuorteva, Jussi (2008). Tiedonhallintasuunnitelma tehostaa tutkimusdatan käyttöä. Tieteessä tapahtuu 8/2008, 36-40.h
- Tieto käyttöön. Tiekartta tutkimuksen sähköisten tietoaineistojen hyödyntämiseksi. Opetus- ja kulttuuriministeriön julkaisuja 2011:4.h
- Helsingin yliopiston kirjaston opas tutkimusaineistojen tiedonhallintaanh
- Beagrie Neil, Julia Chruszcz & Brian Lavoie (2008). Keeping research data safe. A cost model and guidance for UK universities.h
- Ruusalepp, R. & Pryor, G. (2008). Infrastructure Planning and Data Curation. A comparative study of international approaches to enabling the sharing of research data.h
- OECD Principles and Guidelines for Access to Research Data from Public Funding (2007). OECD:n datasuositus.h
- The Preservation Management of Digital Material Handbook. Digital Preservation Coalition.h
- Curation Reference Manual. The Digital Curation Centre.
- Inter-university Consortium for Political and Social Research (2009). Principles and Good Practice for Preserving Data. International Household Survey Network, IHSN Working Paper No 003, December 2009.h
- Erilaisia sähköisten aineistojen elinkaarimalleja
