Näin Tietoarkisto palvelee arkistoinnissa

Tietoarkisto arkistoi sähköiset tutkimusaineistot FAIR-periaatteiden mukaisesti ja maksutta.

CoreTrustSeal - Core Trustworthy Data Repositories (Avautuu uuteen välilehteen)Tietoarkisto huolehtii luotettavasti sähköisen aineistosi pitkäaikaissäilytyksestä ja avaamisesta. Varmistamme, että aineisto on helposti löydettävissä ja käytettävissä sovittujen ehtojen mukaisesti.

Vastaanotamme sekä kvantitatiivisia että kvalitatiivisia tutkimusaineistoja. Teemme aineistosta jatkokäyttöön sopivan version ja huolehdimme aineiston kuvailemisesta, sopivaan tiedostomuotoon tallentamisesta ja autamme myös aineiston anonymisoinnissa. Säilytämme aineistosi tietoturvallisesti jatkokäyttökuntoisena vuosikymmenestä toiseen. Tietoarkistolla on tutkimusaineistojen luotettavan säilytyksen ja jatkokäytön kansainvälinen CoreTrustSeal (CTS (Avautuu uuteen välilehteen) PDF) -sertifikaatti.

Aineistonhallinnan käsikirja kertoo arkistoinnin hyödyistä ja opastaa selkeästi aineiston käsittelyyn liittyvissä kysymyksissä aineiston elinkaaren eri vaiheissa.

Ohjeita aineiston arkistoijalle

Tietoarkisto vastaanottaa sähköisiä tutkimusaineistoja, jotka ovat jatkokäytettävissä. Katso alta ohjeet arkistointiin liittyvistä käytännön toimenpiteistä ja ehdota aineistoasi arkistoitavaksi.

Ohjeet aineiston arkistoijalle       

Ehdota aineistoasi arkistoitavaksi (Avautuu uuteen välilehteen)

Autamme aineiston anonymisoinnissa

Kiinnitämme Tietoarkistossa erityistä huomiota siihen, että aineistojen avaaminen ei vaaranna tutkittavien tietosuojaa. Pääperiaate on, että tutkija hoitaa anonymisoinnin itse. Tarvittaessa autamme tutkijaa anonymisointisuunnitelman teossa.

Aineistopalvelumme arvioi aina, onko tutkijan toteuttama aineiston anonymisointi riittävä. Siihen tarvitsemme tutkijalta kuvauksen tehdystä anonymisoinnista. Tarvittaessa teemme aineistoon lisää muutoksia tai poistoja. Hyväksytämme muutokset tutkijalla.

Aineistonhallinnan käsikirjassamme on hyviä ja konkreettisia ohjeita anonymisointiin, katso Tunnisteellisuus ja anonymisointi.

Tarkistamme aineistosi huolellisesti

Aineistonkäsittelijämme käyvät arkistoitavan aineiston huolellisesti läpi. Kvantitatiivisen aineiston muuttujat tunnistetaan, yksittäiset muuttujat ja niiden vastaavuus mahdollisen kyselylomakkeen kanssa tarkistetaan. Käymme läpi puuttuvat tiedot, ja lisäämme lopuksi aineistoon mahdollisimmat tarkat kuvaustiedot muuttujien sisällöstä ja niiden saamista arvoista.

Kvalitatiivisten aineistojen kaikki tiedostot avataan ja niiden toimivuus tarkistetaan. Nimeämme dokumentit järjestelmällisesti. Järjestämme tiedostojen taustatiedot yhdenmukaisiksi, ja teemme niistä taustatietohakemiston jatkokäyttäjälle.

Dokumentoimme tarkasti kaikki aineistoon mahdollisesti tehdyt muutokset.

Tallennamme aineistosi jatkokäyttöön sopivaan tiedostomuotoon

Muokkaamme kvantitatiiviset aineistot jatkokäyttöä varten SPSS- ja CSV-formaatteihin, joissa asiakkaamme myös saavat ne Ailasta. Kyselylomakkeet ja muut keruuinstrumentit lisätään Ailaan ensisijaisesti PDF-tiedostoina.

Kvalitatiiviset tekstiaineistot konvertoimme pääsääntöisesti TXT-, ODT- tai PDF-muotoon. Konvertoinnin tarkoituksena on mahdollistaa ohjelmistoista riippumaton aineistojen jatkokäyttö. Keruuinstrumentit tallennamme PDF-muodossa.

Asiakkaille toimitamme aineistot pakattuna zip-tiedostona.

Kuvailemme aineiston DDI-mallin mukaisesti

Tietoarkisto kuvailee arkistoidut aineistot kansainvälisen, erityisesti yhteiskuntatieteellisten aineistojen tarpeisiin suunnitellun DDI-formaatin mukaisesti XML-kielellä.

Jokaisesta aineiston kuvauksesta ilmenee mahdollisimman tarkasti muun muassa:

  • tutkimuksen tekijä(t)
  • tutkimuksen aihepiiri ja sisältö
  • aineiston valinta tai otantamenetelmä
  • aineistonkeruu
  • havaintoyksikkö/aineistoyksikkö
  • käyttöehdot
  • tiedostojen formaatti/formaatit
  • kvantitatiivisten aineistojen muuttujat, muuttujien määrä
  • kyselylomakkeen kysymystekstit
  • kvalitatiivisten aineistojen keskeiset dokumentit (haastattelukysymykset, kirjoituskutsu tms.).

Kuvailemme aineistot sekä sisältö- että muuttujatasolla. Asiasanoitukseen käytetään suomenkielisessä kuvailussa Yleistä suomalaista ontologiaa (Avautuu uuteen välilehteen) (YSO) ja englanninkielisessä kuvailussa ELSST-tesaurusta (Avautuu uuteen välilehteen) . Lisäksi käytämme useita kansallisia ja kansainvälisiä asiasanastoja ja luokituksia esimerkiksi tieteenalan sekä otanta- ja keruumenetelmien dokumentointiin.

Aineistojen yksityiskohtainen kuvaileminen on edellytys sille, että aineistojen pitkäaikaissäilytys ja jatkokäyttö on mahdollista ja aineistot löytyvät helposti. DDI-mallin mukaiset XML-kieliset aineistokuvaukset mahdollistavat tehokkaat haut sekä tietojen koneellisen julkaisun eri muodoissa.

Kansainvälisen kuvailumallin ansiosta aineistojen kuvailutiedot voidaan jakaa helposti myös moniin kansallisiin ja kansainvälisiin yhteisluetteloihin.

Aineistokuvailun DDI-formaatti

Kuvailemme aineistosi myös englanniksi

Teemme arkistoitujen aineistojen sisällönkuvailut aina sekä suomeksi että englanniksi. Tämän ansiosta Tietoarkistoon tallennettu aineisto saa helposti myös kansainvälistä näkyvyyttä.

Suomenkieliset kvantitatiiviset aineistot käännämme vieraskielisille tilaajille pyynnöstä kokonaan englanniksi. Kvalitatiivisia aineistoja emme valitettavasti pysty kääntämään. Kaikki käännöspalvelut ovat maksuttomia sekä aineiston tilaajalle että aineiston alkuperäiselle luovuttajalle.

Julkaisemme aineistosi aineistoluetteloissa

Julkaisemme aineistokuvaukset Ailan aineistoluettelossa, josta ne päätyvät myös esimerkiksi Suomen arkistojen, kirjastojen ja museoiden yhteiseen hakupalveluun Finnaan sekä Etsimeen, joka on Fairdata-palveluiden tuottama tutkimusaineistojen ja niiden metatietojen hakuliittymä.

Eurooppalaisten yhteiskuntatieteellisten tietoarkistojen muodostama tutkimusinfrastruktuuri CESSDA ylläpitää kansainvälistä aineistoluetteloa, josta tutkijat löytävät kätevästi myös Tietoarkistoon tallennetut tutkimusaineistot.

Aineistokuvailut sisältävät kattavasti tietoja aineiston sisällöstä, rakenteesta, keruusta ja käytöstä, muuttujista, kysymyksistä, aineistonkeruussa käytetyistä dokumenteista sekä julkaisuista, joissa aineistoa on hyödynnetty.

Keräämme tietoa julkaisuista, joissa aineistoasi on hyödynnetty

Ailan rekisteröityneet käyttäjät sitoutuvat ilmoittamaan Tietoarkistolle kaikista julkaisuista, joissa he ovat hyödyntäneet Tietoarkistoon tallennettuja aineistoja.

Halutessaan tutkija voi saada meiltä vuosittain raportin julkaisuista, joissa hänen aineistojansa on käytetty. Julkaisut, joissa aineistoa on hyödynnetty, listataan myös Ailaan aineiston kuvauksen yhteyteen.

Annamme aineistolle PIDit

Keväästä 2016 alkaen Tietoarkisto on antanut kaikille arkistoiduille aineistoille pysyvät tunnisteet eli PIDit. Käytämme URN-tunnuksia. Pysyvät tunnisteet takaavat, että aineisto löytyy, vaikka se siirtyisi jostain syystä esimerkiksi uuteen osoitteeseen.

Aineistot saavat pysyvän tunnisteen jo, kun niiden arkistointiprosessi alkaa. Tulevat aineistot -sivulla löydät URN-tunnukset aineistoille, joiden arkistointi on vielä kesken.

Muistutamme aineistoon viittaamisesta

Tietoarkistoon talletettujen aineistojen jatkokäyttäjät sitoutuvat viittaamaan aineistoihin asianmukaisella tavalla.

Tietoarkisto laatii jokaiselle aineistolle myös malliviittauksen, jotta viittaaminen olisi jatkokäyttäjille mahdollisimman helppoa. Malliviittaus julkaistaan aineiston kuvailussa tai vanhempien aineistojen koodikirjassa tai aineisto-oppaassa. Jatkokäyttäjä voi kopioida malliviittauksen lähdeluetteloonsa sellaisenaan tai muokata sitä julkaisun tai tieteenalansa käytäntöjen mukaisesti.