Aineistojen kuvailu tietoarkistossa

Aineistojen jatkokäyttö ja arkistointi on mahdollista vain, jos aineistot on dokumentoitu riittävän tarkasti. On tiedettävä, mikä on aineiston sisältö ja kattavuus sekä miten aineisto on kerätty. Ilman dokumentaatiota, metadataa, yhteiskuntatieteellinenkin tutkimusaineisto merkityksetön kokoelma yksittäisiä tiedostoja tai numeroita.

Tietoarkiston aineistokuvaukset perustuvat ensisijaisesti siihen informaatioon, jonka aineiston luovuttaja toimittaa tietoarkistolle (ks. aineistonkuvauslomake). Kuvausta täydennetään aineistojen arkistointiprosessin aikana esiin tulleilla tiedoilla.

Aineistonhallinnan käsikirja ohjeistaa tutkijaa dokumentoimaan aineistot tutkimusprojektin aikana.

Kuvailuformaattina DDI

Tietoarkistoon arkistoidut aineistot kuvaillaan kansainvälisen kvantitatiivisten tutkimusaineistojen kuvailuun kehitetyn DDI-formaatin mukaisesti XML-kielellä. Jokaisesta aineistosta kuvaillaan mahdollisimman tarkasti mm.

  • tutkimuksen tekijä(t)
  • tutkimuksen aihepiiri ja sisältö
  • aineiston valinta tai otantamenetelmä
  • aineistonkeruu
  • havaintoyksikkö/aineistoyksikkö
  • käyttöehdot
  • tiedostojen formaatti/formaatit
  • kvantitatiivisten aineistojen muuttujat, muuttujien määrä sekä
  • kyselylomakkeen kysymystekstit
  • kvalitatiivisten aineistojen keskeiset dokumentit (haastattelukysymykset, kirjoituskehoitus tms.)

Aineistot kuvaillaan yksityiskohtaisesti, jotta niiden pitkäaikaissäilytys ja jatkokäyttö olisi mahdollista ja jotta sopiva aineisto löytyisi helposti. DDI:n mukaiset XML-kieliset rakenteiset aineistokuvaukset mahdollistavat tehokkaat haut sekä tietojen julkaisun eri muodoissa koneellisesti.

Tietoarkisto tuottaakin aineistoluettelon lisäksi jokaisesta arkistoidusta aineistosta pdf-muotoisen koodikirjan. Myös Tietoarkiston tuottamat DDI-formaatin mukaiset XML-tiedostot ovat saatavilla.

» Lisätietoa DDI:stä.

Sisällön kuvailu

Kuvaus sisältää tiedot tutkimuksen tekijöistä, otannasta, aineistonkeruusta, aineistoon liittyvistä julkaisuista ja aineiston saatavuudesta. Jokaisesta aineistosta tehdään myös lyhyt suorasanainen sisällön kuvaus (abstrakti). Asiasanoitukseen käytetään suomenkielisessä kuvailussa Yleistä suomalaista asiasanastoa (YSA) ja englanninkielisessä kuvailussa ELSST-tesaurusta. Aineistot luokitellaan lisäksi tietoarkiston oman tieteenalaluokituksen ja eurooppalaisten arkistojen yhteisen aihepiiriluokituksen mukaan. Kuvailuun liitetään myös aineistonkeruussa käytetyt instrumentit, esimerkiksi haastattelukysymykset tai kyselylomake.

Kuvauksiin sisältyy aina aineiston malliviittaus, jonka tutkija voi kopioida julkaisunsa lähdeluetteloon.

Muuttujien kuvailu

Tietoarkisto tuottaa kvantitatiivisista aineistoista DDI-formaatin mukaisia muuttujatason kuvauksia. Koodikirja sisältää muun muassa muuttujien nimet, selitteet, muuttujien saamat arvot ja suorat jakaumat. Kysely- tai haastattelulomake on koodikirjan liitteenä. Nesstar-luettelossa haun voi kohdistaa esimerkiksi kysymysteksteihin tai vastausvaihtoehtoihin.

» Haku arkistoiduista aineistoista

Eurooppalainen yhteisluettelo

Eurooppalaiset tietoarkistot käyttävät DDI:tä aineistojen kuvailuun. Niiden yhteisestä CESSDA-portaalista voi hakea eri maiden arkistojen luetteloista samalla kertaa. Portaali perustuu DDI-kuvailuihin ja Nesstar-teknologiaan.

viimeksi päivitetty 2011-05-25