Aineistojen arkistointi
Arkistoinnin edut | Tekijän- ja omistusoikeudet | Minkälaisia aineistoja arkistoidaan? | Arkistoinnin edellytykset| Käytännön toimenpiteet | Arkistoinnin termit | Tietoarkiston arkistointiprosessi | Usein kysytyt kysymykset | Ehdota aineistoa arkistoitavaksi
Arkistoinnin edut
Tietoarkisto tarjoaa toimivan ratkaisun tutkimusaineistojen arkistointiin ja niitä koskeviin tietopalveluihin. Viisi yleistä perustetta aineistojen arkistoinnille ovat resurssit, kulttuuri, tutkimus, lainsäädäntö ja tietoteknologia. Käytännössä tutkimusaineistojen arkistointi hyödyttää yksittäistä tutkijaa ja koko tiedeyhteisöä, sillä
- tutkimusaineistojen saatavuus edistää tieteen avoimuutta,
- aineistojen yhteinen käyttömahdollisuus edistää tieteellistä keskustelua
- useat aineistot sisältävät runsaasti vähälle huomiolle jäänyttä tai täysin analysoimatonta materiaalia,
- aineistojen uudiskäyttö tehostaa tutkimusrahoituksen käyttöä,
- uusia tutkimusongelmia on mahdollista tarkastella ennen koottujen tutkimusaineistojen valossa,
- tietoarkisto säilyttää tutkimusaineiston käyttökuntoisena ja
- tietoarkisto huolehtii aineistojen vaatimista tietosuoja- ja tietoturvallisuustoimenpiteistä.
Suomen Akatemian hakuohjeissa suositellaan yhteiskuntatieteellisten aineistojen luovuttamista Yhteiskuntatieteelliseen tietoarkistoon. Lisäksi Akatemia edellyttää, että tutkimussuunnitelma sisältää aineistonhallintasuunnitelman. Tutkimusaineistojen tiedonhallinnan käsikirja opastaa aineistonhallintasuunnitelman tekemiseen ja sähköisen tutkimusaineiston hallintaan sen elinkaaren eri vaiheissa.
Tekijän- ja omistusoikeudet
Aineistojen tekijän- tai omistusoikeudet eivät yleensä muutu arkistoinnin myötä. Luovuttajat voivat asettaa aineistoilleen erilaisia käyttöehtoja, ja uudiskäyttäjät puolestaan sitoutuvat noudattamaan luovuttajan ja tietoarkiston asettamia käyttöehtoja. Aineistoja annetaan tietoarkistosta vain tieteelliseen tutkimus- ja opetuskäyttöön, ei kaupallisiin tarkoituksiin. Ks. myös tutkimusaineistojen tiedonhallinnan käsikirjan artikkeli tutkimusaineistojen tekijänoikeuksista.
Minkälaisia aineistoja arkistoidaan?
Tietoarkisto vastaanottaa sähköisiä tutkimusaineistoja, joilla voidaan arvioida olevan riittävää jatkokäyttöarvoa tieteellisessä tutkimuksessa ja opetuksessa. Aineistot voivat olla sekä kvantitatiivisia eli numeerisia tai kvalitatiivisia eli puhetta, kuvaa tai tekstiä. Tutkimusaineiston arkistointia kannattaa harkita, kun yksikin alla olevista edellytyksistä täyttyy:
- aineistoa voi käyttää muiden aineistojen ajallisena tai sisällöllisenä vertailukohteena
- aineistoa voidaan käyttää muiden aineistojen rinnalla täydentävänä aineistona
- aineistosta on jäänyt osa analysoimatta
- aineistoa voidaan hyödyntää alkuperäisestä poikkeavalla tavalla (uudet kysymyksenasettelut / metodiset painopisteet)
- tieteellinen julkaisu edellyttää aineiston olevan tiedeyhteisön saatavilla ennen artikkelin julkaisemista
Tutkimusaineisto voidaan joko arkistoida tietoarkistoon tai pelkästään kuvailla aineistotietokantaan ilman, että itse aineistoa arkistoidaan. Jälkimmäisessä tapauksessa aineiston haltijan on huolehdittava ja sovittava suoraan jatkokäyttäjän kanssa aineiston luovuttamiseen liittyvistä käytännön kysymyksistä (mm. kopiointi, käyttöehdot ja toimitus). Tietoarkistoon arkistoitavien aineistojen prosessoinnista, aineistoja koskevien käyttölupahakemusten ja käyttöehtositoumusten käsittelystä ja aineiston käyttöversiokopioiden toimittamisesta huolehtii tietoarkisto.
Arkistoinnin edellytykset
Jotta aineisto voidaan arkistoida, edellytetään, että
- siihen liittyvät omistus- ja hallintasuhteet ovat riittävän selkeät,
- aineistoa koskeva lainsäädäntö, esimerkiksi henkilötietojen käsittelyä koskeva lainsäädäntö, ei estä arkistointia,
- alkuperäinen tiedonkeruun käyttötarkoitus ei estä aineiston arkistointia ja
- aineisto on muutoinkin tietosisällöltään ja teknisiltä ominaisuuksiltaan arkistointikelpoinen.
Tietoarkisto voi tietyin edellytyksin vastaanottaa myös tunnistetietoja sisältäviä tutkimusaineistoja; tällöin tietoarkisto anonymisoi aineiston pysyvää säilyttämistä varten luovuttajan toimeksiannosta (ks. henkilötietoja sisältävien aineistojen säilyttäminen ja hävittäminen). Harkinnanvaraisesti arkistoitavaksi voidaan ottaa myös paperimuodossa olevia kuva- ja tekstiaineistoja, jos ne arvioidaan tutkimuksellisesti arvokkaiksi ja niiden muuntaminen sähköiseen muotoon voidaan toteuttaa kohtuukustannuksin.
Käytännön toimenpiteet
Aineiston arkistointia harkitsevan kannattaa aina ottaa ensin yhteyttä tietoarkistoon. Tietoarkiston henkilökunta auttaa mielellään kaikissa arkistointiin liityvissä kysymyksissä.
Aineistoa arkistoitaessa täytetään seuraavat kaksi lomaketta:
- Aineistonkuvauslomake (kvantitatiiviset aineistot (PDF) tai kvalitatiiviset aineistot (PDF))
- Arkistointisopimus (PDF)
Lomakkeet ovat saatavilla muissa tiedostoformaateissa erillisellä lomakesivulla.
Lomakkeet toimitetaan tietoarkistoon yhdessä datan ja sen keruuta kuvaavan oheismateriaalin (esim. kyselylomake, koodausohjeet, haastattelukysymykset, kirjoitusohjeet jne.) kanssa. Oheismateriaalin voi toimittaa paperidokumentteina ja/tai sähköisessä muodossa.
Aineistonkuvauslomakkeen täyttäminen
Datatiedoston/-tiedostojen tekninen ja sisällöllinen
kuvaus edellyttää aineistonkuvauslomakkeen huolellista täyttämistä. Riittävän tarkka dokumentointi on paras
tae aineistojen käyttökelpoisuuden säilymiselle. Aineiston sisällön ja keruun kuvauksen lisäksi lomakkeessa
tiedustellaan keskeisiä tietoja aineiston keränneestä tutkimushankkeesta ja aineistosta jo tuotetuista
julkaisuista. Aineistonkuvauslomakkeen sijasta luovuttaja voi toimittaa tietoarkistoon
tutkimusraportin tai kopion tutkimusraportin osasta, jossa kuvataan aineistonkeruu ja aineiston
sisältö.
Datatiedostot ja tallennusmuoto
Datatiedostoilla tarkoitetaan tässä sähköiseen muotoon
tallennettua aineistoa. Kvantitatiivinen aineisto on yleensä havaintomatriisi, joka on tallennettu joko
ASCII-muodossa tai jonkin tilastomatemaattisen sovellusohjelman formaatissa (esim. SPSS). Kvalitatiivinen
aineisto koostuu usein erillisistä aineistoyksiköistä (esim. erikseen kaikki haastattelut ja niitä koskevat
muistiinpanot), jotka on tallennettu esim. Word-tiedostoina. Luovuttaja voi luovuttaa datatiedostot
tietoarkistolle muuttamatta tallennusmuotoa ja -välinettä.
Aineiston siirtäminen tietoarkistoon
Useimmissa tapauksissa aineistoon liittyvän datatiedoston
voi luovuttaa arkistoon sähköpostin liitetiedostona. Jos tiedosto on suuri tai aineisto sisältää
arkaluonteisia tietoja, kannattaa neuvotella tietoarkiston kanssa sopivasta siirtotavasta. Toimittaminen voi
tapahtua esimerkiksi tiedostonsiirto-ohjelmalla tai postitse CD-rom-levykkeelle tallennettuna.
Oheismateriaalit voi toimittaa esimerkiksi sähkäpostin liitteenä, tiedostonsiirtona tai postitse.
Tietosisällöltään arkaluonteisten aineistojen luovutustavoista tulee aina neuvotella tietoarkiston kanssa, jotta voidaan sopia siirron toteuttamisesta ja sen edellyttämistä tietoturvallisuustoimenpiteistä.
Arkistoinnin termit
Arkistointisopimuksessa käytettyjä termejä on selitetty erillisellä arkistoinnin termit -sivulla.
Tietoarkiston arkistointiprosessi
Arkistoitava aineisto käydään läpi huolellisesti. Kvantitatiivisen aineiston muuttujat tunnistetaan, yksittäiset muuttujat ja niiden vastaavuus mahdollisen kyselylomakkeen kanssa tarkistetaan, filtterimuuttujien toimivuus sekä puuttuvat tiedot käydään läpi ja lopuksi dataan lisätään mahdollisimman tarkat kuvaustiedot muuttujien sisällöstä ja niiden saamista arvoista. Lisäksi aineistosta yleensä poistetaan tutkijan itse luomat muuttujat niin, että arkistoidussa aineistossa mukana ovat vain kyselylomakkeeseen suoraan liittyvät muuttujat. Tietoarkistossa käytetään aineistojen tarkistamisessa ja muokkaamisessa pääasiassa SPSS-ohjelmaa, ja kaikki aineistoon mahdollisesti tehtävät muutokset dokumentoidaan tarkasti.
Kvalitatiivisten aineistojen prosessoinnissa tekstiaineisto konvertoidaan rtf-muotoon ja paperiaineistot harkinnanvaraisesti pdf-muotoon. Konvertoinnin tarkoituksena on mahdollistaa ohjelmistoista riippumaton aineistojen jatkokäyttö. Lisäksi tarkistetaan aineiston sisäisen metadatan (tiedostojen nimet, aineistoyksikköjen bibliografiset tiedot) konsistenssi.
Arkistoinnissa kiinnitetään erityistä huomiota tietosuojaongelmiin. Tarvittaessa aineisto anonymisoidaan. Se tapahtuu joko tarkistamalla alkuperäisen tutkijan jo tekemä anonymisointi tai suorittamalla aineiston prosessoinnin yhteydessä anonymisointi arkiston toimesta (peruste HetiL 8 § 7 mom.). Anonymisoinnin taso määräytyy siitä, mikä on ollut tutkittaville annettu alkuperäinen tutkimuksen käyttöinformaatio tai kirjallisen tutkimussuostumuksen sisältö (peruste HetiL 7 §).
Kun alkuperäisestä aineistosta on prosessoitu arkistoversio, aineisto kuvaillaan ja aineiston sisältöä keskeisesti kuvaavat dokumentit (esim. haastattelukysymykset, kirjoituskehoitus, kyselylomake) tallennetaan sähköisessä muodossa. Kuvailu ja aineistoa kuvaavat dokumentit siirretään tietoarkiston tietokantoihin, joista generoidaan erilaiset aineistoluettelot.
Usein kysytyt kysymykset
Ehdota aineistoa arkistoitavaksi
Oletko itse kerännyt tutkimusaineiston tai tiedätkö jonkin aineiston, joka tulisi arkistoida tietoarkistoon? Voit ehdottaa aineistoa arkistoitavaksi joko soittamalla puh. +358 40 190 1432, lähettämällä sähköpostia osoitteeseen fsd [at] uta.fi tai täyttämällä nettilomakkeen.
Tietoarkiston henkilökunta auttaa mielellään kaikissa aineiston luovutukseen liittyvissä kysymyksissä.