Tietoarkisto 2015

Aineistoportaalit | Laajeneminen | Laadulliset aineistot | Tutkimus | Koulutus

Hanke koostui viidestä osiosta. Paperimuotoinen aineistontilausjärjestelmä korvattiin portaalilla, jossa rekisteröityneet käyttäjät voivat ladata aineistoja suoraan verkosta. Aineistopalvelua suunnattiin uusille tieteenaloille kuten terveys- ja kasvatustieteisiin, psykologiaan, kulttuurin ja historian tutkimukseen. Monimutkaisten aineistojen pitkäaikaissäilytys ja jatkokäyttö, sähköisten aineistojen elinkaaren kustannusmallien, pitkäaikaissäilytyksen standardien ja data-arkistoinnin laatujärjestelmien tutkimus olivat myös hankkeen kehityskohteita. Tiedeyhteisön jäsenille tarjottiin tukea ja tietoa heidän aineistonhallintataitojensa vahvistamiseksi.

Rahoituksen hakuvaiheessa hankkeesta käytettiin suomeksi nimeä Tietoarkiston uudet palvelut ja englanniksi FSD Upgrade.

Hanketta rahoitti Suomen Akatemia tutkimuksen infrastruktuureille suunnatusta FIRI 2010 -rahoituksesta.
Rahoituskausi: 9.12.2010–31.7.2015.

Aineistoportaalit

Ennen hanketta Tietoarkiston aineistot tilattiin paperilomakkeella ja toimitettiin asiakkaalle prosessissa, joka oli oleellisesti käsityötä. Aineistojen kuvailutiedot olivat Tietoarkiston www-sivuilla.

Hankkeessa luotiin palveluportaali Aila, jonka avulla voi etsiä aineistoja, tutustua niiden kuvailutietoihin ja ladata niitä tutkimukseen ja opetukseen. Asiakkaalle portaali tarjoaa aiempaa helpomman ja nopeamman tavan löytää ja tilata aineistoja. Tietoarkistossa puolestaan aineiston luovutuksesta vapautui resursseja vaativampiin asiakaspalvelutehtäviin.

Käyttäjätunnistuksen osalta Aila-portaali tukeutuu HAKA-käyttäjätunnistusjärjestelmään. HAKA tarjoaa helpon ja käyttäjäystävällisen käyttäjätunnistusjärjestelmän. Lähes kaikki suomalaiset korkeakoulut ovat HAKA-järjestelmän piirissä. Muualta tuleville asiakkaille tarjotaan vaihtoehtoinen käyttäjätunnistusjärjestelmä.

Ailan lisäksi hankkeessa luotiin pitkittäisaineistoille oma demoportaali, joka huomioi pitkittäisaineistojen erityispiirteet.

Hankkeessa kehitetyn www-palveluinfrastruktuurin avulla myös muiden verkkopalveluiden luominen helpottui.

Lisätietoa: Matti Heinonen

Uudet tieteenalat palvelujen piiriin

Tietoarkiston asiakaskuntaa ja aineistovarantoa alettiin hankkeen aikana laajentaa. Painopisteenä eivät ole enää vain yhteiskuntatieteet. Arkistointipalveluja tarjotaan tieteenalasta riippumatta tutkijoille ja tutkimusryhmille, jos

  • aineistot ovat dokumentoitavissa tutkimusaineistojen kuvailuun kehitetyllä kansainvälisellä DDI-metadataformaatilla (esittely Aineistonhallinnan käsikirjassa: aineistojen kuvailu)
  • aineistot ovat muun tiedeyhteisön käytettävissä alkuperäisten tutkimusten valmistuttua ja
  • aineistojen tietosisältö on riittävän selkeässä järjestyksessä ja sitä kuvaileva muu materiaali on riittävä jatkokäyttöön tarkoitetun aineiston käyttöversion prosessoimiseksi ja metadatan luomiseksi.

Hankkeen aikana Tietoarkiston palveluista tiedotettiin Suomen Akatemian kulttuurin ja yhteiskunnan tutkimuksen toimikunnan myönteisen rahoituspäätöksen saaneiden tutkimusten johtajille. Lisäksi käytiin läpi kaikkien Suomen yliopistojen ja korkeakoulujen väitöstutkimuksia koskevat tiedot alkaen vuodesta 2012. Heistä valittiin tutkijat, joiden väitösaineisto soveltuisi arkistoitavaksi Tietoarkistoon. Tutkijoille toimitettiin lyhyt kirje, jossa tiedusteltiin aineistoa ja kerrottiin Tietoarkiston palveluista.

Lisätietoa: Arja Kuula-Luumi

Laadullisen aineiston käytettävyyden helpottaminen

Tietoarkistossa on tehty eurooppalaisittain merkittävästi työtä laadullisten aineistojen arkistoinnissa, mutta suunnitelmalliseen kehitystyöhön ei ennen Tietoarkisto 2015 -hanketta ollut resursseja. Pitkäaikaisia toiveita ja suunnitelmia laadullisten aineistojen arkistoinnissa ryhdyttiin toteuttamaan välittömästi hankkeen alusta alkaen.

Yksi laadullinen aineisto voi sisältää kymmeniä tai jopa satoja erillisiä tiedostoja. Jotta arkistoaineiston selailu ja analysoitavien yksikköjen valinta sujuisi helpommin, hankkeessa luotiin automatisoitu datan käsittelyn prosessi, jossa tekstiaineistoista tuotetaan HTML-esitysversio. Esitysversioiden avulla voi hahmottaa aineiston kokonaisuuden jäsentyneesti. Hakemistonäkymän (FSD2510 ja FSD2607) otsikoita näpäyttämällä voi säätää yksiköiden järjestystä ja tarkistaa aineistoyksiköiden määrän taustatietojen mukaan. Lisäksi voi lukea valitsemaansa aineistoyksikköä html-muodossa.

Aineistojen html-esitysversiot

  • yhtenäistävät ja virtaviivaistavat laadullisia aineistoja
  • helpottavat kulkua ja navigointia aineistoon kuuluvien tiedostojen välillä
  • mahdollistavat aineistokokonaisuuden hahmottamisen entistä helpommin ja
  • parantavat aineiston tiedostojen löydettävyyttä.

Hankkeen tavoitteena oli ohjelmisto, jonka avulla esimerkiksi ääntä, tekstiä ja kuvaa sisältävästä aineistosta voi tuottaa helppokäyttöisiä kokonaisuuksia.

Laadullisen tekstiaineiston prosessointi html-tiedostoiksi on palvelu, jota Tietoarkisto tarjosi jo ennen hankettakin meneillään oleville tutkimuksille, mikäli tutkijat sitoutuivat aineistojensa arkistointiin tutkimustensa päättyä.

Olennainen osa laadullisten aineistojen käytettävyyden edistämistä on kuvailustandardityö. Sitä tehdään kansainvälisessä yhteistyössä DDI-allianssin työryhmässä. DDI-allianssin työryhmässä laaditaan yhteinen tietomalli ja käsitteistö. Tavoite on yhtenäistää käytettyjä termejä, selkiyttää niiden merkityksiä ja tarjota mallia, jota voi käyttää laadullisten aineistojen hahmottamiseen ja jäsentämiseen tietokoneella.

Kuvailun parissa Tietoarkisto tekee yhteistyötä myös Suomessa useiden muistiorganisaatioiden ja verkostojen kanssa. Hankkeen aikana aineistoyhteistyötä tehtiin konkreettisimmin SKSn Kansanrunousarkiston kanssa. Yksi tavoite oli tutkia ja vertailla yhteiskuntatieteiden ja kulttuurintutkimuksen kuvailu- eli metatietokäytäntöjä.

Lisätietoa: Arja Kuula-Luumi

Tutkimus ja arviointi

Hankkeen tutkimuskohteena olivat pitkittäisaineistojen metadata sekä sähköisten tutkimusaineistojen hallinnan ja pitkäaikaissäilyttämisen kustannukset. Lisäksi hankkeessa arvioitiin Tietoarkiston pitkäaikaissäilytyksen luotettavuutta.

Hankkeessa perehdyttiin yksittäisiä survey-aineistoja monimutkaisempien aineistojen metadataan. Tavoitteena oli parantaa aineistojen dokumentointia ja sitä kautta hallintaa ja käytettävyyttä sekä varmistaa aineistojen tietosisällön ymmärrettävyyden säilyminen pitkällä aikavälillä.

Sähköisten tutkimusaineistojen pitkäaikaissäilytys vaatii resursseja. Hankkeessa tarkasteltiin aineistojen arkistoinnin kustannuksia ja niiden jakautumista aineiston elinkaaren eri vaiheissa. Tavoitteena oli selvittää, miten tutkimusaineistojen pitkäaikaissäilytys voidaan järjestää mahdollisimman kustannustehokkaasti. Erityisesti keskityttiin metadatan tuottamisen kustannuksiin.

Luotettava sähköinen arkisto toimii mahdollisimman läpinäkyvästi, noudattaa soveltuvia standardeja ja parhaita käytäntöjä sekä ymmärtää toimintaansa liittyvät uhat ja riskit. Hankkeessa tutkittiin Tietoarkiston käytäntöjä Open Archival Information System (OAIS) -standardia vasten. Tieto käytäntöjen sijoittumisesta OAIS-viitekehykseen helpotti käytäntöjen vertailua ja yhteensovittamista muiden sähköisiä aineistoja pitkäaikaissäilyttävien kotimaisten ja kansainvälisten organisaatioiden kanssa. Tietoarkiston toiminnan luotettavuutta arvioitiin OAIS-standardiin perustuvan Trustworthy Digital Repositories Audit & Certification: Criteria and Checklist (TDR) -tarkistuslistan avulla. Tietoarkisto teki arvioinnin itse. Tuloksia esiteltiin IASSIST-konferenssissa kesäkuussa 2012 ja Informaatiotutkimuksen päivillä marraskuussa 2012.

Lisätietoa: Mari Kleemola

Aineistonhallinnan osaamisen vahvistaminen

Tutkimusaineistojen valmistaminen arkistointikelpoiseksi on työlästä, jos aineiston jatkokäyttöä ei ole otettu huomioon jo tutkimuksen suunnitteluvaiheessa. Yliopistojen peruskoulutuksessa ja tutkijakoulutuksessa on kuitenkin harvoin tarjolla aineistonhallinnan oppimateriaaleja ja koulutusta.

Hankkeessa tuotettiin lisää sisältöjä ja täsmennettiin aineistonhallintaan keskittyvää kaikille avointa Aineistonhallinnan käsikirjaa. Käsikirjan ulkoasu uusittiin.

Tietoarkisto tarjosi hankkeen aikana yliopistoille ja korkeakouluille koulutusta aineistonhallinnasta. Koulutuksen sisältö koostui seuraavista asioista:

  • tieteen avoimuuden perusperiaatteet
  • rahoittajien ja julkaisujen datapolitiikat
  • tutkimuskulttuurin merkitys aineistojen avoimuudessa
  • tutkimusaineistojen tekijänoikeudet
  • tutkimusetiikka ja tietosuoja
  • aineistojen kuvailu
  • kvantitatiivisen datan käsittely
  • kvalitatiivisen datan käsittely
  • tallenneformaatit ja tietoturva
  • tietoarkiston palvelut ja aineistot.

Koulutuksen sisältö ja laajuus (1–4 tuntia) räätälöitiin tilaajan toiveen ja yleisön mukaan joko perusopiskelijoille, tutkijakouluille tai tiedeyhteisöille sopiviksi.