FSD Bulletin

Numero 30 (2/2010)
17.6.2010

ISSN 1795-5254

etusivu
uusimmat aineistot
aikaisemmat lehdet
toimitus

» uusin lehti

Tietoarkisto on FSD:n verkkotiedotuslehti, jonka syksyn erikoisnumero ilmestyy myös painettuna. Lehdessä on artikkeleita ja uutisia tutkimus- ja arkistotoiminnan eri alueilta. Tietoarkiston ilmestymisestä tiedotetaan sähköpostilistallamme. Painetun Tietoarkisto-lehden voi tilata maksutta osoitteesta fsd@uta.fi.


FSD

Yhteiskuntatieteellinen
tietoarkisto
puh. 040 190 1432
faksi (03) 343 9088
s-posti: fsd@uta.fi


Tietoarkisto toimii OAIS-viitemallin mukaan

Teksti: Mari Kleemola | Kuvio: Tuomas J. Alaterä

Open Archival Information System, OAIS, on viitemalli sähköisen aineiston pitkäaikaissäilytysarkistolle. Malli hahmottaa säilyttämisen toiminnot ja osapuolet sekä velvoitteet yleisellä tasolla. OAIS on ISO-standardi (ISO 14721:2003). Standardin suomalainen versio Viitemalli pitkäaikaissäilytysarkistolle (SFS 5972) ilmestyi maaliskuussa 2010. Yhteiskuntatieteellinen tietoarkisto teki oman arkistointi- ja ulosluovutusprosessinsa arvioinnin alkuvuodesta. Toiminta täyttää mallin velvoitteet, mutta parannettavaa ja haasteitakin on. Artikkeli perustuu tietoarkiston tietopalvelupäällikön Mari Kleemolan laatimaan sisäiseen muistioon.

Alun perin satelliittikuvien tallentamista varten kehitetystä OAIS-mallista on nopeasti tullut kulmakivi kaikkien sähköisten aineistojen arkistoinnille. Suomessa siihen perustuvat muun muassa arkistolaitoksen VAPA-hanke ja Kansallinen Digitaalinen Kirjasto -hankkeen pitkäaikaissäilytysratkaisu. Myös tietoarkistojen uusi eurooppalainen tutkimusinfrastruktuuri Cessda-ERIC tukeutuu OAIS-malliin.

OAIS-yhteensopivan organisaation on tuettava standardin tietomallia ja hoidettava standardissa määritellyt velvoitteet. Tietoarkisto on peilannut omia toimintojaan OAIS-standardiin sekä tarkastellakseen prosessiensa toimivuutta että parantaakseen kansallisen ja kansainvälisen yhteistyön edellytyksiä.

Tietoarkisto ja OAIS-tietomalli

Varsinaista säilyttämisen kohdetta kutsutaan OAIS-mallissa sisällöksi (Content Information). Sisältö on luonteeltaan tieto-objekti (Information Object). Tieto-objekti on OAIS-standardin peruskäsite. Jokainen tieto-objekti koostuu aina dataobjektista ja siihen liittyvästä esitystiedosta.

Kun sisältö ja siihen liittyvä säilytystieto kootaan yhteen paketointitiedon avulla, saadaan tietopaketti. Tietopaketteja on kolmenlaisia:

  • luovutuspaketti (Submission Information Package, SIP)
  • säilytyspaketti (Archival Information Package AIP)
  • jakelupaketti (Dissemination Information Package DIP).

Tietopaketti voidaan löytää arkistosta pakettiin liitettävän kuvailutiedon (Descriptive Information) avulla.

Tietoarkisto pitkäaikaissäilyttää kvantitatiivisia ja kvalitatiivisia sähköisiä tutkimusaineistoja sekä niihin liittyvää oheismateriaalia. Aineistot kuvaillaan DDI-formaatin mukaisesti. DDI-kuvailu sisältää sekä esitysinformaatiota, säilytysinformaatiota että kuvailutietoa. Aineistojen löytämisen mahdollistaa kuvailutieto, joka julkaistaan tietoarkiston verkkosivujen aineistoluettelossa. Oheisessa kuvassa on esitetty OAIS-tietomallin mukainen tietoarkiston säilytyspaketti (AIP) kvantitatiiviselle aineistolle. Luovutus- ja jakelupaketit voidaan määritellä vastaavasti.

kuvio

Mallin velvoitteet toteutuvat tietoarkistossa

OAIS määrittelee kuusi minimivelvoitetta tai -vastuuta, jotka OAIS-yhteensopivan organisaation on hoidettava. Organisaation on

  • neuvoteltava aineistonluovuttajien kanssa säilytettävästä informaatiosta ja määritettävä kriteerit aineiston vastaanotolle
  • hankittava riittävät oikeudet aineiston pitkäaikaissäilytykseen
  • määriteltävä kohdeyleisö
  • varmistettava, että kohdeyleisö voi itsenäisesti ymmärtää säilytettävät aineistot eli että käyttäjä ei tarvitse tiedon alkuperäisen tuottajan apua tiedon ymmärtämiseen ja käyttämiseen
  • noudatettava dokumentoituja toimintatapoja, jotka varmistavat aineiston säilymisen tunnettuja uhkia vastaan sekä autenttisten aineistokopioiden jaon
  • tarjottava aineistot kohdeyleisön käyttöön.

Tietoarkiston tehtävät määritellään yleisellä tasolla Tampereen yliopiston johtosäännössä. Tarkemmin toiminnot määritellään tietoarkiston arkistonmuodostussuunnitelmassa, jossa kuvataan muun muassa vastaanottokriteerit, arkistointiprosessi, tietojärjestelmä ja tietoturvan varmistamiseksi valitut käytännöt. Sisäinen käsikirja sisältää yksityiskohtaiset käytännön ohjeet. Tutkimusaineistojen prosessoinnissa ja kuvailussa noudatetaan alan kansainvälisiä käytäntöjä ja formaatteja. Kohdeyleisö löytää tiedot aineistoista tietoarkiston verkkosivuilta, ja aineistoja myös markkinoidaan aktiivisesti.

Tietoarkisto hoitaa siten kaikki kuusi OAIS-vastuuta. Tämä oli odotettavaakin, onhan tietoarkisto perustettu nimenomaan sähköisten aineistojen arkistoksi. Vastaavia tuloksia on saatu esimerkiksi brittien data-arkiston UKDA:n ja yhdysvaltalaisen ICPSR:n kohdalla.

Prosessien tarkastelusta välineitä toiminnan kehittämiseen

Tietomallin ja vastuiden lisäksi OAIS-standardi esittää yksityiskohtaisen toimintamallin, jossa on kuusi päätoimintoa: vastaanotto, säilytys, tiedonhallinta, hallinnointi, säilytyksen suunnittelu ja pääsy. Näiden kuuden toiminnon lisäksi organisaatiossa on oltava yhteisiä palveluja (esimerkiksi erilaisia teknisiä tukipalveluja).

OAIS-toimintamallin avulla tietoarkiston prosesseja oli mahdollista tarkastella uudesta näkökulmasta. Tarkastelu vahvisti käsitystä, että tietoarkistossa asioita on tehty oikein. Vakavia puutteita ei paljastunut. Prosesseissa on kuitenkin selkeyttämisen ja hiomisen varaa, ja esimerkiksi säilytysinformaatiota voisi jäsennellä ja parantaa.

Tietoarkistossa toiminnot painottuvat hieman eri tavalla kuin mallissa. Mallissa vastaanotto on kuvattu hyvin lyhyesti ja hankinta käytännössä sivuutetaan, mutta tietoarkistossa ne ovat keskeisiä prosesseja. Toisaalta sekä hallinnointi että säilytyksen suunnittelu ovat mallissa selvästi monimutkaisempia kuin tietoarkistossa.

Tulevaisuuden haasteita

Tarkastelu paljasti muutamia tulevaisuuden haasteita. OAIS-malli korostaa aineistojen omistus- ja tekijänoikeuksien hallintaa. Tietoarkistossa oikeuksiin on paneuduttu hyvin, mutta niihin on jatkossakin kiinnitettävä runsaasti huomiota. Toinen tulevaisuuden haaste on mahdollinen kohdeyleisön muutos. Ei välttämättä ole kansantaloudellisesti järkevää rajata verovaroin tuotettujen tutkimusaineistojen käyttöä vain tieteelliseen tutkimukseen, sillä tietoja voisivat hyödyntää myös päätöksentekijät ja toimittajat sekä kaupalliset toimijat. Heillä ei kuitenkaan aina ole datan käyttöön vaadittavaa tietotaitoa, jolloin tietoarkiston pitäisi panostaa nykyistä enemmän tiedon esittämiseen, käytön ohjeistamiseen ja neuvontaan.

Tietoarkisto on vielä suhteellisen pieni arkisto, joten sähköisten aineistojen pitkäaikaissäilyttämiseen hallinnointia ei tällä hetkellä ole niin paljon kuin OAIS-mallissa. Koon ja toiminnan kasvaessa on varauduttava hallinnoinnin prosessien monimutkaistumiseen ja niistä aiheutuvien kustannusten lisääntymiseen.

Kaikkea ei tietenkään tarvitse välttämättä hoitaa itse, ja tulevaisuudessa onkin pohdittava joidenkin toimintojen ulkoistamista. Lisäksi toiminnan arviointia olemassa olevien standardien ja kriteeristöjen avulla on tarpeen jatkaa.

Tietoarkisto on OAIS-yhteensopiva

Tehdyn tarkastelun perusteella tietoarkisto on hyvin yhteensopiva OAIS-standardin kanssa. Mallin määrittämät minimivastuut on hoidettu, ja tietoarkistossa on tunnistettavissa kaikki mallin kuusi toiminnallisuutta. Tietoisuus toimintojen sijoittumisesta OAIS-standardin viitekehykseen helpottaa toimintojen vertailua ja yhteensovittamista muiden sähköisiä aineistoja pitkäaikaissäilyttävien organisaatioiden kanssa.

OAIS-yhteensopivuus ei ollut yllätys. Tietoarkiston toimintamalli perustuu jo vuosikymmeniä toimineiden sähköisten tutkimusdatan arkistoinnin pioneerien esimerkkeihin Yhdysvalloista, Britanniasta ja Saksasta. Nykyään tietoarkisto osallistuu aktiivisesti kansainväliseen yhteistyöhön ja pystyy siten itsekin vaikuttamaan alan käytäntöihin ja standardeihin.

Lisätietoa ja lähteitä:
» Consultative Committee for Space Data Systems: Reference model for an Open Archival Information System (OAIS). CCSDS 650.0-B-1 Blue Book, January 2002. PDF-dokumentti verkossa: <http://public.ccsds.org/publications/archive/650x0b1.pdf> [viitattu 15.6.2010].
» Beedham H, Missen J, Palmer M, Ruusalepp R (2005). Assessment of UKDA and TNA compliance with OAIS and METS standards. Joint Information Systems Committee (JISC), United Kingdom. PDF-dokumentti verkossa: <http://www.jisc.ac.uk/uploaded_documents/oaismets.pdf> [viitattu 15.6.2010].
» Vardigan, Mary & Whiteman, Cole (2007). ICPSR meets OAIS: applying the OAIS reference model to the social science archive context. Archival Science 7:73-87. PDF. Verkkolehti: <http://deepblue.lib.umich.edu/bitstream/2027.42/60440/1/Vardigan.Whiteman.Applying%20OAIS.pdf> [viitattu 15.6.2010].
» Viitemalli pitkäaikaissäilytysarkistolle. OAIS-standardin suomalainen versio. SFS 5972. Vahvistettu 2009-12-14. Helsinki: Suomen Standardoimisliitto, 2010.
» Tietoarkiston arkistonmuodostussuunnitelma
» Kansallinen Digitaalinen Kirjasto -hanke
» Arkistolaitoksen SAHA-hankekokonaisuus (ml. VAPA-hanke)