FSD Bulletin

Numero 26 (1/2009)
16.3.2009

ISSN 1795-5254

etusivu
uusimmat aineistot
aikaisemmat lehdet
toimitus

» uusin lehti

Tietoarkisto on FSD:n verkkotiedotuslehti, jonka syksyn erikoisnumero ilmestyy myös painettuna. Lehdessä on artikkeleita ja uutisia tutkimus- ja arkistotoiminnan eri alueilta. Tietoarkiston ilmestymisestä tiedotetaan sähköpostilistallamme. Painetun Tietoarkisto-lehden voi tilata maksutta osoitteesta fsd@tuni.fi.


FSD

Yhteiskuntatieteellinen
tietoarkisto
puh. 040 190 1432
faksi (03) 343 9088
s-posti: fsd@tuni.fi


Eurostatin ja CESSDA PPP:n työpaja etsi
helpotusta tilastotarkoituksiin kerätyn mikrodatan saatavuuteen

Helena Laaksonen

Vaatimukset tilastoviranomaisten ylläpitämien mikrotason aineistojen tutkimuskäytön helpottamiseksi ovat voimistuneet. Joissakin maissa pääsy tilastoviranomaisten mikrodataan on jo järjestetty esimerkillisesti. Ratkaisut ovat erilaisia, mutta toimivia. Useissa Euroopan maissa tutkijat kohtaavat edelleen ongelmia. Yleensä tutkimuskäyttöä rajoittavat tietosuojasäännökset ja rahanpuute.

Euroopan tilastokeskusten, tutkijayhteisön ja data-arkistojen edustajat kokoontuivat viime joulukuussa yhteiseen työpajaan Luxemburgiin. Keskusteltiin, millaisia käytäntöjä eri maissa on, mikä on mahdollista ja mitä pitäisi vielä tehdä, jotta arvokkaat aineistot olisivat helpommin saatavilla tutkimuskäyttöön.

Työpajassa esiteltiin Euroopan tilastojärjestelmää (ESS:ää) koskevia säädöksiä erityisesti tietosuojan, luottamuksellisuuden ja tutkimuskäytön näkökulmasta. Tilastoviranomaisten näkökulmasta luottamuksen säilyttäminen on ensisijaista. He haluavat välttää riskejä, ja mikrotason tietojen luovuttaminen voi sisältää riskejä silloinkin, kun suorat tunnistetiedot on poistettu; Tutkijat taas ovat jopa loukkaantuneita siitä, että heidän oletetaan pyrkivän tunnistamaan tutkimushenkilöitä tai käsittelevän dataa piittaamattomasti, kuten yhden tutkijan kommenttipuheenvuorossa todettiin.

Unionin lainsäädäntö mahdollistaa

Komission tilastoviranomaisten riippumattomuudesta, koskemattomuudesta ja vastuuvelvollisuudesta antama suositus (KOM(2005) 217) sisältää tutkijoille tärkeän kohdan: "Mikrotietoihin pääsy voidaan sallia tutkimustarkoituksiin. Pääsyyn sovelletaan tiukkoja protokollia." Sanamuoto ei velvoita, mutta mahdollistaa. Eurostat onkin helpottanut mikrotason aineistojen saatavuutta ja käyttöä.

Komission asetuksella on säädetty muutamista aineistoista, joita saa käyttää yhteisön viranomaisen, lähinnä Eurostatin, tiloissa silloinkin, kun ne sisältävät salassapidettävää tietoa. Asetuksessa luetellaan seitsemän aineistoa, muun muassa työvoimatutkimus (LFS) ja Euroopan yhteisön kotitaloustiedustelu (ECHP).

Hyvinä esimerkkeinä mikrodatan käyttömahdollisuuksista mainitaan yleensä Tanska, Ruotsi ja Alankomaat, joissa on mahdollista etäkäyttää mikrodata-aineistoja. Suomessa etäkäyttö on myös suunnitteilla. Euroopan Unionin lainsäädännön lisäksi jäsenmaissa on toisistaan poikkeavia kansallisen tason säädöksiä ja myös laintulkintaa. Esimerkiksi Ruotsin etäkäyttöjärjestelmässä MONAssa on käytössä erilaisia mekanismeja, joilla tutkimushenkilöiden epäsuoraa tunnistamista pyritään estämään. Epäsuora tunnistaminen ei kuitenkaan ole MONA-järjestelmää esitelleen Claus-Göran Hjelmin mukaan ongelma. Hänen mukaansa Ruotsissa tilastoviranomainen siirtää vastuun tietosuojasta aineistoa käyttäville tutkijoille. Suomessa tämä ei ole mahdollista. Viimekätinen aineistovastuu säilyy Tilastokeskuksella.

Data-arkistot mikrodatan jakelijoina

Ison-Britannian tilastotoimiston, ONS:n, edustajan Paul Jacksonin mukaan tilastoviranomaisten on siirryttävä "riskien välttämisestä riskien hallintaan". Aineistojen jakelu tutkijayhteisölle on tehtävä, jonka hoitamisen voi hänen kokemuksen mukaan luottaa data-arkistolle. Britanniassa anonymisoitua tilastotarkoituksiin kerättyä mikrodataa luovutetaankin tutkimuskäyttöön talous- ja sosiaalialan aineistoihin erikoistuneen ESDS-palvelun kautta. Myös Norjassa data-arkistolla, NSD:llä, on vahva asema tilastotarkoituksiin kerätyn aineiston pitkäaikaissäilytyksessä ja toimittamisessa tutkimuskäyttöön.

Esimerkiksi datan tekijä- tai rahoittajahaku Britannian data-arkiston UKDA:n aineistoluettelosta fraasilla "Office of National Statistics" tuottaa yli 700 osumaa. Muun muassa neljännesvuosittainen työvoimatutkimus, ONS Omnibus, kulutustutkimus (Family Expenditure Survey) ja vuosittainen väestötutkimus ovat aineistoluettelossa, ESDS Government ja ESDS Longitudinal -palveluissa. Osa aineistoista on myös analysoitavissa verkossa Nesstar-käyttöliittymän kautta. Aineistojen jakelu tapahtuu verkkopalvelun kautta.

Helppo saatavuus lisää aineistojen käyttöä tutkimus- ja opiskelutarkoituksiin. Seminaarin tutkijapuheenvuorossa Eurostatin ja ESDS:n käyttölupamäärät asetettiin kriittiseen vertailtuun. Arveltiin, että Eurostatilla on paljon tehtävää mikrotason aineistojen tutkimuskäytön edistämisessä.

Hyväksytty tutkija

Koska mikrodataa voi luovuttaa vain tutkimuskäyttöön, tietosuojan lisäksi oleellinen kysymys on, kuka on tutkija. Eri maissa määrittelykäytäntö vaihtelee. Alankomaissa tutkijalla on lain mukaan oltava työ- tai virkasuhde hyväksytyssä tutkimuslaitoksessa. Jatko-opiskelijat voivat kiertää sääntöä ja saada oikeuden käyttää aineistoja tekemällä muodollisen työsopimuksen esimerkiksi yliopiston laitoksen kanssa. Esimerkiksi Irlannissa tilastolaki ei tunne hyväksytyn tutkijan käsitettä. Tilastoviranomainen ratkaisee käyttöluvan myöntämisen tapauskohtaisesti.

Suomessa Tilastokeskuksen käytäntö on lähempänä Irlantia kuin Alankomaita. Aineistoon on mahdollista saada käyttölupa, kun esittää hyväksyttävän tutkimussuunnitelman. Koska Tilastokeskus perii toimittamistaan aineistoista maksun, yksittäisillä tutkijoilla ja varsinkin opiskelijoilla ei yleensä ole mahdollisuutta hankkia aineistoa vain henkilökohtaiseen käyttöönsä. Luvan myöntämistä ei kuitenkaan rajata koulutuksen tai työsuhteen perusteella kuten Alankomaissa. Opiskelijatkin voivat tehdä aineistolla tutkimusta, jos jollekin projektille tai organisaatiolle aiemmin myönnettyä käyttölupaa laajennetaan uusien käyttäjien osalta.

Tilastokeskuksen käyttölupia myönnettäessä punnitaan tietosuojaa ja käyttötarkoitusta. Tutkijat voivat joutua muokkaamaan suunnitelmaansa, jos tietosuojan vuoksi ei ole mahdollista luovuttaa tietoja tutkijan toivomalla tarkkuudella tai otoskoolla.
– Ongelmia muodostuu lähinnä silloin, jos näyttää siltä, että aineistoa käytetään markkinointitutkimuksiin, kertoo Eurostatin ja CESSDAn työpajassa Suomea edustanut tutkija Janika Konnu Tilastokeskuksesta.

Joulukuun 3.–4. päivinä järjestetyssä Eurostat Workshopissa oli yli 80 osallistujaa Euroopan unionin jäsenmaiden tilastovirastoista, data-arkistoista ja yliopistoista. Mukana oli myös yhteistyöorganisaatioiden edustajia unionin ulkopuolisista maista ja kansainvälisistä järjestöistä. Eurostat Workshopin ilmapiiri oli yhteistyöhaluinen ja -hakuinen. Lopulta jäsenmaat ja niiden kansallinen lainsäädäntö ja laintulkinta kuitenkin ratkaisevat, miten pitkälle yhteistyöllä päästään.

 

Lisätietoa ja lähteitä
» Seminaarin materiaalit verkossa
» Komission suositus Kansallisen yhteisön tilastoviranomaisten riippumattomuudesta, koskemattomuudesta ja vastuuvelvollisuudesta (KOM(2005) 217) (pdf-dokumentti)
» Komission asetus (EY) N:o 1000/2007, yhteisön tilastoista annetun neuvoston asetuksen (EY) N:o 322/97 täytäntöönpanosta tieteellisiin tarkoituksiin käytettävien salassa pidettävien tietojen käyttöoikeuden osalta annetun asetuksen (EY) N:o 831/2002 muuttamisesta (pdf-dokumentti)

CESSDA PPP -tiekarttaprojekti

CESSDA PPP:n päätavoite on luoda sopimuspohja ja säännöt alan uuden eurooppalaisen tutkimusinfrastruktuurin toiminnalle. Hanke raivaa strategisia, rahoituksellisia ja lainsäädännöllisiä esteitä, joita yhteiskunta- ja humanististen tieteiden tutkimusdatan jatkokäytön tiellä edelleen on. Tavoitteena on taata tutkijoille mahdollisuus käyttää tutkimusaineistoja, joita he tarvitsevat tehdäkseen korkealaatuista tutkimusta, riippumatta tutkijan tai tutkimusaineiston sijoituspaikasta Euroopan tutkimusalueella.

Hankkeessa on useisiin osa-alueisiin keskittyviä työkokonaisuuksia, jotka muun muassa kehittävät yhteistä dataportaalia, jonka kautta tutkijat voivat etsiä tutkimusaineistoja ja saada niitä käyttöönsä eripuolilta Eurooppaa; kehittävät yhteisiä välineitä käyttäjien tunnistamiseen ja hallinnointiin ja tähän tarvittavia väliohjelmistoja; kehittävät välineitä tesauruksen ylläpitoon; laajentavat ja kehittävät CESSDA-infrastruktuuria; tutkivat grid-teknologiaa ja kehittävät välineitä tutkimusdatan harmonisointiin. Yhteiskuntatieteellisen tietoarkiston kielenkääntäjä johtaa hankkeen tesaurus-työkokonaisuutta.

Mikrodatan saatavuutta käsitelleen seminaarin vastuullinen työkokonaisuus oli WP10, joka keskittyy tutkimusdatan saatavuutta ja jakelua koskeviin kysymyksiin. WP10 tavoitteena on muun muassa julkisten virallisten tilastojen tuottamiseksi kerätyn mikrodatan saaminen tutkimuskäyttöön vaarantamatta tietosuojaa ja -turvaa.

Mikrodata

Mikrodatalla tarkoitetaan aineistoja, jotka sisältävät tietoa yksittäisistä henkilöistä tai talousyksiköistä. Mikrodata on kerätty yleensä kyselytutkimuksin väestöotokseen poimituilta henkilöiltä tai kokonaisväestöltä väestönlaskennoissa. Tietoja voidaan poimia myös rekistereistä. Esimerkiksi Pohjoismaissa rekisteritietojen yhdistäminen on tilastoviranomaisille jokapäiväistä toimintaa, ja Suomessa Tilastokeskus tuottaa valtaosan tilastoista rekistereistä. Joissakin muissa maissa rekisterien yhdistämiseen suhtaudutaan epäilevämmin eivätkä rekisterit edes ole yhtä kattavia ja laajoja kuin Suomessa.