KvantiMOTV

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - KvantiMOTV
 Lisäesimerkit   SPSS-harjoitukset   Lisätietoja 

Sosiaalitutkimuksen sosiodemografiset taustamuuttujat: Tilastoluokitukset, ikä ja sukupuoli

Johdanto
Ennen analyysia 1: otoksen edustavuus ja painokertoimet
Ennen analyysia 2: taustamuuttujien muokkaus
Taustamuuttujien käyttötapoja ja -rajoituksia
Luokitusstandardit ja muuttujakohtainen tarkastelu
Sukupuoli
Ikä
Koulutus ja koulutuksen pituus
Ammatti
Pääasiallinen toiminta, ammattiasema ja sosioekonominen asema
Tulot
Perheasema ja siviilisääty
Kieli ja etninen ryhmä
Kunta ja alueet
Muita uskontoon, kansalaisosallistumiseen, terveyteen sekä sairauteen liittyviä taustamuuttujia
Lähteet

Luokitusstandardit ja muuttujakohtainen tarkastelu

Tässä verkko-oppaassa kuvataan sosiaalitutkimuksen kyselyjen sosiodemografisten taustamuuttujien sisältöä esittelemällä niiden vakiintuneita mittaustapoja ja tilastoluokituksia. Mittaustavat viittaavat tässä yhteydessä kyselyn tiedonkeruuvaiheessa esitettäviin kysymyksiin, ja tilastoluokitukset puolestaan niihin loppumuuttujiin, jotka muodostetaan erilaisten vaiheiden kautta analysoitavaan tutkimusaineistoon. Tilastoluokitukset ovat pääosin peräisin tilastoviranomaisilta, ja niiden osalta viitataan jatkossa pääosin Tilastokeskuksen luokitusoppaaseen. Monisäikeisimmät tilastoluokitukset, kuten koulutusaste ja ammatti, edellyttävät jonkin verran myös muuta taustoittamista.

On syytä huomata, että virallisen tilastoinnin luokitusstandardit koskevat vain osaa sosiaalitutkimuksen vakiintuneita taustamuuttujia, ja että luokitusstandardit eivät siis suinkaan aina määritä suoraan kyselyissä kysyttävien taustakysymysten ja niiden vastausvaihtoehtojen sanamuotoja. Viralliset tilastoluokitukset ovat nimittäin standardoituja ryhmittelyjä, joihin tähdätään kerättävien aineistojen kysymyksillä kootuin tiedoin. Usein lopullisten tilastoluokitusten mukaisiin tietoihin on yhdistetty tietoja monista aineistojen muuttujista ja samalla tietoja on koodattu uudelleen.

Tästä syystä seuraavat taustamuuttujakohtaiset kysymysesimerkit viittaavat ensisijaisesti kotimaisen ja kansainvälisen tiedeyhteisön vakiintuneimpiin tapoihin tiedustella kyselyissä sosiodemografisia tietoja.

Taustamuuttujakohtainen tarkastelu tarjoaa tiivistetysti

  • peruskuvaukset taustamuuttujien sisällöstä,
  • esimerkkejä taustakysymysten käytöstä lomakkeissa,
  • linkkejä taustamuuttujiin liittyviin luokitusstandardeihin,
  • linkkejä muuttujiin liittyviin väestö- ja rakennetietoihin, joita tutkijat voivat hyödyntää tutkimusaineistojen katoanalyyseissä ja vinoutumien korjaamisessa,
  • luokitusten käyttöä helpottavaa taustatietoa sekä
  • taustamuuttujien tutkimuskäyttöä tukevaa muuta informaatiota.

Kaikkiaan varanto auttaa laatimaan taustamuuttujat kyselyissä mahdollisimman tarkoituksenmukaisesti. Myös tutkimusaineistojen monipuolisen jatkokäytön mahdollisuuksia parantaa se, että taustamuuttujien tiedot kootaan riittävän laadukkaasti niin kotimaisia kuin kansainvälisiäkin tutkimuksia silmällä pitäen.

Taustamuuttujakohtaiset aiheet ja linkit

Kyselyn yksittäisten kysymysten muotoiluun vaikuttaa ratkaisevasti myös se, kerätäänkö tiedot postikyselynä tai internetissä, vai osallistuuko tiedonkeruuseen myös henkilökohtainen haastattelija, kuten puhelin- ja käyntikyselyissä. Nyt esimerkeissä ovat etusijalla vastaajien omatoimisesti täyttämät kyselylomakkeet. Osa mallikysymyksistä on peräisin kansainvälisesti vertailevista European Social Survey- ja International Social Survey Programme -kyselytutkimuksista. Suomessa ISSP on kerätty postitse ja ESS käyntihaastatteluna. Haastatteluorganisaationa on toiminut molemmissa Tilastokeskus. Esiin nostettavat esimerkit eivät silti suinkaan ole ainoita oikeita taustamuuttujien operationalisointeja, koska ne on laadittu ensisijassa kansainvälisen vertailun tarpeisiin.

Sukupuoli

Vastaajien sukupuolta koskevaa kysymystä ei aina edes esitetä vastaajalle puhelin- ja käyntihaastatteluissa. Osin kohteliaisuudenkin vuoksi tieto kerätään usein muun havainnoinnin pohjalta. Omatoimisesti täytettävissä kyselyissä kysymyksen voi esittää usein eri tavoin, riippuen esimerkiksi siitä sinutellaanko vai teititelläänkö vastaajaa lomakkeessa.

Kysymysesimerkit:

Sukupuolenne?
1   Mies
2   Nainen

Tai

Oletteko...?
1   Mies
2   Nainen

Yleensä sukupuolta koskeva muuttuja laaditaan kyselyihin vastausvaihtoehdoiltaan dikotomiseksi. Kansainväliset luokitusstandardit ja Tilastokeskuksen henkilöluokitus ottavat kuitenkin huomioon myös sen mahdollisuuden, että vastaajan biologinen sukupuoli on määrittelemätön. On myös kuviteltavissa tutkimuksia, joissa joko otoksen rajausten tai tutkimusasetelman vuoksi sukupuolta koskevaa kysymystä ei ole tarpeen tai syytä kysyä lainkaan. Esimerkiksi pienissä näytteissä vastaajan jo vastaajan sukupuolenkin kysyminen saattaa paljastaa hänen henkilöllisyytensä.

Monissa tutkimuksissa myös vastaajien sukupuoli-identiteetti ja seksuaalinen suuntautuneisuus voivat olla tärkeitä selittäviä tai selitettäviä tekijöitä. Sukupuoli-identiteettiä voidaan tiedustella vastaajan biologisesti määrittyvää sukupuolta koskevan taustakysymyksen yhteydessä, tai siitä voidaan laatia kyselyyn erillisiä kysymyksiä. (Ks. esim. Kinnunen 2001, 39-46, Lempiäinen 2003, 66-88 ja Alastalo 2005, 196-200).

Dikotominen sukupuolta kuvaava muuttuja koodataan havaintoaineistoon tavallisesti numeroin 1 ja 2. Virallisessa tilastoluokituksessakin miehet ovat ykkösiä, mutta numeroita käytetään tässä yhteydessä osoittamaan ainoastaan laatueroasteikollista eroa. Yhtä hyvin voitaisiin käyttää esimerkiksi kirjaimia M ja N. Tutkija voi asettaa sukupuolta kuvaavat numerot haluamallaan tavalla, kunhan dokumentoi valintansa selvästi. Tutkimustuloksiin valinnalla ei ole vaikutusta. Luokitusstandardien noudattamisesta omassa tiedonkeruussa on yleensä kuitenkin se hyöty, että uuden tutkimusaineiston vertailut muihin aineistoihin helpottuvat.

Miehet ja naiset väestötilastoissa

Aikuisväestökyselyjen otosten edustavuutta voidaan tutkia vertaamalla otoksen sosiodemografista rakennetta tutkimuksen populaatioon eli perusjoukkoon. Otoksen sukupuolijakaumaa voidaan verrata tietoihin miesten ja naisten osuuksista koko aikuisväestössä. Näitä löytyy mm. Tilastokeskuksen väestötilastoista. Väestön sukupuolitietoja löytyy mm. Tilastokeskuksen verkkosivujen väestörakennetaulukoista.

Painettujen tilastojulkaisujen ohella Tilastokeskus tarjoaa nykyään verkkosivuillaan myös monia maksuttomia tietokantapalveluja.

Ikä ja syntymäajankohta

Henkilön ikää käytetään sosiaalitutkimuksen taustamuuttujana hyvin moniin tarkoituksiin. Ikä kertoo paljon ihmisten elinkaaresta ja iän perusteella henkilöitä voidaan tarkastella yhteiskunnan vaiheita eri tavoin kokeneiden ryhmissä. Useat kulttuurin ja yhteiskunnan tutkimuksen keskeiset teoriat ja tutkimusongelmat liittyvät suoraan tai epäsuoraan ihmisten elinkaaren vaiheeseen, sukupolvikysymyksiin, ikääntymisen tai vallitsevien aikakausien ja yhteiskunnallisten olojen problematiikkaan ja niin edelleen.

Vastaajan ikää tiedustellaan tyypillisissä sosiaalitutkimuksen kyselyissä vuoden tarkkuudella. Ikää ei ole syytä kysyä suoraan, koska vastaajan muisti ja laskutaito saattavat pettää. Syntymävuosi on epäsuorempi ja luultavasti joillekin vastaajille myös mieluisampi tapa ilmoittaa asia. Syntymävuotta kysyttäessä myös mittauksen reliabiliteetti on parempi kuin ikää suoraan kysyttäessä.

Syntymävuosi koodataan havaintoaineistoon joko kaksi- tai nelinumeroisena muuttujana. Vuonna 1951 syntynyt vastaaja koodataan aineistoon joko '1951' tai '51'.

Kysymysesimerkit:

Syntymävuotenne? 19____

Tai

Minä vuonna olette syntynyt? ______

Vastaajan ikä voidaan laskea tilasto-ohjelmistoissa syntymävuodesta vaivattomasti. Kuvailevassa analyysissa, kuten ristiintaulukoinneissa, ikämuuttuja ryhmitellään tutkimusongelman käsittelyn, tulosten hahmotettavuuden ja tarkasteltavien ryhmien koon kannalta mahdollisimman tarkoituksenmukaisesti. Vastaajamäärältään liian pienistä ikäryhmistä (esim. alle 20 vastaajaa) ei voida tehdä enää kovinkaan luotettavia yleistäviä päätelmiä.

Joissakin otoksissa ja tutkimusasetelmissa ikää voi olla tarpeen tiedustella vuotta tarkemmin, ainakin päivämäärän tai jopa minuutin tarkkuudella. Tällöin on varsinkin aineiston tallennusvaiheessa otettava tarkoin huomioon, millä tavoin koodattuna syntymäaika-muuttujasta saadaan kätevimmin lasketuksi tutkimuksessa mahdollisesti vaadittavat uudet, syntymäaikaa ryhmittelevät muuttujat.

Jos ikää kysytään hyvin tarkkaan, kasvaa myös vastaajan tunnistettavuuden riski. Joissakin tapauksissa tämä voi myös vähän laskea kyselyn vastausprosenttia. Tieteellisiin tarkoituksiin kerätyissä, vastaajamääriltään suurissa tai suurehkoissa aineistoissa vastaajien syntymäajankohtaa on kuitenkin aina perusteltua tiedustella melko tarkasti. Näin tutkimusaineistoon voidaan luoda eri käyttövaiheissa erilaisiin käyttötarkoituksiin soveltuvia ikäluokitteluja.

Jos vastaajan ikää kysytään kyselyssä jo valmiiksi ikäryhmiin luokiteltuna, tämä rajoittaa useimmiten aivan liikaa aineiston käyttömahdollisuuksia. Pienissä aineistoissa tämä voi kuitenkin olla joskus perusteltua vastaajien tunnistamattomuuden takaamiseksi. Tällöin ikäryhmiin kuulumista koskevan kysymyksen vastausluokat on muodostettava siten, että niiden luokkarajat palvelevat mahdollisimman joustavasti tutkimuksen eri käyttötarpeita. Vaihtoehdot on myös luokiteltava selvästi toisensa poissulkeviksi. Triviaaliksi esimerkiksi käyköön kysely, jossa ikäryhmäkysymys koostui vain kahdesta vaihtoehdosta: alle 40-vuotiaat ja yli 40-vuotiaat. Tasan nelikymppiset eivät tienneet kumpaan sijoittua.

Kysymysesimerkki:

Mihin seuraavista ikäryhmistä kuulutte?

1   Alle 30-vuotiaat
2   31-40 v.
3   41-50 v.
4   51-64 v.
5   65 vuotta täyttäneet

Ikä- ja vuosikohortit

Luokiteltuna kerätyn ikämuuttujan käyttöongelmat ilmenevät myös muun muassa pitkittäistutkimuksissa, joissa analysoidaan tiettyinä ajankohtina syntyneiden tietoja eri aikoina kerätyin poikkileikkausaineistoin. Jos esimerkiksi eri vuosikymmenillä kerätyistä aineistoista tiedetään vain, että tietyt vastaajat olivat vastaushetkellä 30-39-vuotiaita, ei tiettynä aikana syntyneiden vastaajien tietojen kehitystä ole juurikaan mahdollista seurata tällaisilla aineistoilla. Valmiiksi luokitellun ikämuuttujan kyselylomakkeessaan sisältävät tutkimusaineistot on vain harvoin kerätty niin säännönmukaisesti ja soveltuvin ikäryhmittelyin, että täsmällinen vastaajien iän mukainen pitkittäisanalyysi olisi mahdollista.

Systemaattisesti vuoden tai päivän tarkkuudella mitattu syntymäajankohta ajallisesti kattavissa aineistoissa sen sijaan tarjoaa monia kiinnostavia mahdollisuuksia varsinkin kohorttitutkimuksiin. Mitattaessa ikää vuoden tarkkuudella voidaan tutkia vuosikohortteihin, eli saman kalenterivuoden aikana syntyneiden ryhmistä yhdistettyihin luokkiin, liittyviä ilmiöitä. Jos taas vastaajan ikä on tiedossa päivän tarkkuudella, kuten on tyypillistä ainakin rekisteriaineistoissa, voidaan tutkia myös ikäkohortteja, eli tiettynä hetkenä ikävuosiltaan samanikäistä väestöä (ikä- ja vuosikohorteista lisää ks. Myrskylä 2002; kohorttianalyysista sosiaalitutkimuksessa ks. Toivonen 1999). Empiirisen ikä- ja sukupolvitutkimuksen kannalta puolestaan yleensä riittää, että vastaajan ikä on kysytty syntymävuoden tarkkuudella.

Ikä ja väestötilastot

Ikä on sukupuolen ja ehkä myös joidenkin aluemuuttujien rinnalla keskeisin tekijä määriteltäessä otosten sosiodemografista edustavuutta suhteessa niiden perusjoukkoon. Ikä on sukupuolen tavoin myös tärkeä otosten kiintiöintiperuste. Siksi otostietoja vertaillaan väestötietoihin usein siten, että tarkastellaan vähintään kahden sosiodemografisen tekijän perusteella määrättyjä henkilömääriä otoksessa ja perusjoukossa. Jos esimerkiksi aikuisväestöstä tehdyssä otoksessa on 10 % tietyn ikäisiä naisia mutta heitä on otoksen perusjoukossa 12 %, voidaan vinoutumaa korjata laatimalla aineistoon painokertoimia ja käyttämällä niitä laskettaessa aineistoista erilaisia tuloksia. Painomuuttujan tulee tietenkin huolehtia samalla kertaa tasapainoisesti koko otosaineiston suhteuttamisesta perusjoukon rakenteeseen.

Ajantasaisia iän ja sukupuolen mukaisia väestötietoja on saatavilla Tilastokeskuksen väestörakennetaulukoista. Muistakin sosiaalitutkimuksille tyypillisistä perusjoukoista on usein saatavilla ainakin iän ja sukupuolen mukaisia rakennetietoja, jotka perustuvat erilaisiin rekistereihin.

Tutkittavien ikä

Laajojen kyselytutkimusten vastaajat ovat yleensä vähintään 15 vuotta täyttäneitä, kuten esimerkiksi ESS-aineistoissa ja Eurobarometreissä. Usein ollaan kiinnostuneita vain täysi-ikäisistä, esim. World Values Survey -aineistojen kohdejoukon alaikäraja on 18 vuotta. Ikäraja määritellään monesti vielä tarkemmin, esim. EVAn kansallisten asennetutkimusten perusjoukkona ovat 18-70-vuotiaat mannersuomalaiset.

Vastaajien ikärajoja asetetaan eri syistä. Tutkijat voivat olla kiinnostuneita vain tietyn ikäisten, esim. työikäisten, tarkastelusta. Ikääntyneitä vastaajia, esim. laitoksissa asuvia vanhuksia, on hankala tavoittaa kyselytutkimuksilla. Lasten tutkimukseen osallistumiseen tarvitaan usein huoltajan lupa. Myös kustannussyyt rajaavat vastaajajoukon valintaa. (Ks. Alastalo 2005, 140; Kuula 2006, 147-153.)

Jatkuu seuraavalle sivulle


viimeksi päivitetty 2007-07-10
 Lisäesimerkit   SPSS-harjoitukset   Lisätietoja 

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto
FSD