KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi. Lue päivitetty artikkeli Sosiaalitutkimuksen sosiodemografiset taustamuuttujat: Tilastoluokitukset, tulot, kieli ja alueet.
Sosiaalitutkimuksen sosiodemografiset taustamuuttujat: Tilastoluokitukset, tulot, kieli ja alueet
Johdanto
Ennen analyysia 1: otoksen edustavuus ja painokertoimet
Ennen analyysia 2: taustamuuttujien muokkaus
Taustamuuttujien käyttötapoja ja -rajoituksia
Luokitusstandardit ja muuttujakohtainen tarkastelu
Sukupuoli
Ikä
Koulutus ja koulutuksen pituus
Ammatti
Pääasiallinen toiminta, ammattiasema ja sosioekonominen asema
Tulot
Perheasema ja siviilisääty
Kieli ja etninen ryhmä
Kunta ja alueet
Muita uskontoon, kansalaisosallistumiseen, terveyteen sekä sairauteen liittyviä taustamuuttujia
Lähteet
Tulot
Tulot ovat tavanomaisista sosiodemografisista taustakysymyksistä arkaluonteisimpia. Vastaajalta voidaan tiedustella hänen henkilökohtaisia tulojaan, mutta usein on tarkoituksenmukaisempaa saada tietoa vastaajan kotitalouden tuloista. Kotitalouden toimeentulon kokonaiskuva on usein tärkeämpi tyypillisten sosiaalitutkimuksen tutkimusongelmien kannalta. Kun tulonsaajia on kotitaloudessa useampia, kysymystä koko kotitalouden tuloista ei ehkä myöskään koeta niin henkilökohtaiseksi ja arkaluonteiseksi.
Tuloja koskevan kysymyksen operationalisoinnissa on usein järkevää tyytyä eri tavoin karkeistetun informaation saantiin. Tärkeää on tiedustella riittävän kattavasti erilaisia tulonlähteitä luotettavan tiedon saamiseksi kokonaistuloista. Perustaustamuuttujan kannalta ei ole niinkään tärkeää tietää mistä lähteistä rahaa tulee (mm. palkkatuloista, veronalaisista sosiaalietuuksista ja verottomista tulonsiirroista), vaan kuinka paljon sitä tulee yhteensä.
On erittäin tärkeää ilmoittaa hyvin selvästi, koskeeko kysymys brutto- vai nettotuloja. Nettotulojen kysymistä puoltaa se, että ne muistettaneen kuukausitasolla parhaiten, ja niitä kysyttäessä verottomat tulonsiirrot, kuten lapsilisät, vertautuvat mutkitta muihin tuloihin.
Lisäksi tuloja koskevan kysymyksen sanamuodoissa ei pidä sortua pikkutarkkuuteen. Monien vastaajien ja heidän kotitalouksiensa tulot vaihtelevat paljon, eivätkä vastaajat aina muista tai edes tiedä tarkalleen tulojaan. Liian yksityiskohtainen tiedusteleminen voi myös herättää vastaajassa huolta siitä, että hänet voidaan mahdollisesti tunnistaa aineistosta.
Siksi kysymys laaditaan usein strukturoiduin vastausvaihtoehdoin. Vastauskategorioiden määrä ja sisältö tulisi laatia siten, että ne sallivat vertailun tulotilastoihin, mahdollistavat tarpeelliset uudelleenryhmittelyt myös pieni- ja suurituloisten ryhmissä, ja takaavat riittävän tunnistamattomuuden hyvin vähän tai paljon tienaaville. Viimeksi mainittu tavoite voidaan toteuttaa laatimalla äärivastauskategoriat sisällöllisesti tarpeeksi laajoiksi, jolloin esimerkiksi ylimpään tuloluokkaan sijoittuu riittävä määrä aineiston vastaajia.
Edellä mainitut näkökohdat on pyritty ottamaan huomioon seuraavassa kysymysesimerkissä, joka on laadittu European Social Surveyn (2002) käyntikyselyn tulokysymyksen pohjalta. Omatoimisesti täytettävässä lomakkeessa mukaan kannattaa lisätä kuukausitulojen keskimääräisyyttä painottava huomautus sekä joitakin tarkentavia vastausohjeita.
Kysymysesimerkki (Suomen ESS2002/2003, FSD1303):
Kotitalous voi saada tuloja palkoista, omasta yrityksestä, eläkkeistä, työttömyysturvasta, muista sosiaalietuuksista tai pääomatuloista.
Jos laskette yhteen kotitaloutenne kaikki tulot, kuinka paljon kotitaloutenne nettotulot (tulot verojen jälkeen) yhteensä kuukaudessa ovat? Jos ette tiedä tarkkaa lukua, voitte kertoa arvionne.
Kotitalouteni yhteenlasketut tulot veroja vähentämättä ovat keskimäärin kuukaudessa
1 Alle 500 euroa
2 500-999 euroa
3 1000-1499 euroa
4 1500-1999 euroa
5 2000-2499 euroa
6 2500-2999 euroa
7 3000-4999 euroa
8 5000-7499 euroa
9 7500-10000 euroa
10 Yli 10 000 euroa
Tilastokeskuksen taulukot kotitalouksien tuloista perustuvat tulonjakotilastoon. Henkilökohtaisten tulojen taulukot perustuvat puolestaan veronalaisiin tuloihin. Tilastokeskuksen tulonjakotilaston ja veronalaisten tulojen sivuilla on myös kuvattu taulukoissa käytetyt käsitteet ja määritelmät.
Perheasema ja siviilisääty
Myös kyselyvastaajien perheasemalla ja siviilisäädyllä on olennaista merkitystä useiden sosiaalitutkimuksen tutkimusongelmien kannalta. Seuraavassa asiaa lähestytään aluksi virallisten tilastoluokitusten näkökulmasta. Lisäksi annetaan esimerkkejä kyselylomakkeisiin soveltuvista kysymystyypeistä.
Tilastokeskuksen siviilisäädyn tilastoluokituksen määritelmän mukaan "henkilön siviilisäädyllä tarkoitetaan Suomen avioliitto- tai parisuhdelain mukaista asemaa." Nykyisessä siviilisäädyn tilastoluokituksessa otetaan huomioon myös samaa sukupuolta olevien rekisteröidyt parisuhteet.
Oikeudellinen luokitus soveltuu kuitenkin vain harvoin sellaisenaan kyselylomakkeen taustakysymykseksi. Avoliitossa elävät eivät löydä siitä itselleen tuttua luokkaa 'avoliitossa'. Perheasemaa koskeva tilastoluokitus sen sijaan ottaa avoliitossa elävät huomioon, ja samalla perheaseman luokitus koskee siviilisäätyyn verrattuna laajemmin vastaajan asumista ja perhesuhteita.
Tilastokeskuksen luokituksessa perheasema on määritelty näin: "Perheen muodostavat yhdessä asuvat avio- tai avoliitossa olevat henkilöt ja heidän lapsensa, jompikumpi vanhemmista lapsineen sekä avio- ja avopuolisot, joilla ei ole lapsia. Perheessä voi olla korkeintaan kaksi perättäistä sukupolvea. Vanhempiensa kanssa asuva henkilö luokitellaan lapseksi siviilisäädystä riippumatta, jos hänellä itsellään ei ole asuntokunnassa puolisoa tai lapsia."
Omatoimisesti täytettävissä kyselylomakkeissa on tavallista lisätä avoliitto yhdeksi lisävaihtoehdoksi siviilisäädyn "vanhaan" tilastoluokitukseen. Rekisteröityjä parisuhteita koskevia luokkia ei sen sijaan kannattane automaattisesti lisätä siviilisäätyä koskevaan taustakysymykseen. Ne kannattaa ottaa mukaan, jos asialla on tutkimuksen kysymyksenasettelujen ja suunniteltujen analysointitapojen kannalta olennaista merkitystä. Kansainvälisessä ISSP-vertailututkimuksessa siviilisäädyn lomakekysymys on muotoiltu näin:
Kysymysesimerkki (Suomen ISSP 2003, FSD0121):
Oletteko tällä hetkellä... (Rengastakaa vain yksi vaihtoehto.)
1 Naimaton
2 Avioliitossa
3 Avoliitossa
4 Asumuserossa
5 Eronnut
6 Leski
7 Muu
Lisäksi ISSP-vertailututkimusohjelman standarditaustamuuttujissa vastaajilta tiedustellaan, asuvatko he yhdessä puolison tai vakituisen elämänkumppanin kanssa. Tämä on sikäli hyödyllinen kysymys, että puolisot eivät aina välttämättä asu samassa kotitaloudessa.
Kysymysesimerkki (Suomen ISSP 2003, FSD0121):
Asutteko nykyisin yhdessä puolison tai vakituisen elämänkumppanin kanssa?
1 Kyllä
2 Ei
Vastaajan perheaseman tiedustelussa ei ole välttämättä tähdättävä perheaseman tilastoluokitusta täydellisesti vastaavaan informaatioon. Useissa kyselyissä suurin piirtein samaa asiaa tiedustellaan elinvaihetta koskevalla kysymyksellä, johon ei ole tarpeen sisällyttää esimerkiksi laitoshoitoa kuvaavaa vaihtoehtoa:
Kysymysesimerkki (Kunnallisalan ilmapuntari 1992: kuntalaiset, FSD1147):
Mihin elinvaiheeseen kuulutte?
1 Naimaton, asun vanhempien luona
2 Asun yksin
3 Naimisissa/avopari, ei lapsia
4 Naimisissa/avopari, on lapsia
5 Yksinhuoltaja, aikuinen, asun lasten kanssa
6 Pariskunta, lapset eivät asu kotona
7 Jokin muu
Perheenjäseniä ja perhesuhteita koskevien piirteiden tiedusteluun on yleensä käytettävä useita erillisiä kysymyksiä. Yksityiskohtaisinta informaatiota saadaan kysymyksistä, joissa vastaajaa pyydetään kertomaan perustietoja kotitaloutensa kunkin perheenjäsen perheasemasta. Näin on menetelty muun muassa European Social Surveyn taustamuuttujissa. Ks. tarkemmin esim. Suomen ESS 2002/2003-aineiston (FSD1303) kyselylomake.
ISSP-tutkimuksissa kotitaloudessa asuvien henkilöiden lukumäärää, lasten lukumäärää ja heidän ikäänsä on puolestaan tiedusteltu seuraavilla kysymyksillä:
Kysymysesimerkki: (Suomen ISSP 2006, FSD2248):
Kuinka monta henkilöä kotitaloudessanne asuu? Yhteensä _____ henkilöä
Heistä on 18-vuotiaita tai sitä vanhempia aikuisia _____ henkilöä
Heistä on 7-17-vuotiaita lapsia tai nuoria _____ henkilöä
Heistä on 6-vuotiaita tai sitä nuorempia lapsia _____ henkilöä
Kotitaloudessa asuvien alle 18-vuotiaiden lasten syntymävuodet: ________________________
Kaikkiaan perhesuhteiden ja asumisjärjestelyjä koskevien kysymysten sisältö ja tarkkuustaso on mitoitettava tutkimuksen aiheeseen ja tavoitteisiin. Jos käyttötarve on vähäistä ja nimenomaan taustoittavaa, riittänee korkeintaan pari peruskysymystä aiheesta vastaamaan tarpeisiin. Jos taas perheen koosta, perheenjäsenten henkilöominaisuuksista ja asumisjärjestelyistä halutaan tarkkaa tietoa, on hyvä tiedostaa, että kysymykset vievät vastausaikaa ja tilaa kyselyssä melko paljon. Tilastokeskuksen sivuilla on paljon tietoa myös perheistä Suomessa.
Kieli ja etninen ryhmä
Kieli on perustava henkilötieto ja se on monin tavoin keskeinen muuttuja myös sosiaalitutkimuksessa. Kieleen liittyy perusoikeuksia ja se määrittää henkilön kulttuurista elinympäristöä. Suomen lukumäärältään suurin kielivähemmistö puhuu ruotsia (noin 5,5 % väestöstä: Tilastokeskus: Suomen väestö 2006). Ruotsin kieli on suomen rinnalla toinen maamme ns. kansalliskielistä.
Vahvemmin kieli on sidoksissa etnisyyteen ja kulttuurin omaleimaisuuteen kahdessa muussa maamme vähemmistökielessä, jotka mainitaan perustuslaissa. Saamea puhuvia on parisen tuhatta eli 0,03 prosenttia (TK: Suomen väestö 2006). Romanikielen puhujien tarkka määrä ei ole tiedossa. Romaniasiain neuvottelukunnan mukaan romaneja on maassamme noin 10 000. Myös viittomakieli on mainittu perustuslaissa vähemmistökieleksi. Kaikkiaan Suomessa on yli 50 kieltä, joita puhuu äidinkielenään vähintään sata henkilöä. Kielten historiallista ja nykyistä asemaa suomalaisessa yhteiskunnassa selvittää seikkaperäisesti mm. Kielilakikomitea 2000:n työryhmämuistio ja Valtioneuvoston kertomus kielilainsäädännön soveltamisesta 2006.
Kielen kulttuuriset vaikutukset korostuvat, kun samaa kieltä puhuvat asuvat verraten yhtenäisillä kielialueilla. Suomessa ruotsia puhutaan erityisesti Uudenmaan, Turunmaan ja Pohjanmaan rannikkoseuduilla. Svenska Finlands Folkting -järjestön yleiskatsaus suomenruotsalaisiin antaa tiiviin kuvan Suomen ruotsinkielisten yhteiskunnallisesta asemasta.
Kyselytutkimuksissa vastaajan kieli on yleensä hyvä sisällyttää yhdeksi aineiston taustamuuttujaksi. Jos aineistonkeruuresurssit suinkin sallivat, on ruotsia äidinkielenään puhuville suotavaa tarjota ruotsiksi käännetty kyselylomake saatteineen. Valtaosa tyypilliseen kyselyotokseen valikoituneista ruotsikielisistä osaa kyllä vastata kyselyyn myös suomeksi, mutta mahdollisuus osallistua tutkimukseen omalla äidinkielellä lisää varmasti myös vastaushalukkuutta.
Jos ruotsinkielisiä on tarkoitus tarkastella kyselytutkimuksessa omana ryhmänään, on tämä otettava huomioon otoksen suunnittelussa. Joissakin tutkimuksissa (esim. Eduskuntavaalitutkimus 2003, FSD1260 ja Suomen World Values Survey 2005, FSD2118) on päädytty ruotsinkielisen väestön yliotoksiin vastaajien lukumäärän nostamiseksi, jotta aineiston tilastollinen luotettavuus kohenisi.
Ulkomailla syntyneitä henkilöitä asuu Suomessa alle 200 000 (Tilastokeskus: Suomen väestö 2006). Maahanmuuttajia on toistaiseksi tutkittu tarkemmin vain erillistutkimuksissa. Ensimmäinen laaja maahanmuuttajien elinoloja kuvaava tutkimus tehtiin Suomessa vuonna 2002. Tilastokeskus keräsi tiedot haastattelemalla ja postikyselynä. Tutkimuksessa selvitettiin venäläisten, virolaisten, somalialaisten ja vietnamilaisten elämää. Maahanmuuttajien elinolotutkimus tehtiin pääasiassa pääkaupunkiseudulla, jossa valtaosa maahanmuuttajista asuu. Tutkimuksessa selvitettiin muun muassa vastaajien terveydentilaa, koulutusta, kielitaitoa, työtä ja sosiaalisia suhteita.
Kunta ja alueet
Kyselytutkimuksissa ollaan usein kiinnostuneita myös tutkittavien asuinpaikasta tai työssäkäyntikunnasta. Aluetta voidaan tiedustella useilla eri tavoilla ja tarkkuuksilla. Vastaajien tunnistettavuusriski kasvaa, kun alue tarkentuu. Usein käytettyjä ovat kunta, postinumero, lääni, maakunta ja suuralue. Oman kyselyn koodaamisessa kannattaa käyttää yleisesti käytössä olevia luokitteluja. Tilastokeskuksen alueluokitus-sivuilla kuvataan yksityiskohtaisesti 12 eri luokitusta.
Tilastoissa käytettävien alueluokitusten tarkoituksena on kuvata ilmiöiden alueellisia vaihteluja ja yleisesti aluerakennetta. Tilastoissa käytetään pääasiallisena aluejakona Euroopan unionin virallista NUTS-alueluokitusjärjestelmää, jonka mukaisesti laaditaan kaikki EU:n yhteiset alueelliset tilastot. NUTS-luokitusta käytetään myös EU:n aluepolitiikan kohdentamisessa. NUTS (Nomenclature des Unités Territoriales Statistiques) on viisitasoinen hierarkinen alueluokitus. Suomen NUTS- aluejaossa Manner-Suomi ja Ahvenanmaa muodostavat NUTS 1- aluetason, suuralueet NUTS 2- , maakunnat NUTS 3- , seutukunnat NUTS 4- ja kunnat NUTS 5- tason.
EU:n tilastotoimistoon Eurostatiin toimitettavissa tilastoissa yleisin on NUTS 2-taso, suuralueet, jolla pyritään tuottamaan kaikki alueellinen tieto. Suomi jakaantuu suuralueiksi seuraavasti: 1) Uusimaa, 2) Etelä-Suomi, 3) Itä-Suomi, 4) Väli-Suomi, 5) Pohjois-Suomi ja 6) Ahvenanmaa. Suuralueet on muodostettu kunnittain. Kuntajako löytyy Tilastokeskuksen kotisivuilta.
Muita yleisiä tilastoissa käytettäviä kuntapohjaisia alueluokituksia ovat tilastollinen kuntaryhmitys, työvoima- ja elinkeinokeskukset sekä tilastolliset työssäkäyntialueet. Kuntatyypittelyjä ovat mm. kalleusluokitus, kantokykyluokitus, kielisuhdeluokitus, kuntamuotoluokitus sekä EU:n tavoitealueet ja kansallisen kehitysalueen tukialueet.
Tilastollisten alueluokitusten ohella tutkimuksessa käytetään monesti jaotteluja, joiden avulla pyritään erottamaan kaupungit ja maaseutu. Tällöin yleinen tapa luokitella Suomi alueiksi, on ensin erottaa pääkaupunkiseutu omaksi alueeksi, sitten muut suuret kaupungit yhdeksi alueeksi (yli 100 000 asukasta), kolmanneksi muut kaupungit, neljänneksi taajamat ja lopulta haja-asutusalueet omaksi alueekseen.
Varsin käyttökelpoinen tapa alueellisten erottelujen tekemiseen on kysyä vastaajan postinumeroa. Tämä mahdollistaa hyvin monipuolisten luokittelujen käytön moniin eri tarkoituksiin. On myös huomion arvoista, että usein isojenkin suomalaisten kyselytutkimusten perusjoukkona on 'vain' manner-Suomen väestö.
Omaa asuinaluetta luonnehtivia kyselymuuttujia:
Kysymysesimerkki (Kaupunkipalvelututkimus 2001, FSD1205):
Mikä on postinumeronne? (viidellä numerolla) __ __ __ __ __
Kysymysesimerkki (KuntaSuomi 2004 : kuntatyöyhteisötutkimus 2003, FSD1315):
Kunnan nimi:_________________________
Kysymysesimerkki (Tiedebarometri 2004, FSD2023):
Maakunta, jonka alueella asutte
1 Uusimaa
2 Itä-Uusimaa
3 Varsinais-Suomi
4 Satakunta
5 Häme
6 Pirkanmaa
7 Päijät-Häme
8 Kymenlaakso
9 Etelä-Karjala
10 Etelä-Savo
11 Pohjois-Savo
12 Pohjois-Karjala
13 Keski-Suomi
14 Etelä-Pohjanmaa
15 Vaasan rannikkoseutu (Pohjanmaa)
16 Keski-Pohjanmaa
17 Pohjois-Pohjanmaa
18 Kainuu
19 Lappi
Kysymysesimerkki (Perhebarometri 2000, FSD1114):
Asuinlääninne
1 Etelä-Suomen lääni
2 Länsi-Suomen lääni
3 Itä-Suomen lääni
4 Oulun lääni
5 Lapin lääni
Kysymysesimerkki (Suomen ESS 2004/2005, FSD2116):
Mikä seuraavista luonnehdinnoista parhaiten kuvaa asuinympäristöänne?
1 Suuri kaupunki (yli 100 000 asukasta)
2 Suuren kaupungin lähiö tai lähiseutu (suuren kaupungin vaikutusalueella / työssäkäyntialueella)
3 Pieni tai keskikokoinen kaupunki tai kunta (20 000-100 000 as.)
4 Pienempi taajama tai kunta (alle 20 000 asukasta)
5 Maaseutu (haja-asutusalue)
Muita uskontoon, kansalaisosallistumiseen, terveyteen sekä sairauteen liittyviä taustamuuttujia
Kyselyaineistoissa käytetään lisäksi monia muita taustamuuttujia. Tässä on niistä joitakin esimerkkejä.
Uskonto ja uskonnollisuus
ISSP- ja WVS- aineistoissa on joitakin uskontoaiheisia muuttujia.
Kysymysesimerkki (Suomen ISSP 2004, FSD2039):
Kuulutteko johonkin kirkkoon tai uskonnolliseen yhteisöön? Rengastakaa sopivin vaihtoehto.
1 Evankelis-luterilaiseen kirkkoon
2 Ortodoksiseen kirkkoon
3 Muuhun kristilliseen kirkkoon tai yhteisöön
4 Muuhun uskonnolliseen yhteisöön
5 En kuulu kirkkoon tai muuhun uskonnolliseen yhteisöön
Kysymysesimerkki (Suomen World Values Survey 2000, FSD0154):
Jos ei huomioida häitä, hautajaisia ja ristiäisiä, kuinka usein käytte kirkossa/uskonnollisissa tilaisuuksissa?
1 Useammin kuin kerran viikossa
2 Kerran viikossa
3 Kerran kuukaudessa
4 Jouluna/pääsiäisenä
5 Muina erityisinä pyhäpäivinä
6 Kerran vuodessa
7 Harvemmin
8 Käytännössä en koskaan
9 EOS
10 Ei vastausta
Kansalaisosallistuminen
Useissa kyselytutkimuksissa taustamuuttujina tarkastellaan tutkittavan poliittista osallistumista, äänestyskäyttäytymistä ja yhdistysjäsenyyksiä.
Kysymysesimerkki (Suomen ESS 2004/2005, FSD2116):
Jotkut ihmiset jättävät nykyään syystä tai toisesta äänestämättä. Äänestittekö Te viime eduskuntavaaleissa maaliskuussa 2003?
1 Kyllä
2 En
3 Ei äänioikeutettu
Kysymysesimerkki (EVAn kansallinen asennetutkimus 2004, FSD2078):
Jos eduskuntavaalit pidettäisiin nyt, minkä puolueen ehdokasta äänestäisitte?
1 KESK
2 SDP
3 KOK
4 Vasemmistoliitto
5 Vihreät
6 RKP
7 Kristillisdemokraatit
8 Perussuomalaiset
9 Jokin muu puolue tai ryhmittymä
10 En äänestäisi lainkaan
11 En osaa sanoa
12 En halua sanoa
Kysymysesimerkki (Suomen ISSP 2004, FSD2039):
Oletteko jonkin ammattiliiton jäsen?
1 Olen tällä hetkellä jäsen
2 Olen ollut jäsen, en ole enää
3 En ole koskaan ollut jäsen
Terveys ja sairaus
Kyselytutkimusten taustamuuttujina käytetään myös terveys- ja sairausaiheisia muuttujia. THL:n koodistopalvelu tuottaa ja ylläpitää sosiaali- ja terveydenhuollon keskeisimpiä luokituksia, kuten tautiluokitus ICD-10 ja eri koodistot.
Kysymysesimerkki (Korkeakouluopiskelijoiden terveystutkimus 2000, FSD2051):
Millainen on terveydentilasi omasta mielestäsi?
1 Hyvä
2 Helko hyvä
3 Keskitasoinen
4 Melko huono
5 Huono
Kysymysesimerkki (Toimeentulotukiasiakkaiden elinolot ja sosiaalityö 1987, FSD1320):
Onko sinulla jokin pysyvä sairaus tai ruumiillinen vamma, joka on vähentänyt työkykyäsi tai pakottanut sinut vaihtamaan ammattia?
1 Ei ole
2 Kyllä on, mikä?______________________________________
Lähteet ja lisätiedot:
- Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. Helsink: WSOY.
- Alastalo, Marja (2005). Metodisuhdanteiden mahti. Lomaketutkimus suomalaisessa sosiologiassa 1947-2000. Tampere: Vastapaino.
- Harmonised Concepts and Questions for Social Data Sources. Primary Standards. Demographic information, household composition and relationships. Version 1.0. Titchfield: Office for National Statistics, June 2004. http://www.statistics.gov.uk/about/data/harmonisation/downloads/p2.pdf
- Julkisen hallinnon tietohallinnon neuvottelukunta (JUHTA): http://www.intermin.fi/juhta
- Kansalliskielten historiallinen, kulttuurinen ja sosiologinen tausta. Nationalspråkens historiska, kulturella och sociologiska bakgrund. Kielilakikomitea 2000. Työryhmämuistio. Helsinki: Oikeusministeriö.
- Key variables in social investigation (1986). Ed. Robert G. Burgess. London: Routledge & Kegan Paul.
- Kinnunen, Merja (2001). Luokiteltu sukupuoli. Tampere: Vastapaino.
- Lampinen, Osmo (2003). Suomen koulutusjärjestelmän kehitys. Helsinki: Gaudeamus.
- Lempiäinen, Kirsti (2003). Sosiologian sukupuoli. Tutkimus Helsingin ja Tampereen yliopistojen sosiologian kurssikirjoista 1946-2000. Tampere: Vastapaino.
- Opetushallitus: http://www.oph.fi/
- Opintoluotsi: http://www.opintoluotsi.fi/
- Maahanmuuttajien elinolot. Venäläisten, virolaisten, somalialaisten ja vietnamilaisten elämää Suomessa 2002 (2003). Helsinki: Tilastokeskus.
- Myrskylä, Pekka (2002). Suuret ikäluokat liikkeessä. Hyvinvointikatsaus 1/2002, 2-7.
- Suomen romanit. Finitiko romaseele (2004). Helsinki: Sosiaali- ja terveysministeriö. Sosiaali- ja terveysministeriön esitteitä 2004:2.
- Suomenruotsalaiset (2003). Helsinki: Svenska Finlands folkting.
- Tilastokeskus: http://www.tilastokeskus.fi/
- Toivonen, Timo (1999). Empiirinen sosiaalitutkimus. Filosofia ja metodologia. Porvoo: WSOY.
- Valtioneuvoston kertomus kielilainsäädännön soveltamisesta 2006. Helsinki: Oikeusministeriö.