KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas

Varianssianalyysi - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Tässä demonstraatiossa käytetään vuoden 1996 World Values Survey -tutkimuksen Suomen osa-aineistoa.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Varianssianalyysi

» osaWVS-aineisto | Harjoitusaineistot

Varianssianalyysissa tutkitaan laatueroasteikollisten selittävien muuttujien ja mitta-asteikollisen selitettävän muuttujan keskinäistä riippuvuutta. Yleensä tehdään seuraavat oletukset:

  • Havaintovirheet ovat riippumattomia,
  • normaalisesti jakautuneita ja
  • omaavat yhtäsuuret varianssit

Yksisuuntainen varianssianalyysi

Usean keskiarvon yhtäsuuruutta voidaan testata yksisuuntaisen varianssianalyysin avulla. Malli voidaan kirjoittaa kahdella tavalla.

Vaikutusten mallina kirjoitettuna se on

 yij = m + ai + eij

 H0 : ai = 0 kaikille i

missä y on selitettävä muuttuja, m yleiskeskiarvo ja a(i) luokittelevan muuttujan i:nnen luokan vaikutus muuttujan y keskiarvoon. Vaihtoehtoisena hypoteesina on, että ainakin jokin niistä poikkeaa nollasta. Nollahypoteesi testataan F-testillä, joka kahden ryhmän tapauksessa antaa täsmälleen saman tuloksen kuin yhtäsuurien varianssien t-testi (riippumattomat otokset).

Keskiarvojen mallina kirjoitettuna malli on

 yij = mi + eij

 H0 : m1 = m2 = ... = mk

Vaihtoehtoisena hypoteesina on nyt se, että ainakin jokin keskiarvoista poikkeaa toisista. Tavallista F-testiä käytettäessä joudutaan olettamaan havaintovirheiden varianssit yhtäsuuriksi. Viimeksimainitusta oletuksesta voidaan hieman tinkiä, jos käytetään Brown ja Forsythe'n tai Welchin testiä, jotka sallivat erisuuret ryhmittäiset varianssit.

Seuraavassa esimerkissä tutkitaan suomalaisten suhtautumista tuloerojen pienentämiseen tai niiden kasvattamiseen yksisuuntaisella varianssianalyysillä. Kyselyssä pyydettiin vastaajia kertomaan mielipiteensä jatkumolla 1-10, jossa pienet arvot kuvastivat vastaajan halua tasata tuloeroja pienemmäksi ja suuret arvot vastaajan halua lisätä tuloeroja (muuttuja V125). Asteikon ääripäitä kuvaavat tekstit olivat 1= "tulotaso pitäisi maassamme saada tasaisemmaksi" ja 10= "tarvitsemme suurempia tuloeroja palkitaksemme enemmän kansalaisten yritteliäisyyttä".

Selittävänä muuttujana esimerkissä on vastaajien oma näkemys siitä, mihin yhteiskuntaluokkaan he kuuluvat (muuttuja V226). Kysymyksessä annettiin vaihtoehdoksi viisi erilaista yhteiskuntaluokkaa: yläluokka, ylempi keskiluokka, alempi keskiluokka, ylempi työväenluokka ja alempi työväenluokka.

Ennen varianssianalyysin suorittamista selitettävästä muuttujasta (V125) koodataan arvo 99 'Ei osaa sanoa' puuttuvaksi tiedoksi. Arvo 99 vaikuttaisi oleellisesti ryhmäkeskiarvoihin ja täten vääristäisi tuloksia. Selittävän muuttujan (V226) vaihtoehto 9 'Ei osaa sanoa' koodataan myös puuttuvaksi tiedoksi. Koska vastaajista vain neljä määritteli itsensä yläluokkaan kuuluvaksi (V226), on seuraavassa analyysissa vaihtoehdot yläluokka ja ylempi keskiluokka yhdistetty RECODE-komennolla.

SPSS ohjelmistossa yksisuuntainen varianssianalyysi aloitetaan valikosta Analyze - Compare Means - One-Way ANOVA...

Varianssianalyysi

Seuraavassa ikkunassa valitaan selitettävät muuttujat (Dependent list) ja selittävä muuttuja (Factor).

Varianssianalyysi - muuttujien valinta

Options -valinnoista lisäämme Descriptive valinnan, jolla saamme tulostukseen taulukon kuvailevista tunnusluvuista. Homogeneity-of-variance valinnalla testataan varianssien yhtäsuuruutta

Varianssianalyysi - options

Klikkaamalla Continue ja OK, saamme tulokseksi yksinkertaisen varianssianalyysin tulokset.

Varianssianalyysi - tulokset

Taulusta Descriptives nähdään mm. ryhmittäiset jakaumat (N), keskiarvot (Mean), keskihajonnat (Std. Deviation) ja keskiarvojen keskivirheet (Std. Error).

Tauluun Test of Homogeneity of Variances saadaan varianssien yhtäsuuruustesti. Testi osoittaa, että nollahypoteesi jää voimaan eli ryhmittäiset varianssit ovat yhtäsuuria, joten keskiarvotestin oletus yhtäsuurista ryhmävariansseista on voimassa.

Taulun Anova F-testiluku (24.794) ja siihen liittyvä p-arvo (Sig.) kuvaavat ryhmien välisten erojen tilastollista merkitsevyyttä. Koska p-arvo on pienempi kuin yleisesti raja-arvona pidetty 0.05, voidaan nollahypoteesi ryhmäkeskiarvojen samansuuruisuudesta hylätä. Toisin sanoen eri yhteiskuntaluokkiin subjektiivisesti kuuluvien välillä on eroja suhtautumisessa tuloeroihin. Korkeimpiin yhteiskuntaluokkiin itsensä sijoittavat suomalaiset ovat valmiimpia hyväksymään suuret tuloerot ja yritteliäisyyden palkitsemisen kuin alempiin yhteiskuntaluokkiin kuuluvat.

Lisäämällä lomakkeen Post Hoc -painikkeen kautta parittaiset vertailutestit saamme testattua, mikä ryhmistä on toisista poikkeava. Seuraavassa valitsimme Bonferroni-testin. Ohjelma tulostaa vertailutestit.

Varianssianalyysi - parittaiset vertailutestit

Testeissä verrataan siis kunkin ryhmän keskiarvoa erikseen kaikkiin muihin. Eli esimerkiksi ylempi keskiluokka ja alempi työväenluokka eroavat merkitsevästi kaikista muista luokista. Alempi keskiluokka ja ylempi työväenluokka eivät eroa merkitsevästi toisistaan tuloeromielipiteissään.

Kaksi- ja useampiulotteiset varianssianalyysit ovat mahdollisia mm. ANOVA-, MANOVA-, GLM- ja UNIANOVA-syntaksikomentojen kautta.


viimeksi päivitetty 2014-04-11

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD