KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi.Katso päivitetyt SPSS-harjoitukset.

Hypoteesien testaus - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Tässä harjoituksessa käytetään havaintoaineistona vuoden 1996 World Values Survey -tutkimuksen Suomen osa-aineistoa.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Hypoteesien testaus - Parametriset testit

» osaWVS-aineisto | Harjoitusaineistot

- T-testi
- Yhden otoksen t-testi
- Kahden riippumattoman otoksen t-testi
- Kahden riippuvan otoksen t-testi

Tässä SPSS-harjoituksessa käydään läpi muutamia yleisimpiä hypoteesitestejä aineiston analysoinnissa. Jos testi vaatii, että perusjoukko noudattaa jotain tiettyä todennäköisyysjakaumaa (erityisesti normaalijakaumaa), sanotaan testiä parametriseksi testiksi. Jos jakaumaoletusta ei ole, testiä kutsutaan ei-parametriseksi testiksi (nonparametric). Parametriset testit ovat tehokkaampia ja mikäli oletukset ovat voimassa, niitä kannattaa käyttää. Ei-parametrisia testejä käsitellään harjoituksessa kaksi.

T-testi

T-testiä voidaan soveltaa ainoastaan jos otos on poimittu perusjoukosta, joka on normaalijakautunut. Ennen testin käyttöä tulisi testata perusjoukon normaalisuus. T-testiä voidaan käyttää yhden otoksen keskiarvon testaamiseen, kahden riippumattoman otoksen tai kahden riippuvan otoksen keskiarvojen yhtäsuuruuden testaamiseen. Riippuvilla otoksilla käytännössä tarkoitetaan mittaustilannetta, jossa samoja koehenkilöitä mitataan jonkin ajan kuluttua uudestaan.

Yhden otoksen t-testi

Yhden otoksen t-testissä nollahypoteesina (H0) on, että tarkasteltavan muuttujan keskiarvo on yhtä kuin X, missä X on tutkijan määrittelemä testattava arvo. Vastahypoteesi (H1) on tällöin kaksisuuntaisessa testissä: muuttujan keskiarvo on erisuuri kuin X.

Testataan SPSS-ohjelmistolla World Values Survey 1996 -aineiston muuttujan v91 'Mikä on mielestänne perheen ihanteellinen lapsilukumäärä' avulla, onko tutkimuspopulaation ihanteellisen lapsilukumäärän keskiarvo yhtä kuin 3. Analyysi aloitetaan muodostamalla muuttujan v91 avulla uusi muuttuja la_lkm, jossa keskiarvoa vääristävä vastausvaihtoehto 9 'Ei vastausta' muutetaan puuttuvaksi tiedoksi. Muuttujan selitteeksi annetaan 'Ihanteellinen lasten lukumäärä'. (Ks. muuttujamuunnokset ja puuttuvan tiedon käsittely. SPSS-toteutus, ks. muuttujien uudelleen koodaaminen.)

Valitaan tämän jälkeen valikosta Analyze - Compare Means - One-Sample T Test... .

One-Sample T Test

Avautuvasta ikkunasta (Kuva 1) valitaan hiirellä edellä muodostettu tarkasteltava muuttuja la_lkm ja siirretään se keskellä olevaa nuolta näpäyttämällä Test Variable(s): -laatikkoon. Test Value: -laatikkoon kirjoitetaan testattava keskiarvo 3 ja painetaan OK-näppäintä. Options... -näppäintä painamalla voi määritellä laskettavan luottamusvälin (oletus 95%) sekä puuttuvien tietojen käsittelyn.

Muuttujien ja testiarvon määrittely

Kuva 1. Muuttujien ja testiarvon määrittely

Tulostaulukot (Kuva 2) tulostuvat tulosikkunaan. Otoksen keskiarvo on 2.60, t-testisuureen arvo on -10.485 vapausastein 914 ja p-arvo on 0.000, joten nollahypoteesi hylätään yleisimmillä riskitasoilla (1%, 5%). Tutkimuspopulaation ihanteellisen lapsilukumäärän keskiarvon ero testattavaan arvoon 3 on tilastollisesti erittäin merkitsevä.

Tulostaulukot

Kuva 2. Yhden otoksen t-testin tulostaulukot

Kahden riippumattoman otoksen t-testi

Kahden riippumattoman otoksen t-testissä nollahypoteesina (H0) on, että tarkasteltavan muuttujan keskiarvo on yhtäsuuri kummassakin riippumattomassa tarkasteluryhmässä. Vastahypoteesi (H1) on tällöin kaksisuuntaisessa testissä: muuttujan keskiarvot ryhmissä ovat erisuuret.

Testataan samaa muuttujaa kuin yhden otoksen t-testissäkin eli World Values Survey 1996 aineiston muuttujaa v91 'Mikä on mielestänne perheen ihanteellinen lapsilukumäärä', mutta nyt verrataan sukupuoliryhmien eroa.

Nollahypoteesi on tällöin: Ihanteellisen lapsilukumäärän keskiarvo on yhtäsuuri sekä miehillä että naisilla.

Vastahypoteesi on: Miesten ja naisten ihanteellisen lapsilukumäärän keskiarvot ovat erisuuret.

Käytetään jälleen muuttujaa la_lkm, jossa keskiarvoa vääristävä vastausvaihtoehto 9 = 'Ei vastausta' on muutettu puuttuvaksi tiedoksi. (Ks. tämän harjoituksen edellinen kohta.) Valitaan tämän jälkeen valikosta Analyze - Compare Means - Independent-Samples T Test... . Avautuneessa ikkunassa (Kuva 3) valitaan muuttujat la_lkm Test Variable(s): -laatikkoon ja sukupuoli (v214) Grouping Variable: -laatikkoon. Define Groups... -näppäimellä määritellään sukupuolimuuttujan vastausvaihtoehdot (1 ja 2) ryhmät määrääviksi arvoiksi. Options-näppäintä painamalla voi määritellä laskettavan luottamusvälin (oletus 95%) sekä puuttuvien tietojen käsittelyn.

Muuttujien valinta

Kuva 3. Muuttujien valinta

Painamalla OK-näppäintä tulostaulukot (Kuva 4) ilmestyvät tulosikkunaan. Ylemmästä taulukosta huomaamme, että miehillä keskiarvo on 2.52 ja naisilla 2.69. SPSS laskee Levenen testin varianssin yhtäsuuruudelle. Levenen testin nollahypoteesi yhtäsuuristä variansseista jää voimaan (p = 0.880), joten voimme tarkastella riviä "Equal variances assumed" alemmasta tulostaulukosta. T-testisuureen arvoksi saadaan -2.262 vapausastein 913 ja p-arvo on 0.024, joten nollahypoteesi hylätään 5%-riskitasolla. Tutkimuspopulaatiossa miesten ja naisten ihanteellisen lapsilukumäärän keskiarvojen ero on siis tilastollisesti merkitsevä.

Tulostaulukot

Kuva 4. Testin tulostaulukot

Kahden riippuvan otoksen t-testi

Riippuvilla otoksilla käytännössä tarkoitetaan mittaustilannetta, jossa samoja koehenkilöitä mitataan jonkin ajan kuluttua (jonkin "käsittelyn" jälkeen) uudestaan.

Kahden riippuvan otoksen t-testissä nollahypoteesina (H0) on, että tarkasteltavien muuttujien (mittaustulosten) keskiarvot ovat yhtäsuuret. Vastahypoteesi (H1) on tällöin kaksisuuntaisessa testissä: muuttujien keskiarvot ovat erisuuret.

Käytämme esimerkkinä osaWVS-aineiston muuttujista v90 'Onko teillä lapsia? Jos on: Kuinka monta lasta?' ja jo tutusta v91 'Mikä on mielestänne perheen ihanteellinen lapsilukumäärä' muodostettuja muuttujia la_lkm0 ja la_lkm, joista keskiarvoa vääristävä vastausvaihtoehto 9 = 'Ei vastausta' on muutettu puuttuvaksi tiedoksi. Vanhemmat saisivat siis kuvitteellisen käsittelyn, jonka vaikutuksesta heidän nykyinen lapsilukumääränsä muuttuisi heidän mielestään ihanteelliseksi lapsilukumääräksi. Tutkitaan, onko tällaisella kuvitteellisella käsittelyllä vaikutusta.

Valitaan valikosta Analyze - Compare Means - Paired-Samples T Test... . Avautuneessa ikkunassa (Kuva 5) valitaan muuttujat la_lkm ja la_lkm0 Paired Variables -laatikkoon. Options-näppäintä painamalla voi jälleen määritellä laskettavan luottamusvälin (oletus 95%) sekä puuttuvien tietojen käsittelyn.

Muuttujien valinta

Kuva 5. Muuttujien valinta

Painamalla OK-näppäintä tulostaulukot (Kuva 6) ilmestyvät tulosikkunaan. Ylimmästä taulukosta huomaamme, että ihanteellisen lapsilukumäärän keskiarvo laskettuna 912 mittausparille (2.60) on korkeampi kuin nykyisten lasten lukumäärän keskiarvo (1.56). Keskihajonta on samaa suuruusluokkaa. Keskimmäisessä taulukossa on laskettu korrelaatiokerroin 0.417, joka tilastollisesti poikkeaa nollasta erittäin merkitsevästi (p = 0.000). Alimmassa taulukossa näemme tuloksen erotukselle ihanteellinen lasten lukumäärä - nykyinen lasten lukumäärä. Erotuksen keskiarvo on positiivinen (1.045) ja t-testin p-arvo on 0.000, joten kuvitteellisella käsittelyllä on tilastollisesti erittäin merkitsevä lapsia lisäävä vaikutus.

Tulostaulukot

Kuva 6. Testin tulostaulukot


viimeksi päivitetty 2014-04-08

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD