KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi.Katso päivitetyt SPSS-harjoitukset.

Hypoteesien testaus - SPSS-harjoitus 2

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Tässä harjoituksessa käytetään havaintoaineistona vuoden 1996 World Values Survey -tutkimuksen Suomen osa-aineistoa.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Hypoteesien testaus - Ei-parametriset testit

» osaWVS-aineisto | Harjoitusaineistot

- Khii-toiseen yhteensopivuustesti
- Kahden riippumattoman otoksen testit
- Usean riippumattoman otoksen testit

Tässä SPSS-harjoituksessa käydään läpi muutamia yleisimpiä hypoteesitestejä aineiston analysoinnissa. Jos testi vaatii, että perusjoukko noudattaa jotain tiettyä todennäköisyysjakaumaa (erityisesti normaalijakaumaa), sanotaan testiä parametriseksi testiksi. Jos jakaumaoletusta ei ole, testiä kutsutaan ei-parametriseksi testiksi (nonparametric). Parametriset testit ovat tehokkaampia ja mikäli oletukset ovat voimassa, niitä kannattaa käyttää. Parametrisia testejä käsitellään harjoituksessa yksi.

Khii-toiseen yhteensopivuustesti

Khii-toiseen -yhteensopivuustesti ( tai chi-square) vertaa muuttujan jakaumaa hypoteesin mukaisiin frekvensseihin, oletushypoteesijakaumana SPSS käyttää tasajakaumaa. Nollahypoteesina on, että tarkasteltava jakauma noudattaa hypoteesijakaumaa. (Ks. lisäksi khii-toiseen testistä ristiintaulukoinnissa.)

Tutkitaan World Values Survey 1996 aineiston muuttujan v210 'Jos nyt pidettäisiin eduskuntavaalit, mitä puoluetta äänestäisit' avulla, noudattaako aineistosta laskettava puolueiden kannatusjakauma Suomen Gallupin lokakuussa 1996 tekemää kannatustutkimusta, jossa puolueiden kannatus oli seuraava:

puolue kannatus (%)
SDP 26.7
KESK 20.5
KOK 18.8
VAS 10.7
VIHR 6.7
RKP 4.8
NUSU 2.8
MUUT 9.0

Muodostetaan muuttujan v210 avulla uusi muuttuja puka, johon sisällytetään vain em. Gallupin mainitsemat puolueet ja luokitellaan vastausvaihtoehdot 7 'SKL', 9 'PS', 10 'Jokin muu ryhmittymä' uuden muuttujan luokkaan 9 'MUUT'. Vastausvaihtoehdot 11 'Ei äänestäisi', 12 'Ei halua sanoa' sekä 13 'Ei osaa sanoa' luokitellaan kaikki puuttuvaksi tiedoksi.

Seuraavaksi valikon Data - Select Cases... avulla rajataan aineisto vain äänestysikäisiin: v216 >= 18.

Aloita khii-toiseen yhteensopivuustesti valikosta Analyze - Nonparametric Tests - Legacy Dialogs - Chi-Square... . Siirrä puka-muuttuja Test Variable List: -laatikkoon (Kuva 7). Expected Range -kohdassa voidaan Use specified range -valinnalla määrätä tutkittavalle muuttujalle arvoalue, jonka arvoilla khii-toiseen -testi suoritetaan. Valitse nyt Get from data, joka ottaa mukaan kaikki arvot.

Expected Values -kohdassa määritellään testattava frekvenssijakauma, johon khii-toiseen -testi vertaa tutkittavan muuttujan jakaumaa. Valitse Values: -kohta ja kirjoita hypoteesin mukaisen jakauman odotetut frekvenssit (All categories equal -valinnalla vertailu tehtäisiin tasajakaumaan).

Odotetut frekvenssit annetaan siinä järjestyksessä, missä tutkittavan muuttujan vastausvaihtoehdot ovat (pienimmästä suurimpaan). Koska tutkittavassa puka-muuttujassa on 741 validia vastausta, syötettäviksi arvoiksi saadaan yllä olevan Suomen Gallupin kannatustutkimuksen prosenttijakauman perusteella:

0.267 * 741 = 198, 0.205 * 741 = 152, ... 139, 79, 36, 50, 21 ja 66.

Syötettävien arvojen summan tulee olla sama kuin tutkittavan muuttujan validien arvojen määrä (tässä 741) eli jonkun luvun voi joutua pyöristämään 'väärään' suuntaan (tässä pyöristys 'väärään' suuntaan on tehty ryhmään 9 'MUUT'). Kunkin arvon jälkeen napsauta Add-painiketta. Suorita testi painamalla OK.

Muuttujan valinta ja testijakauma

Kuva 7. Muuttujan valinta ja testijakauma

Tulosikkunaan tulostuu taulukko (Kuva 8), josta löytyvät ryhmittäiset havaitut ja hypoteesin mukaiset frekvenssit sekä residuaalit (residuaali = havaittu frekvenssi - odotettu frekvenssi). Toisessa taulukossa esitetään khii-toiseen -testisuureen arvo, vapausasteiden määrä sekä p-arvo. Esimerkin nollahypoteesi ei jää voimaan (p = 0.00), eli tutkimuspopulaation puoluekantajakauma eroaa erittäin merkitsevästi Suomen Gallupin tekemästä kannatusmittauksesta.

Tulostaulukot

Kuva 8. Tulostaulukot


Kahden riippumattoman otoksen testit

Mann-Whitney, Kolmogorov-Smirnov Z, Moses, Wald-Wolfowitz

Kahden riippumattoman otoksen testeissä vertaillaan tutkittavan muuttujan arvoja ryhmittelymuuttujan määräämissä kahdessa ryhmässä. Hypoteesit ovat samat kuin vastaavan t-testin tapauksessa.

Tutkitaan World Values Survey 1996 esimerkkiaineiston muuttujien v191d 'Kuinka usein rukoilette Jumalaa kirkollisia toimituksia lukuunottamatta?' sekä v214 'Sukupuoli' avulla, ovatko rukoilutottumukset samanlaiset sukupuolten välillä. Ennen testiä tutkittavan muuttujan v191d vastausvaihtoehto 6 'Ei osaa sanoa' pitää luokitella puuttuvaksi tiedoksi.

Valitse Analyze - Nonparametric Tests - Legacy Dialogs - 2 Independent Samples... . Siirrä avautuvassa ikkunassa muuttuja v191d Test Variable List: -kohtaan ja Grouping Variable: -kohtaan ryhmittelymuuttuja v214, jonka kahdella määrätyllä arvolla testi suoritetaan. Arvojen määrääminen tehdään napsauttamalla Define Groups... -painiketta. Test Type -kohdassa valitaan käytettävä testi. Mann-Whitney U-, Kolmogorov-Smirnov Z- ja Wald-Wolfowitz runs -testeillä tutkitaan, ovatko kaksi riippumatonta otosta samoin jakautuneesta perusjoukosta. Moses extreme reactions -testi on tarkoitettu lähinnä koeluontoisiin tutkimusasetelmiin, missä on olemassa selkeä kontrolli- sekä käsittelyryhmä.

Options-näppäintä painamalla voi valita tulostukseen lisää tunnuslukuja sekä valita puuttuvien tietojen käsittelyn. Jos analysoit havaintomäärältään pieniä aineistoja tai otosjakaumat ovat muodoltaan hyvin erilaisia, eksaktin testin käyttäminen on suositeltavaa. Voit valita sen Exact...-näppäimellä.

Muuttujien ja testien valinta

Kuva 9. Muuttujien ja testien valinta

Ei-parametrisissa testeissä testisuureen laskemisessa ei käytetä alkuperäisiä havaintoarvoja. Alkuperäiset arvot korvataan järjestysluvuilla, pienin arvo saa järjestysluvun yksi, toiseksi pienin kaksi jne. Testisuureet lasketaan sitten näiden järjestyslukujen perusteella.

Suorita testit painamalla OK-näppäintä. Kaikki valitsemamme testit hylkäävät nollahypoteesin p-arvolla 0.00 (Kuva 10), joten rukoilutottumukset eroavat tutkimuspopulaatiossa miehillä ja naisilla tilastollisesti erittäin merkitsevästi.

Tulostaulukot

Kuva 10. Tulostaulukot


Usean riippumattoman otoksen testit

Kruskal-Wallis, Median, Jonckheere-Terpstra

Usean riippumattoman otoksen testeissä vertaillaan tutkittavan muuttujan jakaumia useamman kuin kaksiluokkaisen (k) ryhmittelymuuttujan luokissa. Testeillä tutkitaan, ovatko nämä k riippumatonta otosta samoin jakautuneesta perusjoukosta.

Tutkitaan World Values Survey 1996 esimerkkiaineiston muuttujien v227 'Mihin näistä tuloluokista perheenne kuuluu?' sekä v141 'Luottamus: poliisi' avulla, onko luottamus poliisiin samanlaista eri tuloluokissa.

Ensin uudelleenluokittelemme muuttujan v141 vastausvaihtoehdon 5 'Ei osaa sanoa' puuttuvaksi tiedoksi. Seuraavaksi muodostamme uuden muuttujan tulu, johon uudelleenluokittelemme tuloluokat seuraavasti:
1 'Alle 90 001 mk/v'
2 '90 001 - 180 000 mk/v'
3 'yli 180 000 mk /v'

Valitse sitten Analyze - Nonparametric Tests - Legacy Dialogs - K Independent Samples... . Siirrä avautuvassa ikkunassa muuttuja v141 Test Variable List: -kohtaan ja Grouping Variable -kohtaan ryhmittelymuuttuja tulu, jonka ryhmissä testi suoritetaan. Arvojen määrääminen tehdään napsauttamalla Define Range... -painiketta ja kirjoittamalla sinne tulu-muuttujan minimi- ja maksimiarvot 1 ja 3. Test Type -kohdassa valitaan käytettävä testi. Kruskal-Wallis H -testi on Mann-Whitney -testin yleistys ja sitä voidaan käyttää ei-parametrisena vastineena yksisuuntaiselle varianssianalyysille. Median-testissä aineisto jaetaan kussakin ryhmässä mediaania suurempiin ja pienempiin havaintoihin ja testataan onko ryhmien välillä riippuvuutta.

Options-näppäintä painamalla voi valita tulostukseen lisää tilastollisia tunnuslukuja sekä valita puuttuvien tietojen käsittelyn. Jos analysoit havaintomäärältään pieniä aineistoja tai otosjakaumat ovat muodoltaan hyvin erilaisia, eksaktin testin käyttäminen on suositeltavaa. Voit valita sen Exact... -näppäimellä.

Muuttujien ja testien valinta

Kuva 11. Muuttujien ja testien valinta

Suorita testit painamalla OK-näppäintä. Tulostaulukot (Kuva 12) tulostuvat tulosikkunaan. Kruskal-Wallis H -testissä saamme p-arvoksi 0.267 ja Median -testissä 0.712, joten molemmat jättävät nollahypoteesin voimaan. Erot luottamuksessa poliisiin eri perheen tuloluokissa eivät ole tilastollisesti merkitseviä.

Tulostaulukot

Kuva 12. Tulostaulukot


viimeksi päivitetty 2014-04-08

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD