KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi.Katso päivitetyt SPSS-harjoitukset.

Regressioanalyysi - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Tässä demonstraatiossa käytetään Tilastokeskuksen Maailma numeroina -tilastoista koottua aineistoa.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Regressioanalyysi

» manu-aineisto | Harjoitusaineistot

Regressioanalyysin esittelemiseksi lasketaan malli, jossa selitettävänä muuttujana on maakohtainen elinajan odote vuonna 1999 (v27). Elinajan odotteeseen vaikuttavat useat eri tekijät, mutta esimerkkiregressioanalyysissa käytetään selittävänä tekijänä HIV-taudin levinneisyyttä väestössä (HIV/AIDS sairastuneet/1000 henkilöä). Tämä uusi muuttuja lasketaan muuttujan v30 (HIV/AIDS sairastuneet vuonna 1999) avulla jakamalla se väkiluvulla tuhansina eli uusi muuttuja lasketaan kaavalla (SPSS valikosta Transform - Compute Variable...)

v31 = v30 / (v5 / 1000)

Toinen selittävä muuttuja on bruttokansantuote tuhansissa dollareissa per henkilö. Tämä saadaan laskettua jakamalla muuttuja v16 tuhannella eli

v32 = v16 / 1000

SPSS ohjelmistossa lineaarinen regressioanalyysi aloitetaan valikosta Analyze - Regression - Linear...

Regressioanalyysi

Seuraavassa ikkunassa valitaan selitettävä muuttuja (Dependent) ja selitettävät muuttujat (Independent(s)). Method-valinnalla valitaan käytettävä selittävien muuttujien lisäystapa regressiomalliin. Valittavana on suora (Enter) muuttujien lisäys sekä useita askeltavia valintamalleja.

Regressioanalyysi - muuttujien valinta

Klikkaamalla OK, saamme tulokseksi lineaarisen regressioanalyysin tulokset.

Regressioanalyysi - tulokset

Taulusta Model summary nähdään mallin selitysaste. Mallin hyvyyttä eli yhteensopivuutta otoksen kanssa voi tarkastella mallin selitysasteen avulla. Selitysaste luetaan siis R Square sarakkeelta. Usein se annetaan prosenteissa eli mallimme selitysaste on 63.9 %. Mallin selitysaste paranee, kun selittävien muutujien joukkoon lisätään mikä hyvänsä uusi muuttuja. Mallin selitysastetta voi siis kasvattaa lisäämällä malliin tarpeeksi paljon 'turhia' muuttujia. Korjattu selitysaste voi laskea, jos selitettäväksi muuttujaksi lisätään huonosti selittävä muuttuja. Korjattu selitysaste luetaan sarakkeesta Adjusted R Square. Selitysasteen sijasta onkin usein parempi tarkastella korjattua selitysastetta, koska tämä huomioi selittävien muuttujien määrän.

Taulusta Anova nähdään, että mallin selittämä vaihtelu (Regression Sum of Squares) on 14204.265 ja kokonaisvaihtelu (Total Sum of Squares) on 22240.076. Näiden osamääränä saadaan mallin selittämä osuus kokonaisvaihtelusta, jota myös kutsutaan selitysasteeksi

14204.265 / 22240.076 = 0.6387

Taulun Coefficients sarakkeesta B luetaan standardisoimattomat estimoidut regressiokertoimet. Regressioyhtälö kirjoitetaan siis muodossa

V27 = 64.368 - 0.232 * V31 + 0.572 * V32

Kun HIV-sairastuvuus maassa kasvaa 1 henkilöllä tuhatta henkeä kohti, vähenee eliniän odote 0.232 vuotta. Kun taas maan bruttokansantuote per henkilö kasvaa tuhannella dollarilla, kasvaa elinajan odote 0.572 vuotta.

B-sarakkeessa olevista standardisoimattomista regressiokertoimista ei voi päätellä muuttujan vaikutuksen suuruutta verrattuna johonkin toiseen muuttujaan. Tämä johtuu siitä, että muuttujia mitataan usein eri asteikoilla. Jos standardisoimme muuttujat, liikkuvat kaikki muuttujat samalla asteikolla, ja voimme tehdä johtopäätöksiä niiden suhteellisesta selitysvoimasta. Beta-sarakkeen kertoimet ovat välillä [-1,1]. Itseisarvoltaan suurimmat arvot vaikuttavat selitettävään voimakkaimmin.

Sarakkeilta t sekä Sig. luetaan kutakin kerrointa kohden tehdyn t-testin tulos. Testattavana on nollahypoteesi: k.o. kerroin on nolla. Taulukosta näemme, että vakiotermin ja selittävien muuttujien osalta nollahypoteesi hylätään. Regressiokertoimet ovat siis nollasta eroavia.


viimeksi päivitetty 2014-04-10

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD