SPSS-harjoitus 2
Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.
Esimerkkiaineistona on osa Suomessa vuonna 1996 kerätystä World Values Survey -aineistosta, osaWVS.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.
Yhden muuttujan pylväskuvioita
Yhden muuttujan jakaumaa kuvaavia pylväitä ovat
- lukumääräpylväät
- prosenttipylväät
- kumulatiivinen lukumääräpylväikkö
- kumulatiivinen prosenttipylväikkö
Tässä harjoituksessa siis havainnollistamme neljän erilaisen pylväskuvion avulla, mikä suomalaisten mielestä on ihanteellinen lasten lukumäärä perheessä. Kuvioiden muokkausta on selitetty tarkemmin 100 %:n pylväskuvioharjoituksessa.
Lukumääräpylväät
Valitse Graphs - Legacy Dialogs - Bar...

Oletusvalintana on Simple, jolla saadaan yksinkertainen yhden muuttujan frekvenssipylväs tai tunnuslukupylväitä. Summaries for groups of cases piirtää yhden pylvään muuttujan yhtä luokkaa tai arvoa kohti. Valitse nämä vaihtoehdot.
Palauta avautuvassa Define-taulussa ensin määritykset oletustilaan Reset-painikkeella. Näin mahdolliset aikaisemmin tehdyt määritykset poistuvat. Muista, että Help -painikkeella saat aina myös opastusta valikon käytöstä. Jatka Define-painikkeella pylväskuvion määrittelemistä.
- N of cases tekee muuttujaluokittain lukumääräpylväät,
- % of cases muuttujaluokittain prosenttipylväät,
- Cum n muuttujaluokittain kumulatiiviset eli kasautuvat lukumääräpylväät,
- Cum % muuttujaluokittain kumulatiiviset eli kasautuvat prosenttipylväät.
Valitse N of cases. Etsi muuttujaluettelosta muuttuja v91 'Mikä on ihanteellinen lasten lukumäärä perheessä?' ja siirrä se Category Axis -laatikkoon.

Oikeassa alakulmassa olevalla Options... -painikkeella voidaan määrittää, että kuvioon piirretään pylväs puuttuvalle tiedolle. Voit nyt ottaa puuttuvan tiedon mukaan kuvioon, joten lisää väkänen Display groups defined by missing values -ruutuun. Sen sijaan myöhemmin tehtävistä kumulatiivisista pylväskuvioista puuttuva tieto on järkevää ottaa pois. Kumulatiivinen pylväskuvio nimittäin vaatii vähintään järjestystasoisen muuttujan, eikä puuttuva tieto voi olla järjestysasteikon arvo. Hyväksy määritykset OK-painikkeella.

Tuloksena on lukumääräpylväät, jotka kertovat suomalaisten ihanneperhekoosta. Kaksilapsinen perhe näyttää olevan suosituin perhemalli. Varsin suositttu on myös kolme lasta. Toisaalta lapsettomien ja yhden lapsen perheen, toisaalta suurperheiden suosio on vähäinen. Kuitenkin tällaisetkin perhemallit ovat ihannemallien joukossa, vaikkakaan eivät suosituimpina. Osa ihmisistä ei kerro lainkaan vastausta tähän kysymykseen. Ennen seuraavan kuvion tekemistä on mietittävä, halutaanko prosenttiosuuksiin mukaa myös puuttuva tieto, siis onko 100 %:ssa puuttuva tieto mukana vai ei. Mikäli puuttuva tieto halutaan mukaan, toimitaan täysin vastaavasti kuin edellä lukumääräpylväskuviota tehdessä.
Prosenttipylväät
On huomattava, ettei prosenttipylväistä pidä poistaa pylväitä enää valmista kuviota muokattaessa. Jos näin tehdään, ei pylväiden prosenttien summaksi tule 100 %, vaan siitä puuttuu vastaamatta jättäneiden osuus.
'Ei vastausta' -vaihtoehdon määrittäminen ensin puuttuvaksi tiedoksi ja sen jälkeen kuvion tekeminen ilman sitä vaatii joitakin pieniä erityisiä toimenpiteitä, jotka SPSS-ohjelmiston käyttäjän on syytä tietää. Niinpä teemme prosenttikuvion, josta 'ei vastausta' -vaihtoehto on jätetty pois.
Aloita pylväskuvion tekeminen puuttuvan tiedon määrittelyllä. Ensimmäiseksi tehtäväsi on määrittää 72 henkilön kohdalla oleva 'ei vastausta' -vaihtoehto puuttuvaksi tiedoksi. Valitse Data Editor -ikkunassa päällimmäiseksi Variable View -näkymä.
Muuttujanimet ovat vasemmassa reunassa allekkain. Tarkista muuttujan v91 'Mikä on mielestänne perheen ihanteellinen...' kohdalta Values-sarakkeesta, miten muuttuja on koodattu:
- Klikkaa kyseistä ruutua ja sen jälkeen
-painiketta. - Millä numerolla 'Ei vastausta' -vaihtoehto on koodattu?
- Poistu Cancel -painikkeella.
Klikkaa nyt ruutua Missing-sarakkeesta muuttujan v91 kohdalta ja edelleen harmaata neliötä. Asetuksissa oletuksena on No missing values, mikä ei kuitenkaan tarkoita, etteikö aineistossa voisi olla puuttuvaa tietoa. Tällöin puuttuva tieto on koodattu matriisissa pilkulla; se on siis System missing -muotoa. Valitse kohta Discrete missing values, jossa voidaan määrittää tarvittaessa kolme eri koodia puuttuvalle tiedolle. Kirjoita numero 9 johonkin valkoisista ruuduista. (Vaihtoehto 'ei vastausta' oli koodattu tällä numerolla, eikö vain?)

Taulun alimmalla vaihtoehdolla voitaisiin valita joku tietty muuttujan arvojen väli (range) puuttuvaksi tiedoksi. Poistu taulusta OK-painikkeella.
Nyt varsinaisen prosenttipylväskuvion tekeminen:
Valitse sama toiminto Graphs - Legacy Dialogs - Bar... kuten edellä lukumääräpylvästä tehdessäsi ja tee samasta ihanteellinen lapsilukumäärä -muuttujasta prosenttipylväskuvio. Pylväs on muotoa Simple ja kuvion havainnot ovat ryhmittäisiä prosenttiosuuksia, Summaries for groups of cases. Tällöin ohjelma piirtää yhden prosenttipylvään muuttujan yhtä luokkaa tai arvoa kohti.
Bars represent -kohtaan valitaan nyt % of cases. Oikeassa alakulmassa olevalla Options... -painikkeella päästään määrittelemään, ettei kuvioon tule puuttuvalle tiedolle omaa prosenttipylvästä. Poista väkänen kohdasta Display groups defined by missing values.
Hyväksy Continue ja edelleen OK-painikkeella. Tuloksena on prosenttipylväikkö, jota voidaan muokata.

Mikäli julkaistaan samalla kertaa useita keskenään vertailtaviksi tarkoitettuja pylväskuvioita - erityisesti prosenttipylväitä - kannattaa pystyakseli skaalata mahdollisuuksien mukaan samalla tavalla jokaisessa kuviossa.
Kumulatiivinen lukumääräpylväikkö
Lukumääräpylväikköjä varten jätetään matriisiin yllä tehty 'Ei vastausta' -vaihtoehto puuttuvaksi tiedoksi. Etene samoin kuin edellä, mutta valitse Bars Represent -kohdassa Cum. N. Tarkista Options-määrityksistä, ettei puuttuva tieto ole mukana. Siis ei väkästä.
Kumulatiivisessa pylväskuviossa jokainen pylväs sisältää aina myös edellisen (vasemman puoleisen) pylvään vastaajat. Viimeinen pylväs edustaa siten kaikkia vastaajia. (kumulatiivinen = kasautuva, kertyvä)

54 vastaajaa pitää ihanteellisena lasten lukumääränä enintään yhtä lasta, enintään kahta lasta kannattaa kaikkiaan 506 vastaajaa. Kahden lapsen kannalla onkin valtaosa vastaajista.
Kumulatiivinen prosenttipylväskuvio
Kuvio on muutoin samanlainen kuin kumulatiivinen lukumääräpylväskuvio, mutta pystyakseli on prosenttiakseli ja pylväät edustavat kumulatiivisia prosenttiosuuksia.
Aloita samoin kuin edellä, mutta kohdassa Bars Represent valitse Cum. %. Hyväksy OK-painikkeella.

Kuviosta voi siis nähdä esimerkiksi, että vain pieni osa kysymykseen vastanneista ihannoi perhettä, jossa ei ole lapsia lainkaan tai on vain yksi lapsi. Reilut puolet vastanneista haluaa kaksi lasta tai vähemmän, loput kolme lasta tai enemmän.
Kuviot on aina muokattava, mikäli ne halutaan julkaista. Julkaisuissa kuvioiden "otsikkotekstit" kirjoitetaan kuvioiden alapuolelle. Kuvio voidaan muokata SPSS:ssä tai se voidaan siirtää leikepöydän kautta esim. Excel-taulukkolaskentaohjelmaan ja muokata siellä.
