KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi.Katso päivitetyt SPSS-harjoitukset.

Frekvenssijakauma, keski- ja hajontaluvut - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Tässä harjoituksessa käytetään havaintoaineistona vuoden 1996 World Values Survey -tutkimuksen Suomen osa-aineistoa.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Frekvenssijakauma, keski- ja hajontaluvut

» osaWVS-aineisto | Harjoitusaineistot

Frekvenssijakauma eli suora jakauma on yleensä ensimmäinen muuttujan jakauman esittämistapa. Frekvenssi on havaintojen lukumäärä muuttujan luokassa. Jakauma muodostuu muuttujan eri arvoista ja niihin liittyvistä frekvensseistä. Frekvenssitaulukossa esitetään usein myös summafrekvenssit, prosenttifrekvenssit ja summaprosentit. Summajakaumia kutsutaan myös kumulatiivisiksi jakaumiksi.

Muuttujan frekvenssijakauman sisältämä informaatio voidaan ilmaista taulukoiden ja kuvioiden lisäksi muutamalla muuttujaa kuvaavalla tilastollisella tunnusluvulla. Tässä harjoituksessa tutustumme miten SPSS:n Frequencies-toiminnolla saadaan tulostettua muuttujan frekvenssijakauma sekä laskettua yleisimmät keski- ja hajontaluvut käyttäen esimerkkinä havaintoaineiston ikä-muuttujaa.

Aloita valitsemalla valikosta Analyze - Descriptive Statistics - Frequencies... . Voit myös valita haluamasi tunnusluvut saman valikon kautta.

Frekvenssit, keski- ja hajontaluvut

Frequencies-ikkuna avautuu. Vasemmassa laatikossa näkyvät kaikki aineiston muuttujat. Valitse ikä-muuttuja hiirellä klikkaamalla ja siirrä se oikeanpuoleiseen laatikkoon keskellä olevaa nuolinäppäintä painamalla. Voit valita ja siirtää myös useita muuttujia kerralla. Jos et halua tulostaa frekvenssitaulukkoa, voit poistaa väkäsen Display frequency tables -valintalaatikosta.

Muuttujien valinta

Jos haluat muuttujan jakaumasta pylväs-, piirakka- tai histogrammikuvaajan, voit valita sen Charts... -painiketta painamalla avautuvasta ikkunasta.
Painamalla Statistics... -painiketta saat eteesi uuden ikkunan, josta voit valita haluamasi tunnusluvut.

Tunnuslukujen valinta

Tunnusluvut on jaettu neljään eri kokonaisuuteen.

  • Percentile Values -- prosenttipisteet
  • Central Tendency -- keskiluvut
  • Dispersion -- hajontaluvut
  • Distribution -- jakauman vinous ja huipukkuus

Valitse tunnusluvut tarkasteltavan muuttujan mittaustasoon sopiviksi. Koska valitsimme esimerkkimuuttujaksi suhdeasteikollisen ikä-muuttujan, voimme valita kaikki ohjelman tarjoamat keski- ja hajontaluvut sekä muut jakaumaa kuvailevat tunnnusluvut. Painamalla Continue ja OK-näppäimiä, saamme tulosikkunaan frekvenssijakaumataulukon sekä taulukon valitsemistamme tunnusluvuista.

Tulostaulukko

Kuva 1. Tunnusluvut

Keskiluvut

Kuvasta 1 näemme, että aineistossa on 987 havaintoa. Puuttuvia havaintoja ei ole eli kaikki vastaajat ovat ilmoittaneet ikänsä. Ikä-muuttujan keskiarvo on 42.19 vuotta ja keskiarvon keskivirhe on 0.534 vuotta. Vastaavasti mediaani on 39 vuotta ja moodi (tyyppiarvo) eli vastaajien yleisin ikä on 20 vuotta.

Hajontaluvut

Ikä-muuttujan keskihajonta on 16.77 eli muuttujan arvot poikkeavat keskimäärin 16.77 vuotta keskiarvosta (42.19). Varianssi on suoraan keskihajonnan neliö eli 16.77 * 16.77 = 281.23. Minimi on 11 ja maksimi on 99 eli vaihteluvälin pituus on 99 - 11 = 88. Variaatiokerrointa SPSS ei laske suoraan, mutta se on helppo laskea, vaikka taskulaskimella, jakamalla keskihajonta keskiarvolla. (16.77 / 42.19 = 0,40)

Jakaumaa kuvailevat tunnusluvut

Täysin symmetrisen jakauman (normaalijakauma) vinous (skewness) saa arvon nolla. Vinous poikkeaa aineiston perusteella hieman nollasta, joten jakauma on epäsymmetrinen. Tämä johtuu siitä, etteivät aivan nuorimmat ole osallistuneet tutkimukseen. Normaalijakauman huipukkuus (Kurtosis) on myös nolla. Aineiston avulla saamme huipukkuuden arvoksi -0.772 ja kuten kuvasta 2 näemme, havaintoaineiston ikä-jakaumalla näyttäisi olevan useampia huippuja. Lisäksi tulostaulukkoon tulevat ikäjakauman 25-, 50- sekä 75-prosenttipisteet eli ala-, keski- ja yläkvartiilit. Mikäli haluat testata noudattaako tarkastelemasi muuttujan jakauma tasa-, Poisson-, ekspontentiaali- tai normaalijakaumaa, voit kokeilla Kolmogorov-Smirnov -testiä valikosta Analyze - Nonparametric Tests - 1-Sample K-S.

Histogrammi

Kuva 2. Histogrammi

Harjoituksia

Tutkittaessa 30 eri täyden reittilennon (Boeing 767, 290 matkustajaa) kaikkien matkustajien matkatavarat, löytyi niistä laitonta materiaalia seuraavasti:


  nro      | kpl
------------------
lento  1   |  3
lento  2   |  0
lento  3   |  2
lento  4   |  5
lento  5   |  7
lento  6   |  1
lento  7   |  4
lento  8   |  3
lento  9   |  6
lento 10   |  4
lento 11   |  0
lento 12   |  2
lento 13   |  1
lento 14   |  0
lento 15   |  2
lento 16   |  1
lento 17   |  6
lento 18   |  2
lento 19   |  1
lento 20   |  0
lento 21   |  0
lento 22   |  4
lento 23   |  3
lento 24   |  5
lento 25   |  3
lento 26   |  2
lento 27   |  2
lento 28   |  1
lento 29   |  1
lento 30   |  0

Syötä aineisto SPSS-ohjelmaan ja esitä graafisesti eri arvojen jakauma ja määritä sopivat keski- ja hajontaluvut.
Miten arvot muuttuvat jos aineistoon lisätään havainto:


  nro      | kpl
------------------
lento 31   | 30


viimeksi päivitetty 2014-04-04

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD