KvantiMOTV

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - KvantiMOTV

Mittaaminen: Havaintomatriisi

Yleistä mittaamisesta
Tilastoyksikkö ja muuttujat
Havaintomatriisi
Muuttujien ominaisuudet: numeerinen/sanallinen, jatkuvuus, dikotomia, mittaustasot ja mitta-asteikot
Mittareiden luotettavuus: operationalisointi, validiteetti, reliabiliteetti

Tilastoyksikköjä koskevat tiedot on koottava järkevään muotoon aineiston käsittelyä varten. Yleensä havainnot tallennetaan tilasto-ohjelmissa matriisiksi. Sen kullakin vaakarivillä on yhden tilastoyksikön saamat muuttujien arvot. Tietyn muuttujan arvot puolestaan sijaitsevat samoissa sarakkeissa kaikilla tilastoyksiköillä. Kuvion 1 havaintomatriisissa on sukupuolta ja ikää koskevat tiedot seitsemältä henkilöltä. Lisäksi ensimmäisessä sarakkeessa on vastauslomakkeen numero. Tilasto-ohjelmistot käyttävät havaintomatriisia perusdatana, josta ne laskevat mm. tunnuslukuja ja piirtävät graafisia esityksiä.

Havaintomatriisi

Kuvio 1. Esimerkki havaintomatriisista.

Tilastotieteen kaavoissa tilastoyksiköitä merkitään yleensä kirjaimella a, johon liitetään alaindeksi, esim. a3. Alaindeksi kertoo, millä rivillä kyseisen tilastoyksikön tiedot ovat. Esimerkiksi yleisempi merkintä ai, i=1,...,7 tarkoittaa, että aineistossa on seitsemän havaintoyksikköä: a1, a2, a3, a4, a5 , a6, a7.

Formaalisissa matemaattisissa esityksissä, kuten kaavoissa, muuttujien merkitsemiseen käytetään kirjaimia x, y ja z sekä samoja kirjaimia alaindeksillä varustettuina, esim. x1, x2, x3, ... tai yleisesti xi tai xj. Viiva kirjaimen alla viittaa siihen, että muuttujan arvo vaihtelee satunnaisesti, tiettyjen sallittujen arvojen puitteissa. Kun viiva jätetään pois, merkintä tarkoittaa satunnaismuuttujan saamaa numeerista arvoa; voidaan siis kirjoittaa x3 = x, missä x on yleisesti jokin muuttujan x3 numeerinen arvo. Esimerkiksi merkintä xi, i=1,2,3...20 tarkoittaa, että muuttuja vaihtuu, kun alaindeksi vaihtuu.

Havaintomatriisi voidaan kirjoittaa yleisessä muodossa käyttämällä kirjaimia. Kirjain n on tilastoyksiköiden määrä aineistossa ja kirjain k muuttujien määrä. Merkintä xij tarkoittaa solussa ij olevaa muuttujan arvoa.

  x1 x2 ... ... xk-1 xk
a1 x11 x12 ... ... x1,k-1 ...
a2 x21 x22 ... ... x2,k-1 ...
... ... ... ... ... ... ...
... ... ... ... ... ... ...
an-1 xn-1,1 xn-1,2 ... ... xn-1,k-1 xn-1,k
an xn,1 xn,2 ... ... xn,k-1 xn,k

Harjoituksia

Tehtävä 1. Määrittele tilastoyksikkö, perusjoukko ja tilastolliset muuttujat tutkittaessa

  1. Suomen väestön ikärakennetta
  2. vallitseeko sukupuolen ja alkoholin käytön välillä riippuvuutta
  3. koulussa menestymisen ja sosiaaliryhmän välistä riippuvuutta
  4. miten kunnan työttömyysaste vaikuttaa rikollisuuteen

Jatkuu seuraavalle sivulle


viimeksi päivitetty 2010-12-20

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto
FSD