Aineistotiedostoformaatit

Tietoarkisto säilyttää kvantitatiiviset tutkimusaineistot SPSS Portable -formaatissa (*.por). Erityistapauksissa toimitamme tiedostoja myös muiden ohjelmistojen formaateissa. Näissä tapauksissa ota yhteyttä aineistopalveluumme. Käytämme muuntamiseen Stat/Transfer -ohjelmaa, joka tukee muun muassa seuraavia:

  • 1-2-3 (*.wk1, *.wk3)
  • Microsoft Access (*.mdb)
  • ASCII (*.txt, *.csv)
  • Epi Info (*.rec)
  • Microsoft Excel (*.xls)
  • HTML-taulukot (*.htm)
  • JMP 3-8 (*.jmp)
  • LIMDEP (*.lpj)
  • Matlab (*.mat)
  • Paradox (*.db)
  • Quattro Pro (*.wq1)
  • R (*.rdata)
  • SAS (*.ssd, *.sd2, *.ssd01, *.sas7bdat, *.xpt)
  • S-PLUS
  • SPSS (*.sav, *.por)
  • Stata (*.dta)
  • Statistica (*.sta)
  • Systat (*.sys)
  • Triple-S (*.xml, *.asc)

Stat/Transferin verkkosivuilla on lista kaikista tuetuista tiedostomuodoista.

Useat formaatit asettavat rajoituksia mm. muuttujien lukumäärälle, muuttujien nimien pituudelle ja puuttuvan tiedon käsittelyyn. Esimerkiksi muunnettaessa Excel-formaattiin muuttujien selitteet (variable labels) katoavat. Lisäksi useat aineistot sisältävät niin paljon muuttujia tai havaintoja, että niiden toimittaminen yhtenä Excel-tiedostona on mahdotonta. Tietoarkiston asiakaspalvelu antaa tarvittaessa lisätietoja.

Valtaosa kvalitatiivisista tutkimusaineistoista on tekstitiedostoja (rtf, txt, pdf). Suurimmasta osasta tekstiaineistoja tuotetaan myös erillinen html-selausversio.

Arkistonmuodostussuunnitelman liitteenä on esitetty Tietoarkiston vastaanottamat, säilyttämät ja jakelemat tiedostomuodot dokumenttityypeittäin (pdf).

viimeksi päivitetty 2015-10-12