Tallentamista ja dokumentointia (FILE MEDIT ym.)

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Kimmo Vehkalahti
Sähköposti:    -
Päiväys: 16.2.2005 10:45

Minä ja eräät kollegani tallennamme kurssiemme osallistujatietoja
Survon datatiedostoiksi, yleensä perinteisellä FILE SHOW:lla.
Sehän toimii hommassa mukavasti; jotain tämmöistä siis on kyseessä:

  FILE STATUS DA2OSALL
  Data-analyysi II -kurssin osallistujat syksyllä 2004
  Yliopistonlehtori Kimmo Vehkalahti
  FIELDS: (active)
     1 SA_  12 Sukunimi
     2 SA_  10 Etunimi
     3 SA_  17 Pääaine
     4 SA_   1 Opiskelu P=perustutkinto-opiskelija, J=jatko-opiskelija
     5 SA_   4 Aloitus  Opintojen aloitusvuosi
     6 SA_  30 Sposti   Sähköpostiosoite
     7 SA_  11 Koodi    Opiskelijanumero
     8 SA_   1 Tavoite  a=pääaine- tai sivuaineop. (5 ov), b=til.menet. (3 ov)
     9 SA_   1 OpinnotA Tilastollisen päättelyn kurssi (osat 1 ja 2)
    10 SA_   1 OpinnotB Lineaaristen mallien kurssi
    11 SA_   1 OpinnotC Matriisilaskennan jatkokurssi
    12 SA_   1 OpinnotD Matriisilaskennan johdantokurssi / Lineaarialgebra I
    13 SA_   1 OpinnotE Data-analyysi I
    14 SA_   1 OpinnotF Tilastotieteen jatkokurssi
    15 SA_   1 OpinnotG Tilastotieteen johdantokurssi
    16 NA_   1 Palautus HT palautus: 1=[1], 2=[2], 3=[3], 4=myöhemmin {0,4}
    17 NA_   1 Suoritus 1=OK!                                         {0,1}
  END
  Survo data file DA2OSALL: record=136 bytes, M1=22 L=64  M=17 N=21

Kahta asiaa olen silloin tällöin kaivannut FILE SHOW:ssa:

1) näppäinkomentojen helppi (joka aiemmissa Survoissa tuli näkyviin F1:llä)

2) tietueen ("rivin") kopiointi sen numerolla (kuten alt-F3 editorissa);
   ko. näppäin on jopa vapaa (ei toistaiseksi käytössä FILE SHOW:ssa)

Tammikuussa päätin kokeilla myös uudempaa FILE MEDIT:iä vastaavanlaisten
kurssitietojen tallentamisessa. Sehän toimi myös mukavasti; tallennuspohja
syntyy automaattisesti ja sitä voisi muokata (en tehnyt sille mitään).
Pieniä kehitystoiveita kuitenkin heti syntyi (en ollut aiemmin käyttänyt
FILE MEDIT:iä mihinkään kovin todelliseen työhön):

1) End-näppäin voisi viedä kentän loppuun (pl. tyhjät), nyt se potkaisee
   vain tyhjää

2) Home voisi olla enemmänkin askellettu (editorin tapaan): ensimmäinen
   painallus veisi kentän alkuun. (Tässä sotkin monta kertaa aineistoni,
   kun painoin sokeasti Home - oletin että se palaa nimen tms. alkuun -
   painoin Ctrl-End tyhjentääkseni kentän ja kappas: sivun ensimmäinen
   kenttä (Sukunimi) oli tyhjentynyt.

3) [turha toive, kunhan tuli mieleen] - End voisi olla myös askeltava
   kuten Home (tämä kuuluu enemmänkin kategoriaan "jos Survon teko
   aloitettaisiin nyt" :))

Saattaisin kyllä jatkossa harkita FILE MEDIT:in käytön jatkamista, sillä
siinä on paljon houkuttelevia piirteitä joita ei FILE SHOW:ssa ole.
Yhden näistä voisin vielä tässä nostaa esiin. Se koskee muuttujien eri
arvojen dokumentointia. Survon datatiedostorakennehan sallii muuttujien
kahdeksaa merkkiä hieman pidempien kuvausten esittämisen nimien perässä
(kuten edellä "Opintojen aloitusvuosi" ym.). Tämä tila ei kuitenkaan
oikein riitä muuttujien *arvojen* täsmällisempään kuvailuun. Ajatellaan
vaikka tällaisia tilanteita (lähde: European Social Survey 2002/2003):

        [a3] Kuinka paljon yhteensä käytätte aikaa radion kuunteluun
             tavallisina arkipäivinä

               0    En ollenkaan
               1    Alle 1/2 tuntia
               2    1/2-1 tuntia
               3    Yli tunnin, mutta korkeintaan 1 1/2 tuntia
               4    Yli 1 1/2 tuntia, mutta korkeintaan 2 tuntia
               5    Yli 2 tuntia, mutta korkeintaan 2 1/2 tuntia
               6    Yli 2 1/2 tuntia, mutta korkeintaan 3 tuntia
               7    Yli 3 tuntia


        [b35] Millä tasolla seuraavista asioista pääasiassa pitäisi
              päättää: Ympäristönsuojelu

               1    Kansainvälisellä tasolla
               2    Euroopan tasolla
               3    Kansallisella tasolla
               4    Alue- tai paikallistasolla

        [b50] Nykyaikaiseen tieteeseen voi luottaa ympäristöongelmien
              ratkaisussa

               1    Täysin samaa mieltä
               2    Jokseenkin samaa mieltä
               3    En samaa enkä eri mieltä
               4    Jokseenkin eri mieltä
               5    Täysin eri mieltä

        [c2] Kuinka usein tapaatte ystäviänne, sukulaisianne tai
             työtovereitanne muuten kuin työasioissa

               1    En koskaan
               2    Harvemmin kuin kerran kuukaudessa
               3    Kerran kuukaudessa
               4    Useita kertoja kuukaudessa
               5    Kerran viikossa
               6    Useita kertoja viikossa
               7    Päivittäin

        [f6] Vastaajan koulutus

               0    Vähemmän kuin peruskoulun ala-aste tai vastaava
               1    Peruskoulun ala-aste (1-6 luokat), kansakoulu
               2    Peruskoulun yläaste (7-9/10 luokat), keskikoulu
               3    Lukio, ylioppilas- tai ammatillinen tutkinto
               5    Opisto- tai korkeakoulututkinto
               6    Lisensiaatin tai tohtorin tutkinto
               7    Ei mitään näistä

Näiden koodaaminen FILE MEDIT -tallennuspohjaan houkuttelisi varmaankin
ajatellen juuri tallennusta. Toisaalta tallennus hoituu nykyään usein
automaattisesti sähköisillä lomakkeilla. Kuvauksille olisi sitä paitsi
käyttöä myös analyysivaiheissa, kuvien piirrossa jne. Jollain lailla
olisi siis hyvä, että kuvaukset kulkisivat aineiston mukana eivätkä
erillisessä tiedostossa.

Muutamat Survoilijat, mm. Markku Verkasalo on ehdottanut tähän käyttöön
Survon datatiedoston kommenttialuetta (FILE STATUS -komennon ja FIELDS-
avainsanan välistä aluetta), jonka pystyy laajentamaan vaikka kuinka
suureksi tiedostoa luotaessa (FILE CREATE). Markku on kehitellyt tähän
sukropohjalta systeemejäkin, jolla näitä kuvauksia voisi hallita. Ehkä
olisi kuitenkin paikallaan pohtia mikä olisi kaikkein yleiskäyttöisin
tapa huolehtia tämänkaltaisen dokumentoinnin järjestämisestä. Vertailun
vuoksi mainitsen, että Statistical Package for Social Sciences -ohjelma
kutsuu näitä tietoja nimellä "VALUE LABELS" (muuttujien kuvaukset ovat
vastaavasti nimeltään "VARIABLE LABELS"). Molempia hallitaan parhaiten
seuraavantyyppisillä komennoilla (valikkovetoisestikin asiat voi hoitaa,
mutta sitä ei voi suositella kenellekään):

  VARIABLE LABELS
  a3 '[a3] Kuinka paljon yhteensä käytätte aikaa radion kuunteluun ' +
     'tavallisina arkipäivinä'
  .

  VALUE LABELS
  a3
     0   'En ollenkaan'
     1   'Alle 1/2 tuntia'
     2   '1/2-1 tuntia'
     3   'Yli tunnin, mutta korkeintaan 1 1/2 tuntia'
     4   'Yli 1 1/2 tuntia, mutta korkeintaan 2 tuntia'
     5   'Yli 2 tuntia, mutta korkeintaan 2 1/2 tuntia'
     6   'Yli 2 1/2 tuntia, mutta korkeintaan 3 tuntia'
     7   'Yli 3 tuntia'
  .

Molempia nimikkeitä hyödynnetään automaattisesti kuvissa ja taulukoissa.
Esim. pylväskuvaan

  GRAPH
    /BAR(SIMPLE)=COUNT BY a3 .

tulevat (pysty)pylväiden alle teksteiksi jälkimmäiset ja kuvan otsikoksi
edellinen. Uskoisin että vähintään yhtä käteviin ratkaisuihin pääsisi
Survolla, kunhan näille etenkin kyselytutkimuksissa hyvin tärkeille
dokumentaation muodoille saataisiin määriteltyä yleiset rakenteet.

terv. Kimmo

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.