Tallentamista ja dokumentointia (FILE MEDIT ym.)

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Kimmo Vehkalahti
Sähköposti:    -
Päiväys: 16.2.2005 10:45

Minä ja eräät kollegani tallennamme kurssiemme osallistujatietoja
Survon datatiedostoiksi, yleensä perinteisellä FILE SHOW:lla.
Sehän toimii hommassa mukavasti; jotain tämmöistä siis on kyseessä:

 FILE STATUS DA2OSALL
 Data-analyysi II -kurssin osallistujat syksyllä 2004
 Yliopistonlehtori Kimmo Vehkalahti
 FIELDS: (active)
   1 SA_ 12 Sukunimi
   2 SA_ 10 Etunimi
   3 SA_ 17 Pääaine
   4 SA_  1 Opiskelu P=perustutkinto-opiskelija, J=jatko-opiskelija
   5 SA_  4 Aloitus Opintojen aloitusvuosi
   6 SA_ 30 Sposti  Sähköpostiosoite
   7 SA_ 11 Koodi  Opiskelijanumero
   8 SA_  1 Tavoite a=pääaine- tai sivuaineop. (5 ov), b=til.menet. (3 ov)
   9 SA_  1 OpinnotA Tilastollisen päättelyn kurssi (osat 1 ja 2)
  10 SA_  1 OpinnotB Lineaaristen mallien kurssi
  11 SA_  1 OpinnotC Matriisilaskennan jatkokurssi
  12 SA_  1 OpinnotD Matriisilaskennan johdantokurssi / Lineaarialgebra I
  13 SA_  1 OpinnotE Data-analyysi I
  14 SA_  1 OpinnotF Tilastotieteen jatkokurssi
  15 SA_  1 OpinnotG Tilastotieteen johdantokurssi
  16 NA_  1 Palautus HT palautus: 1=[1], 2=[2], 3=[3], 4=myöhemmin {0,4}
  17 NA_  1 Suoritus 1=OK!                     {0,1}
 END
 Survo data file DA2OSALL: record=136 bytes, M1=22 L=64 M=17 N=21

Kahta asiaa olen silloin tällöin kaivannut FILE SHOW:ssa:

1) näppäinkomentojen helppi (joka aiemmissa Survoissa tuli näkyviin F1:llä)

2) tietueen ("rivin") kopiointi sen numerolla (kuten alt-F3 editorissa);
  ko. näppäin on jopa vapaa (ei toistaiseksi käytössä FILE SHOW:ssa)

Tammikuussa päätin kokeilla myös uudempaa FILE MEDIT:iä vastaavanlaisten
kurssitietojen tallentamisessa. Sehän toimi myös mukavasti; tallennuspohja
syntyy automaattisesti ja sitä voisi muokata (en tehnyt sille mitään).
Pieniä kehitystoiveita kuitenkin heti syntyi (en ollut aiemmin käyttänyt
FILE MEDIT:iä mihinkään kovin todelliseen työhön):

1) End-näppäin voisi viedä kentän loppuun (pl. tyhjät), nyt se potkaisee
  vain tyhjää

2) Home voisi olla enemmänkin askellettu (editorin tapaan): ensimmäinen
  painallus veisi kentän alkuun. (Tässä sotkin monta kertaa aineistoni,
  kun painoin sokeasti Home - oletin että se palaa nimen tms. alkuun -
  painoin Ctrl-End tyhjentääkseni kentän ja kappas: sivun ensimmäinen
  kenttä (Sukunimi) oli tyhjentynyt.

3) [turha toive, kunhan tuli mieleen] - End voisi olla myös askeltava
  kuten Home (tämä kuuluu enemmänkin kategoriaan "jos Survon teko
  aloitettaisiin nyt" :))

Saattaisin kyllä jatkossa harkita FILE MEDIT:in käytön jatkamista, sillä
siinä on paljon houkuttelevia piirteitä joita ei FILE SHOW:ssa ole.
Yhden näistä voisin vielä tässä nostaa esiin. Se koskee muuttujien eri
arvojen dokumentointia. Survon datatiedostorakennehan sallii muuttujien
kahdeksaa merkkiä hieman pidempien kuvausten esittämisen nimien perässä
(kuten edellä "Opintojen aloitusvuosi" ym.). Tämä tila ei kuitenkaan
oikein riitä muuttujien *arvojen* täsmällisempään kuvailuun. Ajatellaan
vaikka tällaisia tilanteita (lähde: European Social Survey 2002/2003):

    [a3] Kuinka paljon yhteensä käytätte aikaa radion kuunteluun
       tavallisina arkipäivinä

        0  En ollenkaan
        1  Alle 1/2 tuntia
        2  1/2-1 tuntia
        3  Yli tunnin, mutta korkeintaan 1 1/2 tuntia
        4  Yli 1 1/2 tuntia, mutta korkeintaan 2 tuntia
        5  Yli 2 tuntia, mutta korkeintaan 2 1/2 tuntia
        6  Yli 2 1/2 tuntia, mutta korkeintaan 3 tuntia
        7  Yli 3 tuntia


    [b35] Millä tasolla seuraavista asioista pääasiassa pitäisi
       päättää: Ympäristönsuojelu

        1  Kansainvälisellä tasolla
        2  Euroopan tasolla
        3  Kansallisella tasolla
        4  Alue- tai paikallistasolla

    [b50] Nykyaikaiseen tieteeseen voi luottaa ympäristöongelmien
       ratkaisussa

        1  Täysin samaa mieltä
        2  Jokseenkin samaa mieltä
        3  En samaa enkä eri mieltä
        4  Jokseenkin eri mieltä
        5  Täysin eri mieltä

    [c2] Kuinka usein tapaatte ystäviänne, sukulaisianne tai
       työtovereitanne muuten kuin työasioissa

        1  En koskaan
        2  Harvemmin kuin kerran kuukaudessa
        3  Kerran kuukaudessa
        4  Useita kertoja kuukaudessa
        5  Kerran viikossa
        6  Useita kertoja viikossa
        7  Päivittäin

    [f6] Vastaajan koulutus

        0  Vähemmän kuin peruskoulun ala-aste tai vastaava
        1  Peruskoulun ala-aste (1-6 luokat), kansakoulu
        2  Peruskoulun yläaste (7-9/10 luokat), keskikoulu
        3  Lukio, ylioppilas- tai ammatillinen tutkinto
        5  Opisto- tai korkeakoulututkinto
        6  Lisensiaatin tai tohtorin tutkinto
        7  Ei mitään näistä

Näiden koodaaminen FILE MEDIT -tallennuspohjaan houkuttelisi varmaankin
ajatellen juuri tallennusta. Toisaalta tallennus hoituu nykyään usein
automaattisesti sähköisillä lomakkeilla. Kuvauksille olisi sitä paitsi
käyttöä myös analyysivaiheissa, kuvien piirrossa jne. Jollain lailla
olisi siis hyvä, että kuvaukset kulkisivat aineiston mukana eivätkä
erillisessä tiedostossa.

Muutamat Survoilijat, mm. Markku Verkasalo on ehdottanut tähän käyttöön
Survon datatiedoston kommenttialuetta (FILE STATUS -komennon ja FIELDS-
avainsanan välistä aluetta), jonka pystyy laajentamaan vaikka kuinka
suureksi tiedostoa luotaessa (FILE CREATE). Markku on kehitellyt tähän
sukropohjalta systeemejäkin, jolla näitä kuvauksia voisi hallita. Ehkä
olisi kuitenkin paikallaan pohtia mikä olisi kaikkein yleiskäyttöisin
tapa huolehtia tämänkaltaisen dokumentoinnin järjestämisestä. Vertailun
vuoksi mainitsen, että Statistical Package for Social Sciences -ohjelma
kutsuu näitä tietoja nimellä "VALUE LABELS" (muuttujien kuvaukset ovat
vastaavasti nimeltään "VARIABLE LABELS"). Molempia hallitaan parhaiten
seuraavantyyppisillä komennoilla (valikkovetoisestikin asiat voi hoitaa,
mutta sitä ei voi suositella kenellekään):

 VARIABLE LABELS
 a3 '[a3] Kuinka paljon yhteensä käytätte aikaa radion kuunteluun ' +
   'tavallisina arkipäivinä'
 .

 VALUE LABELS
 a3
   0  'En ollenkaan'
   1  'Alle 1/2 tuntia'
   2  '1/2-1 tuntia'
   3  'Yli tunnin, mutta korkeintaan 1 1/2 tuntia'
   4  'Yli 1 1/2 tuntia, mutta korkeintaan 2 tuntia'
   5  'Yli 2 tuntia, mutta korkeintaan 2 1/2 tuntia'
   6  'Yli 2 1/2 tuntia, mutta korkeintaan 3 tuntia'
   7  'Yli 3 tuntia'
 .

Molempia nimikkeitä hyödynnetään automaattisesti kuvissa ja taulukoissa.
Esim. pylväskuvaan

 GRAPH
  /BAR(SIMPLE)=COUNT BY a3 .

tulevat (pysty)pylväiden alle teksteiksi jälkimmäiset ja kuvan otsikoksi
edellinen. Uskoisin että vähintään yhtä käteviin ratkaisuihin pääsisi
Survolla, kunhan näille etenkin kyselytutkimuksissa hyvin tärkeille
dokumentaation muodoille saataisiin määriteltyä yleiset rakenteet.

terv. Kimmo

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.