muunnokset paneelidatalle

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Petri Palmu
Sähköposti:    petri.palmu'at'helsinki.fi
Päiväys: 9.5.2003 9:55

Terve !

Olen yrittänyt löytää SURVO:sta toimintoja, joilla tehdä kätevästi
erityyppisiä temppuja datalle, joka sisältää sekä poikkileikkaus- että
aikasarjahavaintoja. Datani koskee joukkoa taloudellisia muuttujia
Suomesta kuntatasolla (n. 450 kpl), joista jokaisesta kunnasta on
saatavilla 8 vuosihavaintoa. Haluaisin muuntaa kaikki muuttujat
"yhdellä iskulla" log-vuosimuutoksiksi, mutta en tiedä, miten muunnos
tehdään ositteittain. Paneelidatan ollessa pinotussa muodossa
(kunnittaiset havainnot allekkain), on havaintorivejä yhteensä n. 450 *
8 kpl. Muunnetussa aineistossa kuntakohtaisia havaintoja olisi sitten
vain 7 kpl, jos tehdään yhdellä periodilla viivästettyjä
log-differenssejä.

SPSS:ssä osa-aineistoittaiset muunnokset voidaan tehdä SPLIT FILE
toiminnan avulla, R:ssä on erilaisia tapoja, joista ainakin yksi
tapahtuu ositusapumuuttujan avulla (tapply -toiminto). Jos muunnettavia
muuttujia olisi vain yksi, niin R:ssä voidaan siirtyä pinotusta
(stacked) "leveään" (unstacked) esitysmuotoon, ja tehdä muunnokset
ikään kuin ositekohtaiset havainnot toimisivat sarakemuuttujina. Tämä
on kuitenkin kankeata, jos ja kun aitoja muuttujia on enemmän kuin
yksi.

Ymmärtääkseni periaatteessa SURVO:n TRANSFORM toiminto tekee muunnokset
vaikka kaikille datan muuttujille, mutta saako toiminnon yhteyteen
lisäoption: "Tee muunnos diff(log(x)) erikseen jokaiselle ositteelle,
missä osittamisen määrää ryhmittelymuuttuja"? Tämän lisäksi
kuntahavaintoihin liittyy muitakin (passiivisia) indeksoivia
taustatietoja, kuten. maakunta, seutukunta, kuntamuoto, johon tietty
kunta kuuluu ja joita tarvitaan esim. maakuntason log-muutosten
aggrekoimisessa (tietty painottamalla log-muutoksia sopivalla
säännöllä). Kaikki raakadatassa oleva ryhmittelytieto pitäisi siis
saada mukaan uuteen, muunnettuun aineistoon, mikä ilmeisesti onnistuu
varsin vaivatta liitämällä yhteen muunnettu data ja alkuperäinen vain
ryhmittelymuuttujien osalta. Täytyy vielä muistaa, että raakadatassa on
yksi havainto per osite enemmän kuin log-muutosten datassa.

Yleisemminkin olen kiinnostunut siitä, miten SURVOSSA hoidetaan
aineiston splittaukset silloin, kun samoja operaatiot (esim.
regressiomallin estimointi) tehdään vaikkapa 500 sadalle ositteelle.
Tällöin IND, CASES,.. -rajoittimien avulla käsipelillä puuhastelu ei
ole kovinkaan tervejärkistä meininkiä.

Ongelmani on ehkäpä "olematon", mutta vielä varsin kokemattomana
SURVO:n käyttäjänä en ole pitkällisten etsintöjeni jälkeen löytänyt
kunnollista teknistä ratkaisua, mikä vähän tuppaa olemaan riesana
muuten antoisassa "survoomisessa".

t. Petri Palmu

---------------------------

Keskusteluryhmän ylläpitäjän huomautus:
Viesti oli alunperin lähetetty 8.5.2003 klo 20:34. Korvasin sen tänään
uudella, koska se oli pitkien rivien vuoksi vaikeasti luettavissa.
Olemme halunneet säilyttää rivinvaihdot, jotta tänne voisi laittaa
myös taulukkomuotoista tietoa. Varjopuolena on, että leikepöydältä
joistain ohjelmista suoraan siirretyt tekstit eivät rivity vaan jäävät
pitkiksi rimpsuiksi. Molempia ominaisuuksia ei yhtaikaa oikein saa. :(
- terv. Kimmo Vehkalahti (webmaster@survo.fi)

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.