Aggregointi usean taustamuuttujan suhteen

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Petri Palmu
Sähköposti:    petri.palmu'at'helsinki.fi
Päiväys: 23.5.2003 11:13

Minulla on data, joka käsittää muuttujahavaintoja kunnista
vuositasolla. Haluaisin laskea vuosittaisia esim. seutu- tai
maakunnittaisia keskiarvoja tai summia, eli kaipaisin FILE AGGR
-operaatioon monitasoisen aggregoinnin mahdollisuuden, joka
nopeuttaisi ositelukumäärältään isompien aineistojen
käsittelyä.

Koko Suomellehan aggregointi käy (VUOSI -muuttujan avulla):

/AGGRE <data> BY VUOSI TO <new_data_file> ,

mutta olisiko mahdollista laskea osa-aineistoaggregaatit tyyliin

/AGGRE <data> BY SEUTUK,VUOSI TO <new_data_file> ???

(SEUTUK = seutukuntakoodi)
On tilanteita, jossa lisäksi aggregoidaan jonkin kolmannen
tekijän mukaan. Uusi datatiedosto olisi "kutistettu" versio,
josta on kaikki korkeinta ositustasoa hienojakoisemmat
taustatiedot hävinneet. Kuitenkin uudessa datassa olisi edelleen
mukana tieto korkeampaan ryhmään (esim. maakunta tai lääni)
kuuluvuudesta, jos haluan tehdä jatkoanalyyseja seutukunnista
maakunnittain. Saattaa myös olla, että alkuperäisessä aineistossa
oli seutukuntakoodin (SEUTUK -muuttuja) lisäksi seutukunnan
varsinaisen nimen sisältävä muuttuja, joka myös olisi
tarpeellinen tieto uudessa aineistossa.

t. Petri

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.