Satunnaissumman jakaumaa Survomassa

[viesti Survo-keskustelupalstalla (2001-2013)]

Kirjoittaja: Reijo Sund
Sähköposti:    reijo.sund'at'stakes.fi
Päiväys: 27.8.2002 16:40

Tulipa tässä mieleen tuosta Sepon esittämästä mielivaltaisella
tarkkuudella laskemisesta yksi asiaan vain mutkan kautta liittyvä
ongelma, jonka kanssa jouduin jossain vaiheessa vähän painiskelemaan.

Lyhyesti: Tarkoituksena oli laskea kuntakohtaisesti
terveydenhuoltomenoihin liittyvää taloudellista riskiä. Käytettävissä
oli yksilökohtaista aineistoa siten, että jokaisen sairaalassa olleen
potilaan koko vuoden aikana kertyneet hoitokustannukset olivat
tiedossa.  Näin ollen yhden kunnan hoitokustannukset voitiin
esittää summana S=x1+x2+...+xn, jossa x1, x2, ..., xn ovat potilaiden
kustannuksia ja n on potilaiden määrä ko. kunnassa.

Olettamalla x1, x2, ..., xn olevan riippumattomia ja samoin
jakautuneita satunnaismuuttujia ja n olevan ei-negatiivinen
kokonaislukuarvoinen satunnaismuuttuja saadaan kokonaiskustannusten
jakauma suoraan vastaavan satunnaissumman jakaumana. Kiinnittamällä
x ja n jakaumat pystyy satunnaissumman jakauman ainakin
erikoistapauksissa laskemaan suljetussa muodossa esim. konvoluutioita
käyttäen. Valitettavasti jakauma tulee usein erittäin monimutkaiseksi
ja onkin järkevämpää pyrkiä approksimoimaan jakaumaa jotenkin.

1) Panjer-rekursio
Pienen pähkäilyn jälkeen törmäsin tekniikkaan, joka tunnetaan nimellä
Panjerin rekursio. Sitä käyttämällä on mahdollista määrätä
satunnaisumman jakauma numeerisesti muutamille n jakaumille. Ko.
tilanteessa oli järkevä olettaa n olevan binomijakautunut, joten
Panjer rekursio vaikutti periaatteessa käyttökelpoiselta ja
implementoin sen omaan käyttöön sopivaksi Survo-moduliksi.

Tässä vaiheessa tuli laskutarkkuus vastaan. Väestörikkailla kunnilla
rekursio ei lähtenyt pyörimään, sillä alkuarvo pyöristyi väkisin
nollaan. Ratkaisuksi löytyi lopulta ns. Waldmanin layerointi, jossa
rekursiota pyöritettiin useamman kerran laskutarkkuuden salliman
alueen yli ja jokaisen "vaihdon" yhteydessä skaalattiin rekursion
tarvitsemat arvot sopivasti. Onnistuin sisällyttämään tämänkin
kikkailun moduliini ja sain estimoitua tarvitsemani jakaumat.

2) Bootstrap
Periaatteessa parametriset jakaumaoletukset voivat olla liian
rajoittavia. Vaikka Panjer-rekursiolla voisikin varsin helposti
laskea numeerisesti mielivaltaisten x jakaumien satunnaisummat
muutamalle n jakaumalle (binomi, poisson, geometrinen, negatiivinen
binomi) oli houkutteleva ajatus irtautua näistä oletuksista.

Ratkaisuksi tuli bootstrap-simulointi, jossa kustannusjakaumasta
lisättynä ei-palveluja käyttäneiden nollakustannuksilla (atomi
nollaan) otettiin replikaatteja. Tämä oli varsin helppo ohjelmoida
tehokkaaksi moduliksi. Vähän miettimällä on helppo nähdä, että
em. bootstrapissä n osoittautuu itse asiassa binomijakautuneeksi ja
näin ollen sekä binomijakauma-Panjer-rekursio ja bootstrap johtavat
yhteneviin tuloksiin.

3) Normaaliapproksimaatio
Kokonaisumman termien satunnaisesta määrästä johtuen keskeinen
raja-arvolause ei ole suoraan sovellettavissa, mutta silti oli
houkutteleva ajatus kokeilla normaaliapproksimaatiota, sillä
ehdollisten odotusarvoja käyttämällä saadaan helposti laskettua
E(S)=E(N)E(X) ja var(S)=E(N)var(X)+var(N)[E(X)]^2. Kokeilujen
perusteella approksimaatio oli hämmästyttävän hyvä jo pienillä
n:illä (esim. tuhannen asukkaan kunta). Tämä oli sinänsä vähän
pettymys, sillä niin Panjer-rekursion kuin bootstrapinkin
implementointi vaati jonkun verran työtä.

En nyt oikein tiedä, mikä viestini pointti oikein oli, mutta ehkäpä
tämä menee jonkinmoisena kuvauksena tilanteesta, jossa Survo
jälleen kerran osoittautui loistavaksi käyttöympäristöksi
tilastolliseen tietojenkäsittelyyn :).

Jos Panjer-rekursio tai bootstrap modulit kiinnostavat, niin ne saa
minulta pyytämällä (eivät todellakaan ole käyttäjäystävällisiä ;) ).

Lisätietoa aiheesta myös seuraavissa jutuissa:
Mikkola, Hennamari & Sund, Reijo & Linna, Miika & 
Häkkinen, Unto (2002): Comparing the financial risk of bed-day and
DRG based pricing types using parametric and simulation methods.
Health Care Management Science (accepted).

Sund, Reijo (2002): Parametric and non-parametric techniques for the
modelling of financial risk in the public health care system
(working paper).

Vastaukset:
[ei vastauksia]

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.