[vastaus aiempaan viestiin]
| Kirjoittaja: | Seppo Mustonen |
|---|---|
| Sähköposti: | - |
| Päiväys: | 25.3.2003 10:03 |
Reijo Sund kirjoitti mm.:
> Lisätoivomuksena olisi lähtövektorista (tai matriisista)
> bootstrap-replikaatin ("satunnaisotoksen takaisinpanolla") tuottava
> operaatio. Yksinkertainen ja usein tarvittava temppu.
Tämä vaihtoehto todella puuttuu, vaikka matriisitulkissa otoksia on
voinut tuottaa "ilman takaisinpanoa" komennolla MAT #SAMPLES jne.
Olenkin nyt toteuttanut alustavasti uuden komentoparin
MAT C=#SAMPLE(A,m,URS,siemenluku) / Unrestricted Random Sampling
MAT C=#SAMPLE(A,m,SRS,siemenluku) / Simple Random Sampling
jotka tekevät matriisin A riveistä m "havainnon" otoksen ja tallettavat
otokseen poimitut rivit valintajärjestyksessä matriisiksi C.
Edellissä otanta tapahtuu palauttaen (takaisinpanolla) ja jälkimmäisessä
palauttamatta (ilman takaisin panoa).
Esimerkki:
Tehdään ensin "populaatiomatriisi" A:
n=100
MAT A=ZER(n,5)
MAT #TRANSFORM A BY int(1000*rand(2003))
MAT RLABELS "R" TO A
Poimitaan tästä n x 5 -matriisista 20 rivin otos "takaisinpanolla"
eli Reijon toivomalla tavalla:
MAT C=#SAMPLE(A,20,URS,24565684)
MAT LOAD C
MATRIX C
Sample_of_size_20_from_A
/// 1 2 3 4 5
R85 58 286 708 169 697
R90 168 688 49 403 201
R94 195 936 367 267 548
R77 592 167 848 528 506
R2 342 981 854 962 64
R27 448 750 787 321 251
R93 265 391 529 539 994
R13 175 103 687 418 388
R70 415 417 652 636 410
R72 186 648 505 31 770
R81 17 727 998 311 215
R46 138 679 174 191 926
R64 870 644 821 993 741
R20 880 526 345 400 591
R71 32 784 17 477 972
R27 448 750 787 321 251
R85 58 286 708 169 697
R6 800 306 574 708 558
R35 531 298 263 3 600
R5 200 472 505 750 901
Huom. tässä rivit R27 ja R85 on on poimittu kahdesti.
Harkinnassani on ollut jo pitempään erityisen SAMPLE-operaation
lisääminen Survoon, vaikka otantaa eri periaatteilla on kyllä
pystynyt harrastamaan jo nykyisinkin yhdistelemällä olemassa olevia
toimintoja.
SAMPLE kohdistuisi lähinnä Survon datatiedostoihin ja tekisi otoksia
esim. tyyliin
SAMPLE OTOS1 OF KUNNAT / TYPE=URS SIZE=50
Muita otantatapoja olisivat ainakin TYPE=SRS ja TYPE=SYSTEMATIC.
Keskustelin asiasta Reijon kanssa. Hän ehdotti, että tähän voisi
sisältyä myös optiona usean otoksen luonti peräkanaa samaan
tiedostoon (eri otokset indikaattorimuuttujan osoittamina), jolloin
pääsisi suoraan FILE AGGR:illa tekemään bootstrap-tekniikan mukaisia
yhteenvetoja.
Ennen SAMPLE-operaation toteutusta jään odottamaan lisäkommentteja.
Em. MAT #SAMPLE:t tulevat mukaan versiosta 1.34 lähtien.
| Vastaukset: |
|---|
Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!