Re: Parittaisen datan testaamisesta

[vastaus aiempaan viestiin]

Kirjoittaja: Reijo Sund
Sähköposti:    -
Päiväys: 20.11.2007 23:24

> Onko olemassa standardilähestymistapaa pieneen (n < 30)
> aineistoon, joka on tavallaan parittainen (matched case control,
> iän mukaan), mutta jossa jokaista tapausta (C) vastaakin kaksi
> verrokkia (V).

Tämä onkin ihan kiinnostava kysymys. Periaatteessa menetelmiä
on, mutta pienten aineistojen kanssa voi tulla hankaluuksia.
Kokeillaan pienellä koeaineistolla, mitä saadaan aikaiseksi.

Tarkastellaan siis aineistoa, jossa muuttuja A vastaa tapauksen
mittauksia ja B sekä C tapauksen kaltaistettujen verrokkien
mittauksia. Määritellään samalla pari apumuuttujaa, jotka
kertovat mikä "pari" on kulloinkin kyseessä.

*..................................................................
*DATA KOE,A,B,C
CA       B        C      P1 P2 P3 P4 P5
A110     100      103     1  0  0  0  0
*107     108      106     0  1  0  0  0
*117     110      108     0  0  1  0  0
*118     111      117     0  0  0  1  0
B115     115      111     0  0  0  0  1
*
*
*FILE COPY KOE TO NEW Q01
*..................................................................

> Ainakin Y_V1 ja Y_V2 arvoista voisi ottaa keskiarvon
> ja käyttää tätä keskiarvoa uutena muuttujana Y_V

Tällä tavalla saadaan jonkunmoinen tulos helposti
aikaiseksi, mutta tapa ei ole suositeltava.

*..................................................................
*VAR BCMEAN=(B+C)/2 TO Q01
*COMPARE Q01(A),Q01(BCMEAN),CUR+2 / TEST=PAIRED
*
*Paired comparisons:
*Samples: N=5            Q01(A)          Q01(BCMEAN)     Difference
*Mean                     113.4000        108.9000       -4.500000
*Standard deviation       4.722288        5.029911        3.708099
*Paired t=-2.714 (P=0.0267 one-sided t test df=4)
*Wilcoxon signed ranks test=-1.826 (P=0.0339 normal approximation)
*Critical levels by simulation:
*               Differences Signed rank
*Critical level 0.06322     0.06322  N=100000
*Standard error 0.00077     0.00077
*..................................................................

Standarditapa on muotoilla ongelma regressiomallin muotoon.
Otetaan tapauksen ja verrokkien mittaukset selitettäväksi
muuttujaksi ja selitetään niitä ryhmään- ja "pareihin"
kuulumisella. Tätä varten tarvitaan verrokkiryhmän indikoiva
dummy-muuttuja ja dummyt jokaiselle "parille". Malli on siis
muotoa: Y(it) = a(i) + bx(t), jossa i vastaa "paria" ja
t ryhmää.

Ongelma tässä lähestymistavassa ovat kaltaistettujen "parien"
muodostamat klusterit. Käytännössä parimuuttujat ovat pelkkiä
kiusaparametreja ja standardiratkaisu olisikin käyttää
estimoinnissa kiusaparametrit eliminoivaa ehdollista
uskottavuusfunktiota tai käsitellä parimuuttujia
satunnaisefekteinä monitasomallissa. Pienten aineistojen
ja ei-normaalisten mittausten kanssa voi silti tulla
hankaluuksia.

Oletetaan mittaukset nyt normaalisti jakautuneiksi ja
kokeillaan käyttää tavallista regressioanalyysia, vaikka
sen antamat tulokset ovatkin klusteroinnin takia luultavasti
hieman harhaisia.

*..................................................................
*FILE COPY Q01 TO NEW Q02
*FILE COPY Q01 TO Q02
*FILE COPY Q01 TO Q02
*..................................................................
*VAR A=B TO Q02     / IND=ORDER,6,10
*VAR A=C TO Q02     / IND=ORDER,11,15
*VAR RYH:1=0 TO Q02 / IND=ORDER,1,5
*VAR RYH:1=1 TO Q02 / IND=ORDER,6,15
*..................................................................
*REGDIAG Q02,CUR+2 / VARS=A(Y),RYH(X),P2(X),P3(X),P4(X),P5(X)
*
*Regression diagnostics on data Q02: N=15
*Regressand A         # of regressors=6 (Constant term included)
*Condition number of scaled X: k=5.39034
*Variable Regr.coeff. Std.dev.     t
*Constant  107.33333  1.9209694     55.875
*RYH      -4.5000000  1.5402020    -2.9217
*P2        2.6666667  2.2959976     1.1614
*P3        7.3333333  2.2959976     3.1940
*P4        11.000000  2.2959976     4.7909
*P5        9.3333333  2.2959976     4.0650
*Variance of regressand A=28.11428571 df=14
*Residual variance=7.907407407 df=9
*R=0.9051 R^2=0.8192 Durbin-Watson=2.911
*..................................................................

Regressiomallilla saadaan otettua huomioon tapausten ja
verrokkien eri määrät. RYH-muuttujaan liittyvä t-arvo onkin
pienempi kuin käytettäessä verrokkien mittausten keskiarvoa
tavallisessa parittaisessa testissä.


> Vielä tulee mieleen jonkimoiset simulointi- tai
> uudelleenotantamenetelmät.

Yksi tähän kategoriaan kuuluva tapa voisi olla hiukan
muunnettu bootstrappaus, jossa muodostetaan ensin
mahdolliset tapaus-verrokkiparit (n=2*tapausten määrä)
ja poimitaan tästä aineistosta sitten tapausten määrän
kokoisia replikaatteja ja testataan niitä parittaisella
testillä ja otetaan tulokset talteen.

Seuraava pätkä sukroineen tuottaa toimituskentän loppuun
tuhat replikaattia parittaisen simulaatiotestin p-arvosta.
Erittäin pienen aineiston vuoksi tulokset eivät ole kovin
siististi jakautuneita, mutta hiukan isommilla aineistoilla
tämä tapa voisi olla kokeilemisen arvoinen ainakin
herkkyysanalyysimielessä.

*..................................................................
*FILE COPY Q01 TO NEW Q03
*FILE COPY Q01 Q03
*..................................................................
*VAR B=C TO Q03 / IND=ORDER,6,10
*..................................................................
*MAT SAVE DATA Q03 TO Q / VARS=A,B
*..................................................................
*MAT R=#SAMPLE(Q,5,1000,URS,111)
*FILE SAVE MAT R TO R
*VAR REP=int((ORDER-1)/5)+1 TO R
*..................................................................
*TUTSAVE LOOP
*{init}{tempo -1}{W2=1}
*{R}{R}{ref set 1}{d12}{r16}{ref set 2}
+ luuppi:
*{ref jump 1}{erase}IND=REP,{print W2}
*{R}{pre}{act}{ref jump 2}{save word W3}
*{line start}{d3}{u}{ins line}{print W3}
*{W2=W2+1}
- if W2 <= W1 then goto luuppi
*{end}
*
*/LOOP 1000
*..................................................................
*IND=REP,1
*FILE COPY R TO NEW T
*COMPARE T(A),T(B),CUR+2 / TEST=PAIRED
*

terv.
Reijo

Vastaukset:

Survo-keskustelupalstan (2001-2013) viestit arkistoitiin aika ajoin sukrolla, joka automaattisesti rakensi viesteistä (yli 1600 kpl) HTML-muotoisen sivukokonaisuuden. Vuoden 2013 alusta Survo-keskustelua on jatkettu entistäkin aktiivisemmin osoitteessa forum.survo.fi. Tervetuloa mukaan!

Etusivu  |  Keskustelu
Copyright © Survo Systems 2001-2013. All rights reserved.
Updated 2013-06-15.