To parrede stikprøver

Denne, og den forudgående, side forudsætter at man fra tidligere har styr på forskellen mellem et parret og et uparret forsøgsdesign. Hvis ikke, kan det være en fordel at læse https://statnoter.dk side 6.9 - 6.12.

Denne side tager udgangspunkt i eksemplet på statnoter side 6.11, som bør læses først.

data <- dget("https://statepi.statnoter.dk/data/pairedTest.robj") #indlæs data fra statnoter side 6.11
head(data)
  Patient nr. bp_before_treatment bp_after_treatment
1           1                  80                 82
2           2                 100                 91
3           3                  86                 82
4           4                 109                113
5           5                 103                 97
6           6                 112                106

Bemærk først at data nu er struktureret lidt anderledes end med den uparrede test. Egentlig har vi her en udfaldsvariabel som er blodtryk, og en prediktor som er “før behandling” eller “efter behandling”. Altså præcist samme setup som for den uparrede test, et numerisk udfald og en binær prediktor. Problemet her er at der faktisk er en relevant prediktor-variabel mere, nemlig “patient nr”. I dette eksempel ønsker vi f.eks. ikke at før-målingen fra patient nr 1 sammenlignes med efter-målingen fra patient nummer 2. Dvs. at hvis vi vil notere data på samme måde som i forrige eksempel, har vi brug for en kolonne med blodtryk, en kolonne med før/efter og en kolonne med patientnummer, men i dette eksempel holder vi fast i den klassiske notation, med en “før”-kolonne og en “efter”-kolonne.

t-testen laves nu nemt som vist her:

t.test(x = data$bp_before_treatment, y = data$bp_after_treatment, paired = TRUE)

    Paired t-test

data:  data$bp_before_treatment and data$bp_after_treatment
t = 2.6656, df = 14, p-value = 0.01846
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 0.5861222 5.4138778
sample estimates:
mean difference 
              3 

Og det er egentlig det. Ovenfor kan man læse at der er en statistisk signifikant effekt af behandlingen, idet middelforskellen mellem “før” og “efter” ligger et sted i intervallet [0,59 ; 5,4] mmHg.

NB: Her skal den kvikke læser gerne tænke: OK - behandlingen har en effekt, men er blodtrykket steget eller faldet? Det er jo ret væsentligt i behandlingssammenhæng. Det fremgår ikke umiddelbart om middelforskellen er beregnet som “før minus efter”, eller “efter minus før”. Men det er selvfølgelig nemt at afgøre ved selv at beregne de to middelværdier:

cat("Middel før: ", round(mean(data$bp_before_treatment), 1), "\n")
Middel før:  99.9 
cat("Middel efter: ", round(mean(data$bp_after_treatment), 1), "\n")
Middel efter:  96.9