Lineær model med 1 binær og 1 numerisk prediktor

I et forsøg har man ønsket at undersøge sammenhængen mellem koncentration af D-vitamin i blodet og BMD (Bone Mineral Density) der anvendes som mål for risikoen for knogleskørhed) hos en række personer. Man har en formodning om at rygning kan være korreleret til både D-vitamin og BMD (læs mere på siden om confounding), hvorfor man også har registreret om forsøgsdeltagerne ryger eller ej. Data fra forsøget findes her:

#indlæsning af udvidelsespakker
library(jtools)
library(ggfortify)
library(ggplot2)
#indlæs data
df_bmd <- dget("https://statepi.statnoter.dk/data/BMD.robj")
head(df_bmd)
  d.vitamin smoke  BMD
1      83.9     0 1221
2     161.6     0 1011
3      70.6     0 1015
4     127.9     0  804
5     175.9     0 1000
6     166.3     0 1049

Det er velkendt at BMD afhænger af både alder og køn. Hvis dette varierede hos forsøgspersoner, ville det derfor være relevant at medtage disse faktorer i modellen, men i dette tilfælde har alle forsøgspersonerne samme aldersgruppe og køn, dvs. disse to potentielle confoundere er elimineret vha. restriktion.

Først defineres modellen, og vi kigger på om der er problemer med modellens forudsætninger:

model_bmd <- lm(BMD ~ smoke + d.vitamin, data = df_bmd)
autoplot(model_bmd, which = 1:3)

Forudsætninger

Disse 3 plot viser ingen problemer med forudsætninger, så man kan fortsætte med beregninger og effektplot:

effect_plot(model = model_bmd, pred = "d.vitamin", interval = TRUE)

effect_plot(model = model_bmd, pred = "smoke", cat.interval.geom = "line")

summary(model_bmd)

Call:
lm(formula = BMD ~ smoke + d.vitamin, data = df_bmd)

Residuals:
    Min      1Q  Median      3Q     Max 
-426.76  -99.31   -0.43   90.21  444.15 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 998.6172    18.5143  53.938  < 2e-16 ***
smoke1      -52.3404    10.5635  -4.955  8.8e-07 ***
d.vitamin     0.4897     0.1407   3.480 0.000528 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 145 on 817 degrees of freedom
Multiple R-squared:  0.05708,   Adjusted R-squared:  0.05478 
F-statistic: 24.73 on 2 and 817 DF,  p-value: 3.733e-11
confint(model_bmd, parm = c("d.vitamin", "smoke1"))
                2.5 %     97.5 %
d.vitamin   0.2135126   0.765971
smoke1    -73.0752360 -31.605493

Fortolkning

De to effekt-plot viser at rygere i gennemsnit har lavere BMD end ikke-rygere, mens personer med en høj koncentration af D-vitamin i blodet i gennemsnit har en højere BMD.

Det samme kan aflæses i resultaterne, hvor man ydermere får sat tal på disse forskelle: Rygere har i gennemsnit et BMD der er 52 g/cm2 lavere end ikke-rygere (95%-Konfidensinterval = [-73 ; -32]), mens BMD stiger med 0,49 g/cm2 (95%-konfidensinterval = [0,2 ; 0,8]) når koncentrationen af D-vitamin er en måleenhed højere (måleenheden er her mmol/L).