Denne side giver en (forsimplet) oversigt over hvilke statistiske metoder man kan anvende til databehandling, afhængigt af typen af de måleskalaer der er anvendt til dataindsamling. De følgende sider/kapitler uddyber de forskellige situationer.

Prediktorer Outcome “Klassisk” test Model
1 binær variabel Numerisk t-test Lineær model
1 kategorial variabel (mere end 2 kategorier) Numerisk ANOVA Lineær model
1 numerisk variabel Numerisk Lineær regression Lineær model
Flere katogoriale* og/eller numeriske variable Numerisk Lineær model
1 eller flere numeriske variable
(evt. kombineret med kategoriale* variable)
Binær Logistisk model
Kategorial Kategorial χ2-test

*: Bemærk at hvis man kombinerer kategoriale og numeriske variable, så bør de kategoriale variable være binære - altså kun indeholde 2 kategorier. Det er i princippet muligt at anvende variable med mere end 2 kategorier, men det komplicerer udførelsen og sandsynligvis også resultatfortolkningen betydeligt. I nogle tilfælde kan man “snyde” hvis det er muligt at betragte den kategoriale variabel som en numerisk skala (det gør man jo f.eks med karakter-skalaen, som egentlig er kategorial, men ofte betragtes som numerisk - når man f.eks. beregner gennemsnitskarakterer).

Hvis man absolut har brug for at kombinere kategoriale (mere end 2 kategorier) og numeriske variable, så skal man søge på internettet efter begrebet “dummy coding”.

Test af lineære normale modeller

De følgende sider vil gennemgå udvalgte eksempler på brugen af lineære modeller til beregning af associationsmål og tilhørende konfidensintervaller (og hypotesetest, hvis man ønsker dette).

I alle tilfælde vil der være tale om et numerisk udfald, mens prediktorerne vil være forskellige (en eller flere kategoriale eller numeriske variable). I sidste del af kurset vil vi kigge på situationer hvor udfaldet er binært - men så er det ikke længere en lineær normal model.

Tallene i de følgende eksempler er alle fiktive, og må altså ikke tages som udtryk for virkelige sammenhænge.