4.2 Overblik

Denne side giver en (forsimplet) oversigt over hvilke statistiske metoder man kan anvende til databehandling, afhængigt af typen af de måleskalaer der er anvendt til dataindsamling. De følgende sider/kapitler uddyber de forskellige situationer.

*: Bemærk at hvis man kombinerer kategoriale og numeriske variable, så bør de kategoriale variable være binære - altså kun indeholde 2 kategorier. Det er i princippet muligt at anvende variable med mere end 2 kategorier, men det komplicerer udførelsen og sandsynligvis også resultatfortolkningen betydeligt. I nogle tilfælde kan man “snyde” hvis det er muligt at betragte den kategoriale variabel som en numerisk skala (det gør man jo f.eks med karakter-skalaen, som egentlig er kategorial, men ofte betragtes som numerisk - når man f.eks. beregner gennemsnitskarakterer).

Hvis man absolut har brug for at kombinere kategoriale (mere end 2 kategorier) og numeriske variable, så skal man søge på internettet efter begrebet “dummy coding”.

Prediktorer	Outcome	“Klassisk” test	Model
1 binær variabel	Numerisk	t-test	Lineær model
1 kategorial variabel (mere end 2 kategorier)	Numerisk	ANOVA	Lineær model
1 numerisk variabel	Numerisk	Lineær regression	Lineær model
Flere katogoriale* og/eller numeriske variable	Numerisk	—	Lineær model
1 eller flere numeriske variable (evt. kombineret med kategoriale* variable)	Binær	—	Logistisk model
Kategorial	Kategorial	χ²-test	—

Test af lineære normale modeller

De følgende sider vil gennemgå udvalgte eksempler på brugen af lineære modeller til beregning af associationsmål og tilhørende konfidensintervaller (og hypotesetest, hvis man ønsker dette).

I alle tilfælde vil der være tale om et numerisk udfald, mens prediktorerne vil være forskellige (en eller flere kategoriale eller numeriske variable). I sidste del af kurset vil vi kigge på situationer hvor udfaldet er binært - men så er det ikke længere en lineær normal model.

Tallene i de følgende eksempler er alle fiktive, og må altså ikke tages som udtryk for virkelige sammenhænge.