6.3 Oddsratio

Risiko-differens eller risiko ratio som defineret på forrige side, er typisk et relevant associationsmål set fra et klinisk synspunkt. I forbindelse med en meget anvendt type af undersøgelse, nemlig de såkaldte case-control studier, er det imidlertid ikke muligt at beregne disse størrelser. Her er man altså nødt til at anvende nogle andre mål for de interessante sammenhænge.

Eksemplet på forrige side involverede et meget stort antal personer, som er blevet fulgt over meget lang tid. Dette vil ofte ikke være muligt. Enten fordi man ikke har 20 år til at vente og se og om folk udvikler lungekræft, eller fordi man ikke har de økomiske ressourcer. Hvis det er økonomien der er problemet, og man derfor begrænser antallet af personer i undersøgelsen, så får man for få ikke-rygere der udvikler lungekræft, hvilket får stor betydning for den usikkerhed der er knyttet til vurderingen af ikke-rygernes risiko. Og hvis man ikke har tid til at vente, så er det naturligvis svært at afgøre hvem der vil udvikle lungekræft, og hvem der ikke udvikler sygdommen. Dertil kommer at denne type undersøgelser altid vil have problemer med frafald - om ikke andet så fordi folk dør før studiet er afsluttet.

Der er derfor flere grunde til at der kan være brug for andre typer af undersøgelser.

Som alternativ anvender man ofte de såkaldte case-control studier. Her tager man udgangspunkt i en gruppe personer som har udviklet lungekræft (cases) og en gruppe af personer som udtrækkes tilfældigt fra den tilsvarende kildepopulation (controls). Derved sikrer man sig, at der selv med forholdsvis få personer i undersøgelsen, er mange som har det interessante udfald (lungekræft).

Derefter undersøger man hvor mange i case-gruppen som ryger, og hvor mange i kontrol-gruppen som ryger, og håber at dette kan sige noget om sammenhængen mellem rygning og risikoen for at udvikle lungekræft. Med dette forsøg kan man altså beregne sandsynligheden for at en person der har udviklet lungekræft er ryger - men denne sandsynligvis er bare ikke interessant. Man er typisk mere interesseret i den “omvendte” sandsynlighed, dvs. sandsynligheden for at en ryger udvikler lungekræft. Denne sandsynlighed er det imidlertid ikke længere muligt at beregne, da personerne i det samlede studie ikke er repræsentative i forhold til populationen - man har jo netop udvalgt ekstra mange personer med lungekræft.

Som alternativ til at beregne risiko, beregner man i stedet odds. Hvorfor det løser problemet nævnt ovenfor, forklares om lidt.

Bemærk desuden at en (lille) andel af kontrollerne vil have lungekræft, da kontrollerne udvælges tilfældigt fra kildepopulationen - dvs. de udvælges uden hensyntagen til om de har udviklet lungekræft eller ej. Dette er vigtigt, hvis resultatet af undersøgelsen skal være brugbart. I mange lærebøger kan man læse at kontrolgruppen skal bestå af raske personer. Dette er ikke nødvendigvis forkert, men det giver nogle statistiske fordele at vælge kontrolpersonerne tilfældigt fra kildepopulationen.

Eksempel

I et case-control studie har man undersøgt sammenhængen mellem niveauet af radon (en radioaktiv gasart) i boligen og lungekræft. Tallene ses her:

	Cases (lungekræft)	Controls (kildepopulation)
Højt radonniveau	162	401
Lavt radonniveau	104	333
I alt	266	734

Med tallene fra eksemplet beregnes odds for at en lungekræft-patient har boet i et hjem med højt radonniveau som:

\[odds_{case}=\frac{\text{Antal case-patienter med højt radonniveau}}{\text{Antal case-patienter med lavt radonniveau}}=\frac{162}{104}=1{,}56\]

For personer fra kontrolgruppen er det tilsvarende tal:

\[odds_{control}=\frac{\text{Antal kontroller med højt radonniveau}}{\text{Antal kontroller med lavt radonniveau}}=\frac{401}{333}=1{,}20\]

Risikoen er altså generelt defineret som \[risiko = \frac{\text{antal personer med sygdommen}}{\text{alle}}\] mens odds defineres som \[odds = \frac{\text{antal eksponerede}}{\text{antal ikke-eksponerede}}\]

Odds-ratio

Odds er i sig selv ikke så interessante, men når man beregner odds-ratio (OR) bliver det brugbart:

\[OR=\frac{odds_{case}}{odds_{control}}=\frac{1{,}56}{1{,}2}=1{,}3\]

Dette fortæller altså at odds for at en lungekræft-patient har boet i en bolig med højt radon-niveau er 1,3 gange højere end odds for at en tilfældig person fra kildepopulationen har boet i en høj-radon bolig (i forhold til at vedkommende har boet i en lav-radon bolig). Og her bliver matematikken interessant: Hvis case- og kontrol-grupperne er udvalgt korrekt, så kan det rent matematisk vises at denne OR er identisk med den risiko-ratio som man egentlig er interesseret i. Dvs. at risikoen for at en person som har boet i en høj-radon bolig udvikler lungekræft vil også være 1,3 gange så stor som risikoen for at en person som har boet i en lav-radon bolig udvikler lungekræft.

Og dette er præcis begrundelsen for at man kan anvende case-control studier, til at udtale sig om risikofaktorer.

Bemærk i øvrigt at hvis kontrol-gruppen er udvalgt så den består af raske, så gælder der stadig at OR for at kræft-patienter har været eksponerede, er lig med OR for at eksponerede udvikler kræft. Dvs. vi kan stadig beregne en brugbar odds-ratio, men vi kan bedre fortolke risiko-ratioen, som kun kan beregnes hvis kontrolgruppen er udvalgt korrekt.