qq-plot tjener overordnet samme formål som histogrammet, nemlig at vurdere fordelingen af data i en stikprøven - f.eks. om data er normalfordelte. Men hvor histogrammet grupperer data, og derfor kræver et større antal målinger, så viser qq-plottet hver enkelt måling.

En lidt grundigere gennemgang af matematikken bag qq-plottet kan findes på http://statnoter.dk side 3.8. Her vises blot hvordan det fremstilles, sammen med nogle få kommentarer til betydningen af plottet.

Helt kort så er et qq-plot en sammenligning mellem de observerede værdier i en stikprøve, og så de værdier man ville forvente hvis målingerne stammede fra en normalfordeling. Hvis dette plot, mere eller mindre, er en ret linje, så er det rimeligt at betragte de observerede målinger som normalfordelte.

Eksemplet tager udgangspunkt i de samme data, som blev brugt til at gennemgå histogrammer:

library(ggplot2) #indlæs det nødvendige kode-bibliotek
myData <- dget("https://statepi.statnoter.dk/data/hemo_data.robj") #indlæs data
head(myData) #vis de første rækker:
  hemoglobin    sex
1       9.68   male
2       9.11 female
3       8.39 female
4       8.57 female
5       9.26   male
6       9.17   male
cat("Antal rækker: ", nrow(myData)) #vis antallet af rækker i datasættet
Antal rækker:  100

qq-plottet fremstilles som vist herunder. Bemærk at mens mange andre plot benytter x og y i mapping-parameteren, så benytter qq-plottet sample

ggplot(data = myData) +
    geom_qq(mapping = aes(sample = hemoglobin))

Plottet viser en nogenlunde ret linje, og man vil derfor accepetere antagelsen om at data stammer fra en normalfordeling. Desuden kan fordelingens median aflæses som sample-værdien svarende til theoretical-værdien 0 (altså ca. 9 mmol/L).

En fordel ved qq-plottet frem for histogrammet er desuden, at det er nemt at opdele. Hvis man f.eks. ønsker at se fordelingen for mænd og kvinder hver for sig:

ggplot(data = myData) +
    geom_qq(mapping = aes(sample = hemoglobin, color = sex))

Ovenstående plot afslører umiddelbart at mænd og kvinder har nogenlunde identisk fordeling af hemoglobin-koncentration, bortset fra at mænds koncentration i gennemsnit er ca. 1 mmol/L højere end kvinders. Det er faktisk ret meget indsigt vi får, ret nemt, blot ved at se på dette plot.