Underviser:
Thomas Bendsen
Lektor, Cand. Scient.
VIA University College, Bioanalytikeruddannelsen
thbe@via.dk
Kursut omhandler grundlæggende brug af R og RStudio. Kurset fokuserer på hvordan data håndteres og bearbejdes effektivt, og hvordan man fremstiller grafer til illustration af sammenhænge i data.
Inden man starter på kurset skal man have installeret programmerne R og RStudio. Bemærk at det kræver Win 10/11 eller Mac OS 10.15 eller nyere.
Først installeres R, som hentes her: https://mirrors.dotsrc.org/cran/
Dernæst installeres RStudio, som hentes her: https://posit.co/download/rstudio-desktop/ (scroll ned på siden, så kommer links til de forskellige styresystemer).
RProgramming: “R Programming for Data Science”, Roger D.
Peng, Leanpub, 2022. Bogen kan hentes gratis her: https://leanpub.com/rprogramming.
Bemærk at vi kun benytter udvalgte kapitler fra bogen, som suppleres
med:
RNoter, webside: https://rkursus.statnoter.dk (revideres løbende)
Opgaver, findes ligeledes på https://rkursus.statnoter.dk
Læs den angivne litteratur og prøv at lave opgaverne inden vores fælles timer. Når vi mødes, bruger vi tiden på, i fællesskab, at gennemgå opgaverne og diskutere relevante problemstillinger der måtte opstå undervejs.
Man behøver ikke nødvendigvis læse al den angivne litteratur. Hvis man er i stand til at løse opgaverne, så er det tilstrækkeligt - og hvis man kan google sig til svaret på et spørgsmål i stedet for at finde det i pensum, er det også fint.
Hvis R driller er man altid velkommen til at sende en mail til thbe@via.dk. Hvis muligt er det en god idé at inkludere det R-script man arbejder på i mailen.
Inden timerne arbejdes med:
Video som gennemgår typisk arbejdsgang i RStudio: https://rkursus.statnoter.dk/video/?video=RStudio.mp4 (lyden er beklageligvis ikke helt i top)
Læs RProgramming kapitel 3 (kan springes over uden noget tab af forståelse, men er meget interessant).
Læs RProgramming kapitel 5.1 - 5.8 og 5.11 - 5.13 (hvis man føler sig meget overskudsagtigt, sker der ikke noget ved at inkludere de øvrige afsnit i kapitel 5).
Læs RNoter side 1.1 til 1.6. Meget er gentagelse af siderne i RProgramming, men specielt side 1.4 bør læses.
Opgaver 1.1 - 1.3
Læs RProgramming kapitel 13
RNoter side 2.1 - 2.3
Video som introducerer dplyr-pakken. Videoen tilføjer ikke meget nyt i forhold til ovenstående pensum, og kan ses som et alternativ:
Opgaver 2.1 - 2.3
RNoter side 3.1 - 3.6
Opgaver 3.1 - 3.3
RNoter side 4.1 og 4.2
Opgaver 4.1 - 4.3
Send gerne “cases” fra jeres egen praksis. Så kigger vi på dem i fællesskab. Case’ne går nok hen og bliver ret omfattende. I første omgang så kig dem igennem uden at fokusere for meget på koden, men blot som inspiration til hvad man kan gøre. Så kan I altid vende tilbage til dem og nærstudere koden, den dag I får brug for det.
Indtil videre ligger der en case fra Jørgen her, hvor fokus er på at indlæse data fra flere forskellige Excel-filer:
https://rkursus.statnoter.dk/plan/jbha
I skal bruge en kode for at tilgå siden, den er tidligere sendt pr. mail.
Her er en case fra Jakob, som mere handler om statistik (lineær regression):
https://rkursus.statnoter.dk/plan/jjor/
Et eksempel med et lidt mere tricky eksempel på indlæsning af data fra en txt-fil, og “omdannelse” af data, er her:
https://rkursus.statnoter.dk/plan/mhni
Ovenstående eksempel gik hen og blev temmelig kompliceret. Efter lidt inspiration fra Maja er her den hurtige udgave af samme opgave:
https://rkursus.statnoter.dk/plan/mhni/index2.html
Endelig når der måske at komme et sidste eksempel, på brug af R til at lave kontrolkort:
https://rkursus.statnoter.dk/plan/tslo
Undervejs i kurset har vi desuden kigget lidt på hvordan man arbejder med dato- og tidsformater. For en mere systematisk gennemgang, så læs: