Boxplot
Nachdem wir wieder unsere Daten in unsere R Session geladen haben, wollen wir uns nun mit der Erstellung von Boxplots beschäftigen.
Daten <- read.csv("VITB12.csv", header = T, sep = ";")
Boxplot erstellen
Um in R einen Boxplot zu erstellen, gibt es die boxplot()-Funktion. Hierbei müssen wir die Tilde (~) als Zeichen verwenden. Diese Tilde kann man mit “in Abhängigkeit von” übersetzen. Wir wollen nun die Methylmalonsäure in Abhängigkeit von der Altersgruppe genauer betrachten.
boxplot(Daten$Methylmalonsäure ~ Daten$Altersgruppe)
Wir sehen wieder die typische Beschriftung des Plots und dass das Bild sehr gestaucht ist aufgrund des einen Ausreißers mit einem sehr hohen Methylmalonsäure-Messwert. Wir sollten den Boxplot weiter anpassen.
Weitere Anpassung des Boxplots
Genau wie bei den Histogrammen und Scatterplots, kann die man die Eigenschaften der Boxplots durch zusätzliche Argumente in der boxplot()-Funktion anpassen. Die dementsprechenden Argumente sind in den meisten Visualisierungsfunktionen die gleichen:
- main = – Hinzufügen/Anpassen der Überschrift
- xlab = und ylab = – Bezeichnung der x-Achse und der y-Achse ändern
- xlim = und ylim = – Ausprägung (Start und Ende) der jeweiligen Achse anpassen
- col = – Farbe der Punkte des Scatterplots ändern
- las = 1 – Beschriftung der y-Achse ist horizontal
Nun wollen wir eine solche Anpassung unseres Boxplots durchführen.
boxplot(Daten$Methylmalonsäure ~ Daten$Altersgruppe,
main = "MMS in Abhängigkeit der Altersgruppe",
xlab = "Altersgruppe (Jahre)",
ylab = "Methylmalonsäure in nmol/l",
ylim = c(0,2000),
col = "steelblue",
las = 1)
Nun sieht der Boxplot doch schon deutlich besser skaliert aus. Eine genauere Erläuterung der Elemente eines Boxplots finde ihr im Video.
Hinzufügen der Notch
Bei den Boxplots kann man in R eine sogenannte Notch hinzufügen. Hierbei handelt es sich um eine “Einkerbung” um den Median (mittlerer dicker Strich der Box). Diese “Einkerbung” zeigt das 95%-Konfidenzintervall des Medians an. Wir nutzen das Argument “notch = T”
boxplot(Daten$Methylmalonsäure ~ Daten$Altersgruppe,
main = "MMS in Abhängigkeit der Altersgruppe",
xlab = "Altersgruppe (Jahre)",
ylab = "Methylmalonsäure in nmol/l",
ylim = c(0,2000),
col = "steelblue",
las = 1,
notch = T)
Boxplot horizontal ausrichten
Mit dem Argument “horizontal = T” kann der Boxplot auch horizontal ausgerichtet werden.
boxplot(Daten$Methylmalonsäure ~ Daten$Altersgruppe,
main = "MMS in Abhängigkeit der Altersgruppe",
xlab = "Altersgruppe (Jahre)",
ylab = "Methylmalonsäure in nmol/l",
ylim = c(0,2000),
col = "steelblue",
las = 1,
notch = T,
horizontal = T)
Ausreißer entfernen
Um die Ausreißer (Punkte außerhalb des Boxplots) zu entfernen, könnt ihr das Argument “outline = F” nutzen.
boxplot(Daten$Methylmalonsäure ~ Daten$Altersgruppe,
main = "MMS in Abhängigkeit der Altersgruppe",
xlab = "Altersgruppe (Jahre)",
ylab = "Methylmalonsäure in nmol/l",
ylim = c(0,2000),
col = "steelblue",
las = 1,
notch = T,
horizontal = T,
outline = F)
Nun könnt ihr die grundlegenden Anpassungen eurer Boxplots vornehmen.