Deskriptive Statistik – Skewness & Kurtosis
Nachdem wir den Median und den Mittelwert und die dazugehörigen Streumaße berechnen können, wollen wir uns nun mit der Schiefe von Daten, der Skewness, sowie der Höhe bzw. Flachheit, der Kurtosis der Daten beschäftigen.
Skewness
Mit der Berechnung der Skewness können wir eine Aussage treffen, wie die Form der Verteilung unserer Daten in Bezug auf die Symmetrie ist. Wie im Handout der letzten Session dargestellt, ist die Standardnormalverteilung eine komplett symmetrische gaußsche Glockenkurve. Je nach Skewness kann man sagen, dass die Kurve unserer Daten symmetrisch oder schief ist. Dabei unterscheidet man folgende Zustände:
Skewness | Beschreibung |
---|---|
kleiner 0 | linksschief bzw. rechtssteil |
größer 0 | rechtsschief bzw. linkssteil |
Um die Skewness zu berechnen, benötigen wir ein extra Package. Diese heißt e1071. Um das Package zu nutzen, müsste ihr es erst installieren (install.packages(“e1071”)) und nachfolgend laden.
library(e1071)
Nun können wir die Skewness berechnen.
skewness(Data$Verkauf)
## [1] 2.005092
Die Skewness beträg ca. 2 und unsere Daten sind somit nicht symmetrisch sondern rechtschief bzw. linkssteil. Diesen Sachverhalt kann man gut mit einem Histogramm und einer Dichtekurve veranschaulichen.
Anhand der Dichtekurve können wir sehr schön sehen, dass die Verteilung am linken Rand steil ansteigt – also linkssteil ist – und das die Daten nach rechts etwas sanfter abfallen – also rechtsschief – sind.
Kurtosis
Mit der Kurtosis können wir berechnen, ob das Maximum unserer Kurve höher, niedriger oder gleich hoch wie das Maximum der Standardnormalverteilung liegt. Auch hier werden verschiedene Zustände unterschieden:
Kurtosis | Beschreibung |
---|---|
ca. 3 | mesokurtisch, so wie Standardnormalverteilung |
größer 3 | leptokurtisch, steilgipflig, supergaußfärmig |
kleiner 3 | platykurtisch, flachgipflig, subgaußförmig |
Zur Berechnung der Kurtosis benötigen wir ebenso dass e1071-Package. Da wir es aber in dieser Session schon einmal geladen haben, müssen wir es nicht erneut laden.
kurtosis(Data$Verkauf)
## [1] 4.292597
Mit einer Kurtosis von 4.3 ist unsere Kurve deutlich steilgipflig, also leptokurtisch.
Skewness und Kurtosis mit p-Wert
Falls einmal die Signifikanz dieser beide Werte gefordert ist, kann man sich diese Anhand des Packages QuantPsyc sehr schnell berechnen lassen. Auch dieses Package müssen wir wie immer erst installieren. Entweder über Tools - Install Packages oder direkt über den Code wie oben bereits einmal erläutert. Installieren muss man jedes Package nur einmal, aber zur Nutzung muss man das gewünschte Package in jeder R-Session neu laden.
library(QuantPsyc)
norm(Data$Verkauf)
## Statistic SE t-val p
## Skewness 2.131262 0.3464102 6.152424 3.815369e-10
## Kurtosis 5.218367 0.6928203 7.532063 2.498002e-14
Wir sehen hier auch, dass sich die Werte für die Skewness als auch für die Kurtosis von den von uns zuerst berechneten Werten unterscheiden. Das liegt daran, dass diesem Package andere Methoden der Berechnung der beiden Größen zugrunde liegen. Dies soll uns aber nicht stören, da die Aussage an sich die Gleiche bleibt.