Datenformen


Zurück
R – Einführung
8:32
Download von R
2:11
Erste Schritte und Rechenregeln in R
8:53
Klassische Rechenoperationen in R
4:33
Spezielle Rechenoperationen – Logarithmus
7:02
Boolesche Operatoren
4:25
Variablen
5:13
Vektor-Indexierung
4:12
Runden
3:50
Datentypen
5:42
Datenformen
3:23
Samples
4:24
Subset
5:43
dat-Dateien laden
0:45
Umgang mit Vektoren
5:45
Umgang mit Vektoren – Details
3:10
CBIND & RBIND
2:54
Zahlenreihen
7:19
Dataframe-Indexierung
5:10
Überblick verschaffen
7:23
Datensatz vorbereiten
5:51
Daten manipulieren
8:45
Deskriptive Statistik – Grundlagen
7:45
Deskriptive Statistik – Mittelwert und Co.
5:00
Grundlagen der Visualisierung
10:02
Histogramme
8:30
Boxplot
7:12
Scatterplot
5:47
Plots kombinieren
9:38
weitere Visualisierungen
3:05

Nachdem wir uns mit den Datentypen beschäftigt habe, wollen wir nun lernen, wie diese Datentypen organisiert sein können. Die Organisation unserer Daten nennen wir Datenformen.

Variablen

Die Datenform der einzelnen Variable (die z.B. verschiedene Datentypen enthalten kann) kennen wir schon. Wir wollen die Zahlen von 1 bis 100 in einem neuen Vektor anlegen:

a <- 10
a
## [1] 10

Vektoren

Wenn wir Daten desselben Datentyps in einer neuen Variable speichern wollen erhalten wir einen Vektor. Hier ein Beispiel:

b <- 1:100
b
##   [1]   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17  18
##  [19]  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35  36
##  [37]  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53  54
##  [55]  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71  72
##  [73]  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89  90
##  [91]  91  92  93  94  95  96  97  98  99 100

Ein Vektor ist sozusagen eine Varibalen mit mehr als einem Element. Das in einem Vektor immer Daten desselben Typs vertreten sein müssen zeigt folgende kleine Demonstration:

Test <- c(1, 3, 4L, "Peter")
Test
## [1] "1"     "3"     "4"     "Peter"

Führen wir den Code aus, in dem wir 3 verschiedene Datentypen in einer neuen Variable und somit einem neuen Vektor speichern wollen, werden alle Daten in den Typ character umgewandelt. Dies erkennen wir daran, das alle Werte des Vektors nun in Anführungszeichen stehen und an der Abkürzung chr oben rechts im Environment.

Table

Die nächste Datenform ist die Table. Es handelt sich hierbei um nichts anderes als eine Tabelle. Allerdings gilt hierbei auch, dass in einer Table nur Daten desselben Typs organisiert werden können.

Dataframe

Haben wir eine Tabelle, in der Daten verschiedenen Typs organisiert sind, so sprechen wir von einem Dataframe. Die meisten Übungsdatensätze (abzurufen mit der data()-Funktion) in R sind Dataframes. Ein Beispiel ist der Datensatz iris. Hierbei handelt es sich um Messungen von 4 verschiedenen Blatteingenschaften von 3 verschiedenen Blumenspezies. Wir wollen uns die ersten 6 Zeilen des Datensatzen einmal anschauen:

head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

Würden wir nur die ersten 4 Spalten haben, so würde es sich um eine Table handeln. Aufgrund der Saplte 5, die einen factor enthält, handelt es sich um ein Dataframe.

Lists

Die höchstdimensionierte Datenform ist die Liste. Hier können Daten aller Formen zusammen organisiert sein. Es kann eine Zusammenstellung von Variablen, Vektoren, Tables und Dataframes sein.

Viele Funktionen in R (Grafikfunktionen, statistische Tests) erstellen im Hintergrund eine Liste, auf deren Elemente wir zugreifen können, um in unserem Code z.B. Ergebnisse in neue Variablen zu gießen um mit ihnen gleich weiterrechnen zu können.

Nun kennen wir die wichtigsten Datentypen und Datenformen in R un können uns in den nächsten Sessions damit beschäftigen, wie wir mit Vektoren umgehen, wie wir Daten selbst erstellen und zufällige Ziehungen aus unseren Daten generieren können.

Skripte, Audio (Stream & Download)
Bitte melde dich an, um diesen Inhalt zu sehen.,
Login | Jetzt registrieren