R Sortieren Sie einen Datenrahmen mit Order()
In der Datenanalyse können Sie sortieren Ihre Daten entsprechend einer bestimmten Variable im Datensatz. In R können wir die Hilfe der Funktion order() nutzen. In R können wir einen Vektor einer kontinuierlichen Variablen oder Faktorvariablen leicht sortieren. Das Anordnen der Daten kann von erfolgen aufsteigend or absteigend Ordnung.
Syntax:
sort(x, decreasing = FALSE, na.last = TRUE):
Streit:
- x: Ein Vektor, der eine kontinuierliche Variable oder eine Faktorvariable enthält
- abnehmend: Steuerung für die Reihenfolge der Sortiermethode. Standardmäßig ist die Verringerung auf „FALSE“ eingestellt.
- letzte: Gibt an, ob der Wert von „NA“ an letzter Stelle stehen soll oder nicht
Beispiel 1
Beispielsweise können wir einen Tibble-Datenrahmen erstellen und eine oder mehrere Variablen sortieren. Ein Tibble-Datenrahmen ist ein neuer Ansatz für Datenrahmen. Es verbessert die Syntax von Datenrahmen und vermeidet frustrierende Datentypformatierungen, insbesondere für die Faktorisierung von Zeichen. Es ist auch eine bequeme Möglichkeit, einen Datenrahmen manuell zu erstellen, was hier unser Ziel ist. Weitere Informationen zu Tibble finden Sie in der Vignette: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr) set.seed(1234) data_frame <- tibble( c1 = rnorm(50, 5, 1.5), c2 = rnorm(50, 5, 1.5), c3 = rnorm(50, 5, 1.5), c4 = rnorm(50, 5, 1.5), c5 = rnorm(50, 5, 1.5) ) # Sort by c1 df <-data_frame[order(data_frame$c1),] head(df)
Ausgang:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 1.481453 3.477557 4.246283 3.686611 6.0511003 ## 2 1.729941 5.824996 4.525823 6.753663 0.1502718 ## 3 2.556360 6.275348 2.524849 6.368483 5.4787404 ## 4 2.827693 4.769902 5.120089 3.743626 4.0103449 ## 5 2.988510 4.395902 2.077631 4.236894 4.6176880 ## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Beispiel 2
# Sort by c3 and c4 df <-data_frame[order(data_frame$c3, data_frame$c4),] head(df)
Ausgang:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 2.988510 4.395902 2.077631 4.236894 4.617688 ## 2 2.556360 6.275348 2.524849 6.368483 5.478740 ## 3 3.464516 3.914627 2.730068 9.565649 6.016123 ## 4 4.233486 3.292088 3.133568 7.517309 4.772395 ## 5 3.935840 2.941547 3.242078 6.464048 3.599745 ## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Beispiel 3
# Sort by c3(descending) and c4(acending) df <-data_frame[order(-data_frame$c3, data_frame$c4),] head(df)
Ausgang:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 4.339178 4.450214 8.087243 4.5010140 8.410225 ## 2 3.959420 8.105406 7.736312 7.1168936 5.431565 ## 3 3.339023 3.298088 7.494285 5.9303153 7.035912 ## 4 3.397036 5.382794 7.092722 0.7163620 5.620098 ## 5 6.653446 4.733315 6.520536 0.9016707 4.513410 ## 6 4.558559 4.712609 6.380086 6.0562703 5.044277