R Ταξινόμηση ενός πλαισίου δεδομένων χρησιμοποιώντας Order()


Στην ανάλυση δεδομένων μπορείτε είδος τα δεδομένα σας σύμφωνα με μια συγκεκριμένη μεταβλητή στο σύνολο δεδομένων. Στο R, μπορούμε να χρησιμοποιήσουμε τη βοήθεια της συνάρτησης order(). Στο R, μπορούμε εύκολα να ταξινομήσουμε ένα διάνυσμα συνεχούς μεταβλητής ή μεταβλητής παράγοντα. Η τακτοποίηση των δεδομένων μπορεί να είναι από αύξουσα or φθίνων παραγγελία.

Σύνταξη:

sort(x, decreasing = FALSE, na.last = TRUE):

Διαφωνία:

  • x: Διάνυσμα που περιέχει συνεχή ή μεταβλητή παράγοντα
  • φθίνουσα: Έλεγχος για τη σειρά της μεθόδου ταξινόμησης. Από προεπιλογή, η μείωση έχει οριστεί σε "FALSE".
  • τελευταία: Υποδεικνύει εάν η τιμή του `NA` πρέπει να τοποθετηθεί τελευταία ή όχι

Παράδειγμα 1

Για παράδειγμα, μπορούμε να δημιουργήσουμε ένα πλαίσιο δεδομένων tibble και να ταξινομήσουμε μία ή πολλές μεταβλητές. Το πλαίσιο δεδομένων Tibble είναι μια νέα προσέγγιση στο πλαίσιο δεδομένων. Βελτιώνει τη σύνταξη του πλαισίου δεδομένων και αποφεύγει την απογοητευτική μορφοποίηση τύπων δεδομένων, ειδικά για χαρακτήρα σε παράγοντα. Είναι επίσης ένας βολικός τρόπος για να δημιουργήσουμε ένα πλαίσιο δεδομένων με το χέρι, που είναι ο σκοπός μας εδώ. Για να μάθετε περισσότερα σχετικά με το tibble, ανατρέξτε στο βινιέτα: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html

library(dplyr)
set.seed(1234)
data_frame <- tibble(  
	c1 = rnorm(50, 5, 1.5),   
	c2 = rnorm(50, 5, 1.5),  
	c3 = rnorm(50, 5, 1.5),
	c4 = rnorm(50, 5, 1.5), 	
	c5 = rnorm(50, 5, 1.5)
)
# Sort by c1
df <-data_frame[order(data_frame$c1),]
head(df)

Παραγωγή:

# A tibble: 6 x 5
##       c1       c2       c3       c4       c5
##     <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 1.481453 3.477557 4.246283 3.686611 6.0511003
## 2 1.729941 5.824996 4.525823 6.753663 0.1502718
## 3 2.556360 6.275348 2.524849 6.368483 5.4787404
## 4 2.827693 4.769902 5.120089 3.743626 4.0103449
## 5 2.988510 4.395902 2.077631 4.236894 4.6176880
## 6 3.122021 6.317305 5.413840 3.551145 5.6067027

Παράδειγμα 2

# Sort by c3 and c4
df <-data_frame[order(data_frame$c3, data_frame$c4),]
head(df)

Παραγωγή:

# A tibble: 6 x 5
##        c1       c2       c3       c4       c5
##    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 2.988510 4.395902 2.077631 4.236894 4.617688
## 2 2.556360 6.275348 2.524849 6.368483 5.478740
## 3 3.464516 3.914627 2.730068 9.565649 6.016123
## 4 4.233486 3.292088 3.133568 7.517309 4.772395
## 5 3.935840 2.941547 3.242078 6.464048 3.599745
## 6 3.835619 4.947859 3.335349 4.378370 7.240240

Παράδειγμα 3

# Sort by c3(descending) and c4(acending)
df <-data_frame[order(-data_frame$c3, data_frame$c4),]
head(df)

Παραγωγή:

# A tibble: 6 x 5
##         c1       c2       c3        c4       c5
##      <dbl>    <dbl>    <dbl>     <dbl>    <dbl>
## 1 4.339178 4.450214 8.087243 4.5010140 8.410225
## 2 3.959420 8.105406 7.736312 7.1168936 5.431565
## 3 3.339023 3.298088 7.494285 5.9303153 7.035912
## 4 3.397036 5.382794 7.092722 0.7163620 5.620098
## 5 6.653446 4.733315 6.520536 0.9016707 4.513410
## 6 4.558559 4.712609 6.380086 6.0562703 5.044277