R Lajittele tietokehys käyttämällä Order()
Tietojen analysoinnissa voit lajitella tietosi tietyn tietojoukon muuttujan mukaan. R:ssä voimme käyttää funktion order() apua. R:ssä voimme helposti lajitella jatkuvan muuttujan tai tekijämuuttujan vektorin. Tietojen järjestäminen voi olla nouseva or aleneva järjestys.
Syntaksi:
sort(x, decreasing = FALSE, na.last = TRUE):
Perustelu:
- x: Vektori, joka sisältää jatkuvan tai tekijämuuttujan
- laskeva: Lajittelutavan järjestyksen säädin. Oletusarvon mukaan laskeva arvo on EPÄTOSI.
- viime: Ilmaisee, tuleeko NA:n arvo laittaa viimeiseksi vai ei
Esimerkki 1
Voimme esimerkiksi luoda tibble-tietokehyksen ja lajitella yhden tai useita muuttujia. Tibble-datakehys on uusi lähestymistapa tietokehykseen. Se parantaa tietokehyksen syntaksia ja välttää turhauttavaa tietotyyppien muotoilua, erityisesti merkkien mukaan. Se on myös kätevä tapa luoda tietokehys käsin, mikä on tässä tarkoituksemme. Lisätietoja tibblestä saat vinjetistä: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr) set.seed(1234) data_frame <- tibble( c1 = rnorm(50, 5, 1.5), c2 = rnorm(50, 5, 1.5), c3 = rnorm(50, 5, 1.5), c4 = rnorm(50, 5, 1.5), c5 = rnorm(50, 5, 1.5) ) # Sort by c1 df <-data_frame[order(data_frame$c1),] head(df)
lähtö:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 1.481453 3.477557 4.246283 3.686611 6.0511003 ## 2 1.729941 5.824996 4.525823 6.753663 0.1502718 ## 3 2.556360 6.275348 2.524849 6.368483 5.4787404 ## 4 2.827693 4.769902 5.120089 3.743626 4.0103449 ## 5 2.988510 4.395902 2.077631 4.236894 4.6176880 ## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Esimerkki 2
# Sort by c3 and c4 df <-data_frame[order(data_frame$c3, data_frame$c4),] head(df)
lähtö:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 2.988510 4.395902 2.077631 4.236894 4.617688 ## 2 2.556360 6.275348 2.524849 6.368483 5.478740 ## 3 3.464516 3.914627 2.730068 9.565649 6.016123 ## 4 4.233486 3.292088 3.133568 7.517309 4.772395 ## 5 3.935840 2.941547 3.242078 6.464048 3.599745 ## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Esimerkki 3
# Sort by c3(descending) and c4(acending) df <-data_frame[order(-data_frame$c3, data_frame$c4),] head(df)
lähtö:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 4.339178 4.450214 8.087243 4.5010140 8.410225 ## 2 3.959420 8.105406 7.736312 7.1168936 5.431565 ## 3 3.339023 3.298088 7.494285 5.9303153 7.035912 ## 4 3.397036 5.382794 7.092722 0.7163620 5.620098 ## 5 6.653446 4.733315 6.520536 0.9016707 4.513410 ## 6 4.558559 4.712609 6.380086 6.0562703 5.044277