R Sorteeri andmeraam kasutades Order()


Andmeanalüüsis saate sort teie andmed vastavalt andmestiku teatud muutujale. R-is saame kasutada funktsiooni order() abi. R-is saame hõlpsasti sortida pideva muutuja või faktorimuutuja vektorit. Andmete korrastamine võib olla kasvavalt or kahanevalt järjekorras.

süntaksit:

sort(x, decreasing = FALSE, na.last = TRUE):

Argument:

  • x: vektor, mis sisaldab pidevat või faktorimuutujat
  • vähenev: sortimismeetodi järjestuse juhtelement. Vaikimisi on kahanemine seatud väärtusele „FALSE”.
  • viimane: näitab, kas NA väärtus tuleks asetada viimasele või mitte

Näiteks 1

Näiteks saame luua tibble andmeraami ja sorteerida ühe või mitu muutujat. Tibble andmeraam on uus lähenemine andmeraamile. See parandab andmeraami süntaksit ja väldib frustreerivat andmetüübi vormindamist, eriti tähemärgi ja faktori vahel. See on ka mugav viis käsitsi andmeraami loomiseks, mis on siin meie eesmärk. Tibble'i kohta lisateabe saamiseks vaadake vinjetti: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html

library(dplyr)
set.seed(1234)
data_frame <- tibble(  
	c1 = rnorm(50, 5, 1.5),   
	c2 = rnorm(50, 5, 1.5),  
	c3 = rnorm(50, 5, 1.5),
	c4 = rnorm(50, 5, 1.5), 	
	c5 = rnorm(50, 5, 1.5)
)
# Sort by c1
df <-data_frame[order(data_frame$c1),]
head(df)

Väljund:

# A tibble: 6 x 5
##       c1       c2       c3       c4       c5
##     <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 1.481453 3.477557 4.246283 3.686611 6.0511003
## 2 1.729941 5.824996 4.525823 6.753663 0.1502718
## 3 2.556360 6.275348 2.524849 6.368483 5.4787404
## 4 2.827693 4.769902 5.120089 3.743626 4.0103449
## 5 2.988510 4.395902 2.077631 4.236894 4.6176880
## 6 3.122021 6.317305 5.413840 3.551145 5.6067027

Näiteks 2

# Sort by c3 and c4
df <-data_frame[order(data_frame$c3, data_frame$c4),]
head(df)

Väljund:

# A tibble: 6 x 5
##        c1       c2       c3       c4       c5
##    <dbl>    <dbl>    <dbl>    <dbl>    <dbl>
## 1 2.988510 4.395902 2.077631 4.236894 4.617688
## 2 2.556360 6.275348 2.524849 6.368483 5.478740
## 3 3.464516 3.914627 2.730068 9.565649 6.016123
## 4 4.233486 3.292088 3.133568 7.517309 4.772395
## 5 3.935840 2.941547 3.242078 6.464048 3.599745
## 6 3.835619 4.947859 3.335349 4.378370 7.240240

Näiteks 3

# Sort by c3(descending) and c4(acending)
df <-data_frame[order(-data_frame$c3, data_frame$c4),]
head(df)

Väljund:

# A tibble: 6 x 5
##         c1       c2       c3        c4       c5
##      <dbl>    <dbl>    <dbl>     <dbl>    <dbl>
## 1 4.339178 4.450214 8.087243 4.5010140 8.410225
## 2 3.959420 8.105406 7.736312 7.1168936 5.431565
## 3 3.339023 3.298088 7.494285 5.9303153 7.035912
## 4 3.397036 5.382794 7.092722 0.7163620 5.620098
## 5 6.653446 4.733315 6.520536 0.9016707 4.513410
## 6 4.558559 4.712609 6.380086 6.0562703 5.044277

Võta see postitus kokku järgmiselt: