R Sortera en dataram med Order()
I dataanalys kan du sortera dina data enligt en viss variabel i datamรคngden. I R kan vi anvรคnda hjรคlp av funktionen order(). I R kan vi enkelt sortera en vektor av kontinuerlig variabel eller faktorvariabel. Ordna data kan vara av stigande or nedรฅtgรฅende ordning.
Syntax:
sort(x, decreasing = FALSE, na.last = TRUE):
Argument:
- x: En vektor som innehรฅller kontinuerlig eller faktorvariabel
- minskande: Kontroll fรถr sorteringsmetodens ordning. Som standard รคr minskande instรคllt pรฅ "FALSE".
- sista: Indikerar om `NA` s vรคrde ska sรคttas sist eller inte
Exempelvis 1
Till exempel kan vi skapa en tibble-dataram och sortera en eller flera variabler. En tibble-dataram รคr ett nytt tillvรคgagรฅngssรคtt fรถr dataram. Det fรถrbรคttrar syntaxen fรถr dataramen och undviker frustrerande datatypsformatering, sรคrskilt fรถr tecken till faktor. Det รคr ocksรฅ ett bekvรคmt sรคtt att skapa en dataram fรถr hand, vilket รคr vรฅrt syfte hรคr. Fรถr att lรคra dig mer om tibble, se vinjetten: https://cran.r-project.org/web/packages/tibble/vignettes/tibble.html
library(dplyr) set.seed(1234) data_frame <- tibble( c1 = rnorm(50, 5, 1.5), c2 = rnorm(50, 5, 1.5), c3 = rnorm(50, 5, 1.5), c4 = rnorm(50, 5, 1.5), c5 = rnorm(50, 5, 1.5) ) # Sort by c1 df <-data_frame[order(data_frame$c1),] head(df)
Produktion:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 1.481453 3.477557 4.246283 3.686611 6.0511003 ## 2 1.729941 5.824996 4.525823 6.753663 0.1502718 ## 3 2.556360 6.275348 2.524849 6.368483 5.4787404 ## 4 2.827693 4.769902 5.120089 3.743626 4.0103449 ## 5 2.988510 4.395902 2.077631 4.236894 4.6176880 ## 6 3.122021 6.317305 5.413840 3.551145 5.6067027
Exempelvis 2
# Sort by c3 and c4 df <-data_frame[order(data_frame$c3, data_frame$c4),] head(df)
Produktion:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 2.988510 4.395902 2.077631 4.236894 4.617688 ## 2 2.556360 6.275348 2.524849 6.368483 5.478740 ## 3 3.464516 3.914627 2.730068 9.565649 6.016123 ## 4 4.233486 3.292088 3.133568 7.517309 4.772395 ## 5 3.935840 2.941547 3.242078 6.464048 3.599745 ## 6 3.835619 4.947859 3.335349 4.378370 7.240240
Exempelvis 3
# Sort by c3(descending) and c4(acending) df <-data_frame[order(-data_frame$c3, data_frame$c4),] head(df)
Produktion:
# A tibble: 6 x 5 ## c1 c2 c3 c4 c5 ## <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 4.339178 4.450214 8.087243 4.5010140 8.410225 ## 2 3.959420 8.105406 7.736312 7.1168936 5.431565 ## 3 3.339023 3.298088 7.494285 5.9303153 7.035912 ## 4 3.397036 5.382794 7.092722 0.7163620 5.620098 ## 5 6.653446 4.733315 6.520536 0.9016707 4.513410 ## 6 4.558559 4.712609 6.380086 6.0562703 5.044277
