Datatyper i R med eksempel
Hvad er datatyperne i R?
Følgende er datatyperne eller datastrukturerne i R-programmering:
- Skalarer
- Vektorer (numerisk, karakter, logisk)
- Matricer
- Datarammer
- Lister
Grundlæggende typer
- 4.5 er en decimalværdi kaldet numerik.
- 4 kaldes en naturværdi heltal. Heltal er også numeriske.
- TRUE eller FALSE er en boolsk værdi kaldet logisk binære operatorer i R.
- Værdien inde i " " eller ' ' er tekst (streng). De kaldes tegn.
Vi kan kontrollere typen af en variabel med klassefunktionen
Eksempel 1
# Declare variables of different types # Numeric x <- 28 class(x)
Output:
## [1] "numeric"
Eksempel 2
# String y <- "R is Fantastic" class(y)
Output:
## [1] "character"
Eksempel 3
# Boolean z <- TRUE class(z)
Output:
## [1] "logical"
Variabler
Variabler er en af de grundlæggende datatyper i R, der gemmer værdier og er en vigtig komponent i R programmering, især for en dataforsker. En variabel i R-datatyper kan lagre et tal, et objekt, et statistisk resultat, vektor, datasæt, en modelforudsigelse stort set alt, hvad R outputter. Vi kan bruge den variabel senere ved blot at kalde navnet på variablen.
For at erklære variable datastrukturer i R skal vi tildele et variabelnavn. Navnet skal ikke have mellemrum. Vi kan bruge _ til at forbinde til ord.
For at tilføje en værdi til variablen i datatyper i R-programmering skal du bruge <- eller =.
Her er syntaksen:
# First way to declare a variable: use the `<-` name_of_variable <- value # Second way to declare a variable: use the `=` name_of_variable = value
På kommandolinjen kan vi skrive følgende koder for at se, hvad der sker:
Eksempel 1
# Print variable x x <- 42 x
Output:
## [1] 42
Eksempel 2
y <- 10 y
Output:
## [1] 10
Eksempel 3
# We call x and y and apply a subtraction x-y
Output:
## [1] 32
Vektorer
En vektor er et endimensionelt array. Vi kan skabe en vektor med alle de grundlæggende R-datatyper, vi lærte før. Den enkleste måde at bygge vektordatastrukturer på i R er at bruge c-kommandoen.
Eksempel 1
# Numerical vec_num <- c(1, 10, 49) vec_num
Output:
## [1] 1 10 49
Eksempel 2
# Character vec_chr <- c("a", "b", "c") vec_chr
Output:
## [1] "a" "b" "c"
Eksempel 3
# Boolean vec_bool <- c(TRUE, FALSE, TRUE) vec_bool
Output:
##[1] TRUE FALSE TRUE
Vi kan lave aritmetiske beregninger på vektor binære operatorer i R.
Eksempel 4
# Create the vectors vect_1 <- c(1, 3, 5) vect_2 <- c(2, 4, 6) # Take the sum of A_vector and B_vector sum_vect <- vect_1 + vect_2 # Print out total_vector sum_vect
Output:
[1] 3 7 11
Eksempel 5
I R er det muligt at opdele en vektor. I nogle tilfælde er vi kun interesseret i de første fem rækker af en vektor. Vi kan bruge kommandoen [1:5] til at udtrække værdien 1 til 5.
# Slice the first five rows of the vector slice_vector <- c(1,2,3,4,5,6,7,8,9,10) slice_vector[1:5]
Output:
## [1] 1 2 3 4 5
Eksempel 6
Den korteste måde at oprette en række værdier på er at bruge: mellem to tal. For eksempel fra ovenstående eksempel kan vi skrive c(1:10) for at skabe en vektor med værdi fra en til ti.
# Faster way to create adjacent values c(1:10)
Output:
## [1] 1 2 3 4 5 6 7 8 9 10
R Aritmetik Operatorer
Vi vil først se de grundlæggende aritmetiske operatorer i R-datatyper. Følgende er de aritmetiske og booleske operatorer i R-programmering, som står for:
OperaTor | Description |
---|---|
+ | Tilsætning |
- | Subtraktion |
* | Multiplikation |
/ | Afdeling |
^ eller ** | eksponentiering |
Eksempel 1
# An addition 3 + 4
Output:
## [1] 7
Du kan nemt kopiere og indsætte ovenstående R-kode i Rstudio Console. Det output vises efter tegnet #. For eksempel skriver vi koden print('Guru99'), outputtet vil være ##[1] Guru99.
## betyder, at vi udskriver output, og tallet i den firkantede parentes ([1]) er nummeret på displayet
Sætninger der begynder med # anmærkning. Vi kan bruge # inde i et R-script til at tilføje enhver kommentar, vi ønsker. R vil ikke læse den i løbet af køretiden.
Eksempel 2
# A multiplication 3*5
Output:
## [1] 15
Eksempel 3
# A division (5+5)/2
Output:
## [1] 5
Eksempel 4
# Exponentiation 2^5
Output:
Eksempel 5
## [1] 32
# Modulo 28%%6
Output:
## [1] 4
R Logisk Operatorer
Med logiske operatorer ønsker vi at returnere værdier inde i vektoren baseret på logiske forhold. Følgende er en detaljeret liste over logiske operatorer af datatyper i R-programmering
De logiske udsagn i R er pakket inde i []. Vi kan tilføje så mange betingede udsagn, som vi vil, men vi skal inkludere dem i en parentes. Vi kan følge denne struktur for at skabe en betinget erklæring:
variable_name[(conditional_statement)]
Med variabelnavn, der refererer til variablen, vil vi bruge til sætningen. Vi opretter den logiske sætning, dvs. variabel_navn > 0. Til sidst bruger vi den firkantede parentes til at færdiggøre den logiske sætning. Nedenfor et eksempel på et logisk udsagn.
Eksempel 1
# Create a vector from 1 to 10 logical_vector <- c(1:10) logical_vector>5
Output:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
I outputtet ovenfor læser R hver værdi og sammenligner den med sætningen logical_vector>5. Hvis værdien er strengt overordnet fem, så er betingelsen SAND, ellers FALSK. R returnerer en vektor af SAND og FALSK.
Eksempel 2
I eksemplet nedenfor ønsker vi at udtrække de værdier, der kun opfylder betingelsen 'er strengt taget bedre end fem'. Til det kan vi ombryde betingelsen inden for en firkantet parentes foran vektoren, der indeholder værdierne.
# Print value strictly above 5 logical_vector[(logical_vector>5)]
Output:
## [1] 6 7 8 9 10
Eksempel 3
# Print 5 and 6 logical_vector <- c(1:10) logical_vector[(logical_vector>4) & (logical_vector<7)]
Output:
## [1] 5 6