Datatyper i R med eksempel
Hva er datatypene i R?
Følgende er datatypene eller datastrukturene i R-programmering:
- Skalarer
- Vektorer (numerisk, karakter, logisk)
- matriser
- Datarammer
- lister
Grunnleggende typer
- 4.5 er en desimalverdi som kalles numerikk.
- 4 er en naturverdi kalt heltall. Heltall er også numeriske.
- TRUE eller FALSE er en boolsk verdi kalt logisk binære operatorer i R.
- Verdien inne i " " eller ' ' er tekst (streng). De kalles tegn.
Vi kan sjekke typen av en variabel med klassefunksjonen
Eksempel 1
# Declare variables of different types # Numeric x <- 28 class(x)
Utgang:
## [1] "numeric"
Eksempel 2
# String y <- "R is Fantastic" class(y)
Utgang:
## [1] "character"
Eksempel 3
# Boolean z <- TRUE class(z)
Utgang:
## [1] "logical"
Variabler
Variabler er en av de grunnleggende datatypene i R som lagrer verdier og er en viktig komponent i R programmering, spesielt for en dataforsker. En variabel i R-datatyper kan lagre et tall, et objekt, et statistisk resultat, vektor, datasett, en modellprediksjon i utgangspunktet alt som R gir ut. Vi kan bruke den variabelen senere ganske enkelt ved å kalle navnet på variabelen.
For å deklarere variable datastrukturer i R, må vi tildele et variabelnavn. Navnet skal ikke ha mellomrom. Vi kan bruke _ for å koble til ord.
For å legge til en verdi til variabelen i datatyper i R-programmering, bruk <- eller =.
Her er syntaksen:
# First way to declare a variable: use the `<-` name_of_variable <- value # Second way to declare a variable: use the `=` name_of_variable = value
På kommandolinjen kan vi skrive følgende koder for å se hva som skjer:
Eksempel 1
# Print variable x x <- 42 x
Utgang:
## [1] 42
Eksempel 2
y <- 10 y
Utgang:
## [1] 10
Eksempel 3
# We call x and y and apply a subtraction x-y
Utgang:
## [1] 32
vektorer
En vektor er en endimensjonal matrise. Vi kan lage en vektor med alle de grunnleggende R-datatypene vi har lært før. Den enkleste måten å bygge vektordatastrukturer i R, er å bruke c-kommandoen.
Eksempel 1
# Numerical vec_num <- c(1, 10, 49) vec_num
Utgang:
## [1] 1 10 49
Eksempel 2
# Character vec_chr <- c("a", "b", "c") vec_chr
Utgang:
## [1] "a" "b" "c"
Eksempel 3
# Boolean vec_bool <- c(TRUE, FALSE, TRUE) vec_bool
Utgang:
##[1] TRUE FALSE TRUE
Vi kan gjøre aritmetiske beregninger på vektor binære operatorer i R.
Eksempel 4
# Create the vectors vect_1 <- c(1, 3, 5) vect_2 <- c(2, 4, 6) # Take the sum of A_vector and B_vector sum_vect <- vect_1 + vect_2 # Print out total_vector sum_vect
Utgang:
[1] 3 7 11
Eksempel 5
I R er det mulig å dele en vektor. I noen tilfeller er vi bare interessert i de fem første radene i en vektor. Vi kan bruke [1:5]-kommandoen til å trekke ut verdien 1 til 5.
# Slice the first five rows of the vector slice_vector <- c(1,2,3,4,5,6,7,8,9,10) slice_vector[1:5]
Utgang:
## [1] 1 2 3 4 5
Eksempel 6
Den korteste måten å lage et verdiområde på er å bruke: mellom to tall. For eksempel, fra eksemplet ovenfor, kan vi skrive c(1:10) for å lage en vektor med verdi fra én til ti.
# Faster way to create adjacent values c(1:10)
Utgang:
## [1] 1 2 3 4 5 6 7 8 9 10
R Aritmetikk Operatorer
Vi vil først se de grunnleggende aritmetiske operatorene i R-datatyper. Følgende er de aritmetiske og boolske operatorene i R-programmering som står for:
Operator | Description |
---|---|
+ | Addisjon |
- | Subtraksjon |
* | Multiplikasjon |
/ | Divisjon |
^ eller ** | Potens |
Eksempel 1
# An addition 3 + 4
Utgang:
## [1] 7
Du kan enkelt kopiere og lime inn R-koden ovenfor i Rstudio Console. De produksjon vises etter tegnet #. For eksempel skriver vi kodeutskriften('Guru99'), utdataene vil være ##[1] Guru99.
## betyr at vi skriver ut og tallet i hakeparentesen ([1]) er nummeret på skjermen
Setningene som begynner med # merknad. Vi kan bruke # i et R-skript for å legge til en kommentar vi ønsker. R vil ikke lese den i løpet av kjøretiden.
Eksempel 2
# A multiplication 3*5
Utgang:
## [1] 15
Eksempel 3
# A division (5+5)/2
Utgang:
## [1] 5
Eksempel 4
# Exponentiation 2^5
Utgang:
Eksempel 5
## [1] 32
# Modulo 28%%6
Utgang:
## [1] 4
R Logisk Operatorer
Med logiske operatorer ønsker vi å returnere verdier inne i vektoren basert på logiske forhold. Følgende er en detaljert liste over logiske operatorer for datatyper i R-programmering
De logiske utsagnene i R er pakket inn i []. Vi kan legge til så mange betingede utsagn vi vil, men vi må inkludere dem i en parentes. Vi kan følge denne strukturen for å lage en betinget uttalelse:
variable_name[(conditional_statement)]
Med variabelnavn som refererer til variabelen, ønsker vi å bruke for setningen. Vi lager den logiske setningen dvs. variabelnavn > 0. Til slutt bruker vi den firkantede parentesen for å fullføre den logiske setningen. Nedenfor et eksempel på et logisk utsagn.
Eksempel 1
# Create a vector from 1 to 10 logical_vector <- c(1:10) logical_vector>5
Utgang:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
I utgangen ovenfor leser R hver verdi og sammenligner den med setningen logical_vector>5. Hvis verdien er strengt overordnet fem, er betingelsen TRUE, ellers FALSE. R returnerer en vektor av TRUE og FALSE.
Eksempel 2
I eksemplet nedenfor ønsker vi å trekke ut verdiene som kun oppfyller betingelsen 'er strengt tatt bedre enn fem'. For det kan vi sette betingelsen innenfor en firkantet parentes foran vektoren som inneholder verdiene.
# Print value strictly above 5 logical_vector[(logical_vector>5)]
Utgang:
## [1] 6 7 8 9 10
Eksempel 3
# Print 5 and 6 logical_vector <- c(1:10) logical_vector[(logical_vector>4) & (logical_vector<7)]
Utgang:
## [1] 5 6