Datatyper i R med exempel
Vilka är datatyperna i R?
Följande är datatyperna eller datastrukturerna i R-programmering:
- Skalärer
- Vektorer (numeriska, tecken, logiska)
- matriser
- Dataramar
- listor
Grundläggande typer
- 4.5 är ett decimalvärde som kallas numeriken.
- 4 är ett naturvärde som kallas heltal. Heltal är också numeriska.
- TRUE eller FALSE är ett booleskt värde som kallas logisk binära operatorer i R.
- Värdet inuti ” ” eller ' ' är text (sträng). De kallas tecken.
Vi kan kontrollera typen av en variabel med klassfunktionen
Exempelvis 1
# Declare variables of different types # Numeric x <- 28 class(x)
Produktion:
## [1] "numeric"
Exempelvis 2
# String y <- "R is Fantastic" class(y)
Produktion:
## [1] "character"
Exempelvis 3
# Boolean z <- TRUE class(z)
Produktion:
## [1] "logical"
variabler
Variabler är en av de grundläggande datatyperna i R som lagrar värden och är en viktig komponent i R-programmering, speciellt för en datavetare. En variabel i R-datatyper kan lagra ett tal, ett objekt, ett statistiskt resultat, vektor, datauppsättning, en modellförutsägelse i princip vad som helst som R matar ut. Vi kan använda den variabeln senare genom att helt enkelt anropa variabelns namn.
För att deklarera variabeldatastrukturer i R måste vi tilldela ett variabelnamn. Namnet ska inte ha mellanslag. Vi kan använda _ för att koppla till ord.
För att lägga till ett värde till variabeln i datatyper i R-programmering, använd <- eller =.
Här är syntaxen:
# First way to declare a variable: use the `<-` name_of_variable <- value # Second way to declare a variable: use the `=` name_of_variable = value
På kommandoraden kan vi skriva följande koder för att se vad som händer:
Exempelvis 1
# Print variable x x <- 42 x
Produktion:
## [1] 42
Exempelvis 2
y <- 10 y
Produktion:
## [1] 10
Exempelvis 3
# We call x and y and apply a subtraction x-y
Produktion:
## [1] 32
vektorer
En vektor är en endimensionell array. Vi kan skapa en vektor med alla grundläggande R-datatyper vi lärt oss tidigare. Det enklaste sättet att bygga vektordatastrukturer i R är att använda kommandot c.
Exempelvis 1
# Numerical vec_num <- c(1, 10, 49) vec_num
Produktion:
## [1] 1 10 49
Exempelvis 2
# Character vec_chr <- c("a", "b", "c") vec_chr
Produktion:
## [1] "a" "b" "c"
Exempelvis 3
# Boolean vec_bool <- c(TRUE, FALSE, TRUE) vec_bool
Produktion:
##[1] TRUE FALSE TRUE
Vi kan göra aritmetiska beräkningar på binära vektoroperatorer i R.
Exempelvis 4
# Create the vectors vect_1 <- c(1, 3, 5) vect_2 <- c(2, 4, 6) # Take the sum of A_vector and B_vector sum_vect <- vect_1 + vect_2 # Print out total_vector sum_vect
Produktion:
[1] 3 7 11
Exempelvis 5
I R är det möjligt att dela en vektor. Vid vissa tillfällen är vi bara intresserade av de första fem raderna i en vektor. Vi kan använda kommandot [1:5] för att extrahera värdet 1 till 5.
# Slice the first five rows of the vector slice_vector <- c(1,2,3,4,5,6,7,8,9,10) slice_vector[1:5]
Produktion:
## [1] 1 2 3 4 5
Exempelvis 6
Det kortaste sättet att skapa ett värdeintervall är att använda: mellan två siffror. Till exempel, från exemplet ovan kan vi skriva c(1:10) för att skapa en vektor med värde från ett till tio.
# Faster way to create adjacent values c(1:10)
Produktion:
## [1] 1 2 3 4 5 6 7 8 9 10
R Aritmetik Operatorer
Vi kommer först att se de grundläggande aritmetiska operatorerna i R-datatyper. Följande är de aritmetiska och booleska operatorerna i R-programmering som står för:
Operator | Description |
---|---|
+ | Dessutom |
- | Subtraktion |
* | Multiplikation |
/ | division |
^ eller ** | exponentiering |
Exempelvis 1
# An addition 3 + 4
Produktion:
## [1] 7
Du kan enkelt kopiera och klistra in ovanstående R-kod i Rstudio Console. De produktion visas efter tecknet #. Till exempel, vi skriver koden print('Guru99') utdata kommer att vara ##[1] Guru99.
## betyder att vi skriver ut utdata och siffran inom hakparentesen ([1]) är displayens nummer
Meningarna som börjar med # anteckning. Vi kan använda # i ett R-skript för att lägga till vilken kommentar vi vill. R kommer inte att läsa den under körtiden.
Exempelvis 2
# A multiplication 3*5
Produktion:
## [1] 15
Exempelvis 3
# A division (5+5)/2
Produktion:
## [1] 5
Exempelvis 4
# Exponentiation 2^5
Produktion:
Exempelvis 5
## [1] 32
# Modulo 28%%6
Produktion:
## [1] 4
R Logisk Operatorer
Med logiska operatorer vill vi returnera värden inuti vektorn baserat på logiska förhållanden. Följande är en detaljerad lista över logiska operatorer för datatyper i R-programmering
De logiska påståendena i R är inlindade i []. Vi kan lägga till så många villkorliga uttalanden som vi vill men vi måste inkludera dem inom en parentes. Vi kan följa denna struktur för att skapa ett villkorligt uttalande:
variable_name[(conditional_statement)]
Med variabelnamn som refererar till variabeln vill vi använda för uttalandet. Vi skapar den logiska satsen dvs variabelnamn > 0. Slutligen använder vi hakparentesen för att slutföra den logiska satsen. Nedan ett exempel på ett logiskt påstående.
Exempelvis 1
# Create a vector from 1 to 10 logical_vector <- c(1:10) logical_vector>5
Produktion:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
I utgången ovan läser R varje värde och jämför det med satsen logical_vector>5. Om värdet är strikt överlägset fem är villkoret TRUE, annars FALSE. R returnerar en vektor av TRUE och FALSE.
Exempelvis 2
I exemplet nedan vill vi extrahera de värden som endast uppfyller villkoret 'är strikt överlägsen fem'. För det kan vi linda villkoret inom en hakparentes som föregås av vektorn som innehåller värdena.
# Print value strictly above 5 logical_vector[(logical_vector>5)]
Produktion:
## [1] 6 7 8 9 10
Exempelvis 3
# Print 5 and 6 logical_vector <- c(1:10) logical_vector[(logical_vector>4) & (logical_vector<7)]
Produktion:
## [1] 5 6