Datatyper i R med exempel

Vilka är datatyperna i R?

Följande är datatyperna eller datastrukturerna i R-programmering:

  • Skalärer
  • Vektorer (numeriska, tecken, logiska)
  • matriser
  • Dataramar
  • listor

Grundläggande typer

  • 4.5 är ett decimalvärde som kallas numeriken.
  • 4 är ett naturvärde som kallas heltal. Heltal är också numeriska.
  • TRUE eller FALSE är ett booleskt värde som kallas logisk binära operatorer i R.
  • Värdet inuti ” ” eller ' ' är text (sträng). De kallas tecken.

Vi kan kontrollera typen av en variabel med klassfunktionen

Exempelvis 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Produktion:

## [1] "numeric"

Exempelvis 2

# String
y <- "R is Fantastic"
class(y)

Produktion:

## [1] "character"

Exempelvis 3

# Boolean
z <- TRUE
class(z)

Produktion:

## [1] "logical"

variabler

Variabler är en av de grundläggande datatyperna i R som lagrar värden och är en viktig komponent i R-programmering, speciellt för en datavetare. En variabel i R-datatyper kan lagra ett tal, ett objekt, ett statistiskt resultat, vektor, datauppsättning, en modellförutsägelse i princip vad som helst som R matar ut. Vi kan använda den variabeln senare genom att helt enkelt anropa variabelns namn.

För att deklarera variabeldatastrukturer i R måste vi tilldela ett variabelnamn. Namnet ska inte ha mellanslag. Vi kan använda _ för att koppla till ord.

För att lägga till ett värde till variabeln i datatyper i R-programmering, använd <- eller =.

Här är syntaxen:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

På kommandoraden kan vi skriva följande koder för att se vad som händer:

Exempelvis 1

# Print variable x
x <- 42
x

Produktion:

## [1] 42

Exempelvis 2

y  <- 10
y

Produktion:

## [1] 10

Exempelvis 3

# We call x and y and apply a subtraction
x-y

Produktion:

## [1] 32

vektorer

En vektor är en endimensionell array. Vi kan skapa en vektor med alla grundläggande R-datatyper vi lärt oss tidigare. Det enklaste sättet att bygga vektordatastrukturer i R är att använda kommandot c.

Exempelvis 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Produktion:

## [1]  1 10 49

Exempelvis 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Produktion:

## [1] "a" "b" "c"

Exempelvis 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Produktion:

##[1] TRUE FALSE TRUE

Vi kan göra aritmetiska beräkningar på binära vektoroperatorer i R.

Exempelvis 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Produktion:

[1]  3  7 11

Exempelvis 5

I R är det möjligt att dela en vektor. Vid vissa tillfällen är vi bara intresserade av de första fem raderna i en vektor. Vi kan använda kommandot [1:5] för att extrahera värdet 1 till 5.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Produktion:

## [1] 1 2 3 4 5

Exempelvis 6

Det kortaste sättet att skapa ett värdeintervall är att använda: mellan två siffror. Till exempel, från exemplet ovan kan vi skriva c(1:10) för att skapa en vektor med värde från ett till tio.

# Faster way to create adjacent values
c(1:10)

Produktion:

## [1]  1  2  3  4  5  6  7  8  9 10

R Aritmetik Operatorer

Vi kommer först att se de grundläggande aritmetiska operatorerna i R-datatyper. Följande är de aritmetiska och booleska operatorerna i R-programmering som står för:

Operator Description
+ Dessutom
- Subtraktion
* Multiplikation
/ division
^ eller ** exponentiering

Exempelvis 1

# An addition
3 + 4

Produktion:

## [1] 7

Du kan enkelt kopiera och klistra in ovanstående R-kod i Rstudio Console. De produktion visas efter tecknet #. Till exempel, vi skriver koden print('Guru99') utdata kommer att vara ##[1] Guru99.

## betyder att vi skriver ut utdata och siffran inom hakparentesen ([1]) är displayens nummer

Meningarna som börjar med # anteckning. Vi kan använda # i ett R-skript för att lägga till vilken kommentar vi vill. R kommer inte att läsa den under körtiden.

Exempelvis 2

# A multiplication
3*5

Produktion:

## [1] 15

Exempelvis 3

# A division
(5+5)/2

Produktion:

## [1] 5

Exempelvis 4

# Exponentiation
2^5

Produktion:

Exempelvis 5

## [1] 32
# Modulo
28%%6

Produktion:

## [1] 4

R Logisk Operatorer

Med logiska operatorer vill vi returnera värden inuti vektorn baserat på logiska förhållanden. Följande är en detaljerad lista över logiska operatorer för datatyper i R-programmering

logisk Operators i R
logisk Operators i R

De logiska påståendena i R är inlindade i []. Vi kan lägga till så många villkorliga uttalanden som vi vill men vi måste inkludera dem inom en parentes. Vi kan följa denna struktur för att skapa ett villkorligt uttalande:

variable_name[(conditional_statement)]

Med variabelnamn som refererar till variabeln vill vi använda för uttalandet. Vi skapar den logiska satsen dvs variabelnamn > 0. Slutligen använder vi hakparentesen för att slutföra den logiska satsen. Nedan ett exempel på ett logiskt påstående.

Exempelvis 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Produktion:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

I utgången ovan läser R varje värde och jämför det med satsen logical_vector>5. Om värdet är strikt överlägset fem är villkoret TRUE, annars FALSE. R returnerar en vektor av TRUE och FALSE.

Exempelvis 2

I exemplet nedan vill vi extrahera de värden som endast uppfyller villkoret 'är strikt överlägsen fem'. För det kan vi linda villkoret inom en hakparentes som föregås av vektorn som innehåller värdena.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Produktion:

## [1]  6  7  8  9 10

Exempelvis 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Produktion:

## [1] 5 6