Datatyper i R med eksempel

Hva er datatypene i R?

Følgende er datatypene eller datastrukturene i R-programmering:

  • Skalarer
  • Vektorer (numerisk, karakter, logisk)
  • matriser
  • Datarammer
  • lister

Grunnleggende typer

  • 4.5 er en desimalverdi som kalles numerikk.
  • 4 er en naturverdi kalt heltall. Heltall er også numeriske.
  • TRUE eller FALSE er en boolsk verdi kalt logisk binære operatorer i R.
  • Verdien inne i " " eller ' ' er tekst (streng). De kalles tegn.

Vi kan sjekke typen av en variabel med klassefunksjonen

Eksempel 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Utgang:

## [1] "numeric"

Eksempel 2

# String
y <- "R is Fantastic"
class(y)

Utgang:

## [1] "character"

Eksempel 3

# Boolean
z <- TRUE
class(z)

Utgang:

## [1] "logical"

Variabler

Variabler er en av de grunnleggende datatypene i R som lagrer verdier og er en viktig komponent i R programmering, spesielt for en dataforsker. En variabel i R-datatyper kan lagre et tall, et objekt, et statistisk resultat, vektor, datasett, en modellprediksjon i utgangspunktet alt som R gir ut. Vi kan bruke den variabelen senere ganske enkelt ved å kalle navnet på variabelen.

For å deklarere variable datastrukturer i R, må vi tildele et variabelnavn. Navnet skal ikke ha mellomrom. Vi kan bruke _ for å koble til ord.

For å legge til en verdi til variabelen i datatyper i R-programmering, bruk <- eller =.

Her er syntaksen:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

På kommandolinjen kan vi skrive følgende koder for å se hva som skjer:

Eksempel 1

# Print variable x
x <- 42
x

Utgang:

## [1] 42

Eksempel 2

y  <- 10
y

Utgang:

## [1] 10

Eksempel 3

# We call x and y and apply a subtraction
x-y

Utgang:

## [1] 32

vektorer

En vektor er en endimensjonal matrise. Vi kan lage en vektor med alle de grunnleggende R-datatypene vi har lært før. Den enkleste måten å bygge vektordatastrukturer i R, er å bruke c-kommandoen.

Eksempel 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Utgang:

## [1]  1 10 49

Eksempel 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Utgang:

## [1] "a" "b" "c"

Eksempel 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Utgang:

##[1] TRUE FALSE TRUE

Vi kan gjøre aritmetiske beregninger på vektor binære operatorer i R.

Eksempel 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Utgang:

[1]  3  7 11

Eksempel 5

I R er det mulig å dele en vektor. I noen tilfeller er vi bare interessert i de fem første radene i en vektor. Vi kan bruke [1:5]-kommandoen til å trekke ut verdien 1 til 5.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Utgang:

## [1] 1 2 3 4 5

Eksempel 6

Den korteste måten å lage et verdiområde på er å bruke: mellom to tall. For eksempel, fra eksemplet ovenfor, kan vi skrive c(1:10) for å lage en vektor med verdi fra én til ti.

# Faster way to create adjacent values
c(1:10)

Utgang:

## [1]  1  2  3  4  5  6  7  8  9 10

R Aritmetikk Operatorer

Vi vil først se de grunnleggende aritmetiske operatorene i R-datatyper. Følgende er de aritmetiske og boolske operatorene i R-programmering som står for:

Operator Description
+ Addisjon
- Subtraksjon
* Multiplikasjon
/ Divisjon
^ eller ** Potens

Eksempel 1

# An addition
3 + 4

Utgang:

## [1] 7

Du kan enkelt kopiere og lime inn R-koden ovenfor i Rstudio Console. De produksjon vises etter tegnet #. For eksempel skriver vi kodeutskriften('Guru99'), utdataene vil være ##[1] Guru99.

## betyr at vi skriver ut og tallet i hakeparentesen ([1]) er nummeret på skjermen

Setningene som begynner med # merknad. Vi kan bruke # i et R-skript for å legge til en kommentar vi ønsker. R vil ikke lese den i løpet av kjøretiden.

Eksempel 2

# A multiplication
3*5

Utgang:

## [1] 15

Eksempel 3

# A division
(5+5)/2

Utgang:

## [1] 5

Eksempel 4

# Exponentiation
2^5

Utgang:

Eksempel 5

## [1] 32
# Modulo
28%%6

Utgang:

## [1] 4

R Logisk Operatorer

Med logiske operatorer ønsker vi å returnere verdier inne i vektoren basert på logiske forhold. Følgende er en detaljert liste over logiske operatorer for datatyper i R-programmering

logisk Operators i R
logisk Operators i R

De logiske utsagnene i R er pakket inn i []. Vi kan legge til så mange betingede utsagn vi vil, men vi må inkludere dem i en parentes. Vi kan følge denne strukturen for å lage en betinget uttalelse:

variable_name[(conditional_statement)]

Med variabelnavn som refererer til variabelen, ønsker vi å bruke for setningen. Vi lager den logiske setningen dvs. variabelnavn > 0. Til slutt bruker vi den firkantede parentesen for å fullføre den logiske setningen. Nedenfor et eksempel på et logisk utsagn.

Eksempel 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Utgang:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

I utgangen ovenfor leser R hver verdi og sammenligner den med setningen logical_vector>5. Hvis verdien er strengt overordnet fem, er betingelsen TRUE, ellers FALSE. R returnerer en vektor av TRUE og FALSE.

Eksempel 2

I eksemplet nedenfor ønsker vi å trekke ut verdiene som kun oppfyller betingelsen 'er strengt tatt bedre enn fem'. For det kan vi sette betingelsen innenfor en firkantet parentes foran vektoren som inneholder verdiene.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Utgang:

## [1]  6  7  8  9 10

Eksempel 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Utgang:

## [1] 5 6