Datatyper i R med eksempel

Hvad er datatyperne i R?

Følgende er datatyperne eller datastrukturerne i R-programmering:

  • Skalarer
  • Vektorer (numerisk, karakter, logisk)
  • Matricer
  • Datarammer
  • Lister

Grundlæggende typer

  • 4.5 er en decimalværdi kaldet numerik.
  • 4 kaldes en naturværdi heltal. Heltal er også numeriske.
  • TRUE eller FALSE er en boolsk værdi kaldet logisk binære operatorer i R.
  • Værdien inde i " " eller ' ' er tekst (streng). De kaldes tegn.

Vi kan kontrollere typen af ​​en variabel med klassefunktionen

Eksempel 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Output:

## [1] "numeric"

Eksempel 2

# String
y <- "R is Fantastic"
class(y)

Output:

## [1] "character"

Eksempel 3

# Boolean
z <- TRUE
class(z)

Output:

## [1] "logical"

Variabler

Variabler er en af ​​de grundlæggende datatyper i R, der gemmer værdier og er en vigtig komponent i R programmering, især for en dataforsker. En variabel i R-datatyper kan lagre et tal, et objekt, et statistisk resultat, vektor, datasæt, en modelforudsigelse stort set alt, hvad R outputter. Vi kan bruge den variabel senere ved blot at kalde navnet på variablen.

For at erklære variable datastrukturer i R skal vi tildele et variabelnavn. Navnet skal ikke have mellemrum. Vi kan bruge _ til at forbinde til ord.

For at tilføje en værdi til variablen i datatyper i R-programmering skal du bruge <- eller =.

Her er syntaksen:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

På kommandolinjen kan vi skrive følgende koder for at se, hvad der sker:

Eksempel 1

# Print variable x
x <- 42
x

Output:

## [1] 42

Eksempel 2

y  <- 10
y

Output:

## [1] 10

Eksempel 3

# We call x and y and apply a subtraction
x-y

Output:

## [1] 32

Vektorer

En vektor er et endimensionelt array. Vi kan skabe en vektor med alle de grundlæggende R-datatyper, vi lærte før. Den enkleste måde at bygge vektordatastrukturer på i R er at bruge c-kommandoen.

Eksempel 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Output:

## [1]  1 10 49

Eksempel 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Output:

## [1] "a" "b" "c"

Eksempel 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Output:

##[1] TRUE FALSE TRUE

Vi kan lave aritmetiske beregninger på vektor binære operatorer i R.

Eksempel 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Output:

[1]  3  7 11

Eksempel 5

I R er det muligt at opdele en vektor. I nogle tilfælde er vi kun interesseret i de første fem rækker af en vektor. Vi kan bruge kommandoen [1:5] til at udtrække værdien 1 til 5.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Output:

## [1] 1 2 3 4 5

Eksempel 6

Den korteste måde at oprette en række værdier på er at bruge: mellem to tal. For eksempel fra ovenstående eksempel kan vi skrive c(1:10) for at skabe en vektor med værdi fra en til ti.

# Faster way to create adjacent values
c(1:10)

Output:

## [1]  1  2  3  4  5  6  7  8  9 10

R Aritmetik Operatorer

Vi vil først se de grundlæggende aritmetiske operatorer i R-datatyper. Følgende er de aritmetiske og booleske operatorer i R-programmering, som står for:

OperaTor Description
+ Tilsætning
- Subtraktion
* Multiplikation
/ Afdeling
^ eller ** eksponentiering

Eksempel 1

# An addition
3 + 4

Output:

## [1] 7

Du kan nemt kopiere og indsætte ovenstående R-kode i Rstudio Console. Det output vises efter tegnet #. For eksempel skriver vi koden print('Guru99'), outputtet vil være ##[1] Guru99.

## betyder, at vi udskriver output, og tallet i den firkantede parentes ([1]) er nummeret på displayet

Sætninger der begynder med # anmærkning. Vi kan bruge # inde i et R-script til at tilføje enhver kommentar, vi ønsker. R vil ikke læse den i løbet af køretiden.

Eksempel 2

# A multiplication
3*5

Output:

## [1] 15

Eksempel 3

# A division
(5+5)/2

Output:

## [1] 5

Eksempel 4

# Exponentiation
2^5

Output:

Eksempel 5

## [1] 32
# Modulo
28%%6

Output:

## [1] 4

R Logisk Operatorer

Med logiske operatorer ønsker vi at returnere værdier inde i vektoren baseret på logiske forhold. Følgende er en detaljeret liste over logiske operatorer af datatyper i R-programmering

Logisk Operators i R
Logisk Operators i R

De logiske udsagn i R er pakket inde i []. Vi kan tilføje så mange betingede udsagn, som vi vil, men vi skal inkludere dem i en parentes. Vi kan følge denne struktur for at skabe en betinget erklæring:

variable_name[(conditional_statement)]

Med variabelnavn, der refererer til variablen, vil vi bruge til sætningen. Vi opretter den logiske sætning, dvs. variabel_navn > 0. Til sidst bruger vi den firkantede parentes til at færdiggøre den logiske sætning. Nedenfor et eksempel på et logisk udsagn.

Eksempel 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Output:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

I outputtet ovenfor læser R hver værdi og sammenligner den med sætningen logical_vector>5. Hvis værdien er strengt overordnet fem, så er betingelsen SAND, ellers FALSK. R returnerer en vektor af SAND og FALSK.

Eksempel 2

I eksemplet nedenfor ønsker vi at udtrække de værdier, der kun opfylder betingelsen 'er strengt taget bedre end fem'. Til det kan vi ombryde betingelsen inden for en firkantet parentes foran vektoren, der indeholder værdierne.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Output:

## [1]  6  7  8  9 10

Eksempel 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Output:

## [1] 5 6