Gegevenstypen in R met voorbeeld

Wat zijn de gegevenstypen in R?

Hieronder staan ​​de gegevenstypen of gegevensstructuren in R-programmering:

  • scalaires
  • Vectoren (numeriek, karakter, logisch)
  • matrices
  • Gegevensframes
  • lijsten

Basistypen

  • 4.5 is een decimale waarde die wordt genoemd numeriek.
  • 4 is een natuurlijke waarde genaamd integers. Gehele getallen zijn ook numerieke getallen.
  • WAAR of ONWAAR is een zogenaamde Booleaanse waarde logisch binaire operatoren in R.
  • De waarden binnen ” ” of ' ' zijn tekst (tekenreeks). Ze worden genoemd tekens.

We kunnen het type van een variabele controleren met de klassefunctie

Voorbeeld 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Output:

## [1] "numeric"

Voorbeeld 2

# String
y <- "R is Fantastic"
class(y)

Output:

## [1] "character"

Voorbeeld 3

# Boolean
z <- TRUE
class(z)

Output:

## [1] "logical"

Variabelen

Variabelen zijn een van de basisgegevenstypen in R die waarden opslaan en een belangrijk onderdeel vormen R programmeren, vooral voor een data scientist. Een variabele in R-gegevenstypen kan een getal, een object, een statistisch resultaat, vector, dataset, een modelvoorspelling opslaan, kortom alles wat R uitstuurt. We kunnen die variabele later gebruiken door simpelweg de naam van de variabele aan te roepen.

Om variabele datastructuren in R te declareren, moeten we een variabelenaam toewijzen. De naam mag geen spatie bevatten. We kunnen _ gebruiken om verbinding te maken met woorden.

Gebruik <- of = om een ​​waarde toe te voegen aan de variabele in gegevenstypen bij R-programmering.

Hier is de syntaxis:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

In de opdrachtregel kunnen we de volgende codes schrijven om te zien wat er gebeurt:

Voorbeeld 1

# Print variable x
x <- 42
x

Output:

## [1] 42

Voorbeeld 2

y  <- 10
y

Output:

## [1] 10

Voorbeeld 3

# We call x and y and apply a subtraction
x-y

Output:

## [1] 32

vectoren

Een vector is een eendimensionale array. We kunnen een vector maken met alle basis R-gegevenstypen die we eerder hebben geleerd. De eenvoudigste manier om vectordatastructuren in R te bouwen, is door het c-commando te gebruiken.

Voorbeeld 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Output:

## [1]  1 10 49

Voorbeeld 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Output:

## [1] "a" "b" "c"

Voorbeeld 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Output:

##[1] TRUE FALSE TRUE

In R kunnen we rekenkundige berekeningen uitvoeren op vectoriële binaire operatoren.

Voorbeeld 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Output:

[1]  3  7 11

Voorbeeld 5

In R is het mogelijk een vector in plakjes te snijden. In sommige gevallen zijn we alleen geïnteresseerd in de eerste vijf rijen van een vector. We kunnen de opdracht [1:5] gebruiken om de waarde 1 tot 5 te extraheren.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Output:

## [1] 1 2 3 4 5

Voorbeeld 6

De kortste manier om een ​​bereik van waarden te creëren is door the: tussen twee getallen te gebruiken. Bijvoorbeeld, vanuit het bovenstaande voorbeeld, kunnen we c(1:10) schrijven om een ​​vector van waarde van één tot tien te creëren.

# Faster way to create adjacent values
c(1:10)

Output:

## [1]  1  2  3  4  5  6  7  8  9 10

R Rekenkunde Operaverdraaid

We zullen eerst de basis rekenkundige operatoren in R-gegevenstypen bekijken. Hieronder volgen de rekenkundige en Booleaanse operatoren in R-programmering die staan ​​voor:

Operator BESCHRIJVING
+ Toevoeging
- Aftrekking
* Vermenigvuldiging
/ Divisie
^ of ** machtsverheffen

Voorbeeld 1

# An addition
3 + 4

Output:

## [1] 7

U kunt de bovenstaande R-code eenvoudig kopiëren en in de Rstudio Console plakken. De uitvoer wordt weergegeven na het teken #. Als we bijvoorbeeld de code print('Guru99') schrijven, is de uitvoer ##[1] Guru99.

De ## betekent dat we de uitvoer afdrukken en het getal tussen de vierkante haakjes ([1]) is het nummer van het display

De zinnen die beginnen met # aantekening. We kunnen # in een R-script gebruiken om elk gewenst commentaar toe te voegen. R zal het niet lezen tijdens de looptijd.

Voorbeeld 2

# A multiplication
3*5

Output:

## [1] 15

Voorbeeld 3

# A division
(5+5)/2

Output:

## [1] 5

Voorbeeld 4

# Exponentiation
2^5

Output:

Voorbeeld 5

## [1] 32
# Modulo
28%%6

Output:

## [1] 4

R Logisch Operaverdraaid

Met logische operatoren willen we waarden binnen de vector retourneren op basis van logische voorwaarden. Hieronder volgt een gedetailleerde lijst met logische operatoren van gegevenstypen in R-programmering

logisch Operators in R
logisch Operators in R

De logische instructies in R zijn verpakt in de []. We kunnen zoveel voorwaardelijke uitspraken toevoegen als we willen, maar we moeten ze wel tussen haakjes zetten. We kunnen deze structuur volgen om een ​​voorwaardelijke verklaring te maken:

variable_name[(conditional_statement)]

Omdat variabele_naam verwijst naar de variabele, willen we deze gebruiken voor de instructie. We creëren de logische verklaring, dwz variabele_naam > 0. Ten slotte gebruiken we de vierkante haakjes om de logische verklaring af te ronden. Hieronder een voorbeeld van een logische uitspraak.

Voorbeeld 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Output:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

In de bovenstaande uitvoer leest R elke waarde en vergelijkt deze met de instructie logical_vector>5. Als de waarde strikt hoger is dan vijf, dan is de voorwaarde TRUE, anders FALSE. R retourneert een vector van TRUE en FALSE.

Voorbeeld 2

In het onderstaande voorbeeld willen we de waarden extraheren die alleen voldoen aan de voorwaarde 'is strikt superieur aan vijf'. Daarvoor kunnen we de voorwaarde binnen een vierkante haak plaatsen, voorafgegaan door de vector die de waarden bevat.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Output:

## [1]  6  7  8  9 10

Voorbeeld 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Output:

## [1] 5 6