Gegevenstypen in R met voorbeeld

Wat zijn de gegevenstypen in R?

Following zijn de gegevenstypen of gegevensstructuren in R-programmering:

  • scalaires
  • Vectoren (numeriek, karakter, logisch)
  • matrices
  • Gegevensframes
  • lijsten

Basistypen

  • 4.5 is een decimale waarde die wordt genoemd numeriek.
  • 4 is een natuurlijke waarde genaamd integers. Gehele getallen zijn ook numerieke getallen.
  • WAAR of ONWAAR is een zogenaamde Booleaanse waarde logisch binaire operatoren in R.
  • De waarden binnen ” ” of ' ' zijn tekst (tekenreeks). Ze worden genoemd tekens.

We kunnen het type van een variabele controleren met de klassefunctie

Voorbeeld 1

# Declare variables of different types
# Numeric
x <- 28
class(x)

Output:

## [1] "numeric"

Voorbeeld 2

# String
y <- "R is Fantastic"
class(y)

Output:

## [1] "character"

Voorbeeld 3

# Boolean
z <- TRUE
class(z)

Output:

## [1] "logical"

Variabelen

Variabelen zijn een van de basisgegevenstypen in R die waarden opslaan en een belangrijk onderdeel vormen R programmeren, vooral voor een data scientist. Een variabele in R-gegevenstypen kan een getal, een object, een statistisch resultaat, een vector, een gegevensset en een modelvoorspelling opslaan, eigenlijk alles wat R uitvoert. We kunnen die variabele gebruiken later eenvoudigweg door de naam van de variabele aan te roepen.

Om variabele datastructuren in R te declareren, moeten we een variabelenaam toewijzen. De naam mag geen spatie bevatten. We kunnen _ gebruiken om verbinding te maken met woorden.

Gebruik <- of = om een ​​waarde toe te voegen aan de variabele in gegevenstypen bij R-programmering.

Hier is de syntaxis:

# First way to declare a variable:  use the `<-`
name_of_variable <- value
# Second way to declare a variable:  use the `=`
name_of_variable = value

Op de opdrachtregel kunnen we het volgende schrijvenwing codes om te zien wat er gebeurt:

Voorbeeld 1

# Print variable x
x <- 42
x

Output:

## [1] 42

Voorbeeld 2

y  <- 10
y

Output:

## [1] 10

Voorbeeld 3

# We call x and y and apply a subtraction
x-y

Output:

## [1] 32

vectoren

Een vector is een eendimensionale array. We kunnen een vector maken met alle basis R-gegevenstypen die we eerder hebben geleerd. De eenvoudigste manier om vectordatastructuren in R te bouwen, is door het c-commando te gebruiken.

Voorbeeld 1

# Numerical
vec_num <- c(1, 10, 49)
vec_num

Output:

## [1]  1 10 49

Voorbeeld 2

# Character 
vec_chr <- c("a", "b", "c")
vec_chr

Output:

## [1] "a" "b" "c"

Voorbeeld 3

# Boolean 
vec_bool <-  c(TRUE, FALSE, TRUE)
vec_bool

Output:

##[1] TRUE FALSE TRUE

We kunnen rekenkundige berekeningen uitvoeren op binaire vectoroperatoren in R.

Voorbeeld 4

# Create the vectors
vect_1 <- c(1, 3, 5)
vect_2 <- c(2, 4, 6)
# Take the sum of A_vector and B_vector
sum_vect <- vect_1 + vect_2
# Print out total_vector
sum_vect

Output:

[1]  3  7 11

Voorbeeld 5

In R is het mogelijk een vector in plakjes te snijden. In sommige gevallen zijn we alleen geïnteresseerd in de eerste vijf rijen van een vector. We kunnen de opdracht [1:5] gebruiken om de waarde 1 tot 5 te extraheren.

# Slice the first five rows of the vector
slice_vector <- c(1,2,3,4,5,6,7,8,9,10)
slice_vector[1:5]

Output:

## [1] 1 2 3 4 5

Voorbeeld 6

De kortste manier om een ​​bereik van waarden te creëren is door de: tussen twee getallen te gebruiken. Uit het bovenstaande voorbeeld kunnen we bijvoorbeeld c(1:10) schrijven om een ​​waardevector van één tot tien te creëren.

# Faster way to create adjacent values
c(1:10)

Output:

## [1]  1  2  3  4  5  6  7  8  9 10

R Rekenkundige operatoren

We zullen eerst de elementaire rekenkundige operatoren in R-gegevenstypen bekijken. Volgwing zijn de rekenkundige en Booleaanse operatoren in R-programmering die staan ​​voor:

Operator Omschrijving
+ Toevoeging
- Aftrekking
* Vermenigvuldiging
/ Divisie
^ of ** machtsverheffen

Voorbeeld 1

# An addition
3 + 4

Output:

## [1] 7

U kunt de bovenstaande R-code eenvoudig kopiëren en in de Rstudio Console plakken. De uitgang wordt weergegeven na het teken #. We schrijven bijvoorbeeld de code print('Guru99'), de uitvoer zal ##[1] Guru99 zijn.

De ## betekent dat we de uitvoer afdrukken en het getal tussen de vierkante haakjes ([1]) is het nummer van het display

De zinnen die beginnen met # aantekening. We kunnen # in een R-script gebruiken om elk gewenst commentaar toe te voegen. R zal het niet lezen tijdens de looptijd.

Voorbeeld 2

# A multiplication
3*5

Output:

## [1] 15

Voorbeeld 3

# A division
(5+5)/2

Output:

## [1] 5

Voorbeeld 4

# Exponentiation
2^5

Output:

Voorbeeld 5

## [1] 32
# Modulo
28%%6

Output:

## [1] 4

R Logische operators

Met logische operatoren willen we waarden binnen de vector retourneren op basis van logische voorwaarden. Volgwing is een gedetailleerde lijst met logische operatoren van gegevenstypen in R-programmering

Logische operatoren in R
Logische operatoren in R

De logische instructies in R zijn verpakt in de []. We kunnen zoveel voorwaardelijke uitspraken toevoegen als we willen, maar we moeten ze wel tussen haakjes zetten. We kunnen deze structuur volgen om een ​​voorwaardelijke verklaring te maken:

variable_name[(conditional_statement)]

Omdat variabele_naam verwijst naar de variabele, willen we deze gebruiken voor de instructie. We creëren de logische verklaring, dwz variabele_naam > 0. Ten slotte gebruiken we de vierkante haakjes om de logische verklaring af te ronden. Hieronder een voorbeeld van een logische uitspraak.

Voorbeeld 1

# Create a vector from 1 to 10
logical_vector <- c(1:10)
logical_vector>5

Output:

## [1]FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE  TRUE

In de bovenstaande uitvoer leest R elke waarde en compares toe aan de instructie logische_vector>5. Als de waarde strikt hoger is dan vijf, dan is de voorwaarde WAAR, anderswise ONWAAR. R retourneert een vector van WAAR en ONWAAR.

Voorbeeld 2

In het onderstaande voorbeeld willen we de waarden extraheren die alleen voldoen aan de voorwaarde 'is strikt superieur aan vijf'. Daarvoor kunnen we de voorwaarde binnen een vierkante haak plaatsen, voorafgegaan door de vector die de waarden bevat.

# Print value strictly above 5
logical_vector[(logical_vector>5)]

Output:

## [1]  6  7  8  9 10

Voorbeeld 3

# Print 5 and 6
logical_vector <- c(1:10)
logical_vector[(logical_vector>4) & (logical_vector<7)]

Output:

## [1] 5 6