Gegevenstypen in R met voorbeeld
Wat zijn de gegevenstypen in R?
Hieronder staan de gegevenstypen of gegevensstructuren in R-programmering:
- scalaires
- Vectoren (numeriek, karakter, logisch)
- matrices
- Gegevensframes
- lijsten
Basistypen
- 4.5 is een decimale waarde die wordt genoemd numeriek.
- 4 is een natuurlijke waarde genaamd integers. Gehele getallen zijn ook numerieke getallen.
- WAAR of ONWAAR is een zogenaamde Booleaanse waarde logisch binaire operatoren in R.
- De waarden binnen ” ” of ' ' zijn tekst (tekenreeks). Ze worden genoemd tekens.
We kunnen het type van een variabele controleren met de klassefunctie
Voorbeeld 1
# Declare variables of different types # Numeric x <- 28 class(x)
Output:
## [1] "numeric"
Voorbeeld 2
# String y <- "R is Fantastic" class(y)
Output:
## [1] "character"
Voorbeeld 3
# Boolean z <- TRUE class(z)
Output:
## [1] "logical"
Variabelen
Variabelen zijn een van de basisgegevenstypen in R die waarden opslaan en een belangrijk onderdeel vormen R programmeren, vooral voor een data scientist. Een variabele in R-gegevenstypen kan een getal, een object, een statistisch resultaat, vector, dataset, een modelvoorspelling opslaan, kortom alles wat R uitstuurt. We kunnen die variabele later gebruiken door simpelweg de naam van de variabele aan te roepen.
Om variabele datastructuren in R te declareren, moeten we een variabelenaam toewijzen. De naam mag geen spatie bevatten. We kunnen _ gebruiken om verbinding te maken met woorden.
Gebruik <- of = om een waarde toe te voegen aan de variabele in gegevenstypen bij R-programmering.
Hier is de syntaxis:
# First way to declare a variable: use the `<-` name_of_variable <- value # Second way to declare a variable: use the `=` name_of_variable = value
In de opdrachtregel kunnen we de volgende codes schrijven om te zien wat er gebeurt:
Voorbeeld 1
# Print variable x x <- 42 x
Output:
## [1] 42
Voorbeeld 2
y <- 10 y
Output:
## [1] 10
Voorbeeld 3
# We call x and y and apply a subtraction x-y
Output:
## [1] 32
vectoren
Een vector is een eendimensionale array. We kunnen een vector maken met alle basis R-gegevenstypen die we eerder hebben geleerd. De eenvoudigste manier om vectordatastructuren in R te bouwen, is door het c-commando te gebruiken.
Voorbeeld 1
# Numerical vec_num <- c(1, 10, 49) vec_num
Output:
## [1] 1 10 49
Voorbeeld 2
# Character vec_chr <- c("a", "b", "c") vec_chr
Output:
## [1] "a" "b" "c"
Voorbeeld 3
# Boolean vec_bool <- c(TRUE, FALSE, TRUE) vec_bool
Output:
##[1] TRUE FALSE TRUE
In R kunnen we rekenkundige berekeningen uitvoeren op vectoriële binaire operatoren.
Voorbeeld 4
# Create the vectors vect_1 <- c(1, 3, 5) vect_2 <- c(2, 4, 6) # Take the sum of A_vector and B_vector sum_vect <- vect_1 + vect_2 # Print out total_vector sum_vect
Output:
[1] 3 7 11
Voorbeeld 5
In R is het mogelijk een vector in plakjes te snijden. In sommige gevallen zijn we alleen geïnteresseerd in de eerste vijf rijen van een vector. We kunnen de opdracht [1:5] gebruiken om de waarde 1 tot 5 te extraheren.
# Slice the first five rows of the vector slice_vector <- c(1,2,3,4,5,6,7,8,9,10) slice_vector[1:5]
Output:
## [1] 1 2 3 4 5
Voorbeeld 6
De kortste manier om een bereik van waarden te creëren is door the: tussen twee getallen te gebruiken. Bijvoorbeeld, vanuit het bovenstaande voorbeeld, kunnen we c(1:10) schrijven om een vector van waarde van één tot tien te creëren.
# Faster way to create adjacent values c(1:10)
Output:
## [1] 1 2 3 4 5 6 7 8 9 10
R Rekenkunde Operaverdraaid
We zullen eerst de basis rekenkundige operatoren in R-gegevenstypen bekijken. Hieronder volgen de rekenkundige en Booleaanse operatoren in R-programmering die staan voor:
Operator | BESCHRIJVING |
---|---|
+ | Toevoeging |
- | Aftrekking |
* | Vermenigvuldiging |
/ | Divisie |
^ of ** | machtsverheffen |
Voorbeeld 1
# An addition 3 + 4
Output:
## [1] 7
U kunt de bovenstaande R-code eenvoudig kopiëren en in de Rstudio Console plakken. De uitvoer wordt weergegeven na het teken #. Als we bijvoorbeeld de code print('Guru99') schrijven, is de uitvoer ##[1] Guru99.
De ## betekent dat we de uitvoer afdrukken en het getal tussen de vierkante haakjes ([1]) is het nummer van het display
De zinnen die beginnen met # aantekening. We kunnen # in een R-script gebruiken om elk gewenst commentaar toe te voegen. R zal het niet lezen tijdens de looptijd.
Voorbeeld 2
# A multiplication 3*5
Output:
## [1] 15
Voorbeeld 3
# A division (5+5)/2
Output:
## [1] 5
Voorbeeld 4
# Exponentiation 2^5
Output:
Voorbeeld 5
## [1] 32
# Modulo 28%%6
Output:
## [1] 4
R Logisch Operaverdraaid
Met logische operatoren willen we waarden binnen de vector retourneren op basis van logische voorwaarden. Hieronder volgt een gedetailleerde lijst met logische operatoren van gegevenstypen in R-programmering
De logische instructies in R zijn verpakt in de []. We kunnen zoveel voorwaardelijke uitspraken toevoegen als we willen, maar we moeten ze wel tussen haakjes zetten. We kunnen deze structuur volgen om een voorwaardelijke verklaring te maken:
variable_name[(conditional_statement)]
Omdat variabele_naam verwijst naar de variabele, willen we deze gebruiken voor de instructie. We creëren de logische verklaring, dwz variabele_naam > 0. Ten slotte gebruiken we de vierkante haakjes om de logische verklaring af te ronden. Hieronder een voorbeeld van een logische uitspraak.
Voorbeeld 1
# Create a vector from 1 to 10 logical_vector <- c(1:10) logical_vector>5
Output:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
In de bovenstaande uitvoer leest R elke waarde en vergelijkt deze met de instructie logical_vector>5. Als de waarde strikt hoger is dan vijf, dan is de voorwaarde TRUE, anders FALSE. R retourneert een vector van TRUE en FALSE.
Voorbeeld 2
In het onderstaande voorbeeld willen we de waarden extraheren die alleen voldoen aan de voorwaarde 'is strikt superieur aan vijf'. Daarvoor kunnen we de voorwaarde binnen een vierkante haak plaatsen, voorafgegaan door de vector die de waarden bevat.
# Print value strictly above 5 logical_vector[(logical_vector>5)]
Output:
## [1] 6 7 8 9 10
Voorbeeld 3
# Print 5 and 6 logical_vector <- c(1:10) logical_vector[(logical_vector>4) & (logical_vector<7)]
Output:
## [1] 5 6