Các kiểu dữ liệu trong R với ví dụ
Các kiểu dữ liệu trong R là gì?
Sau đây là các Kiểu dữ liệu hoặc Cấu trúc dữ liệu trong Lập trình R:
- Vô hướng
- Các vectơ (số, ký tự, logic)
- Ma trận
- Khung dữ liệu
- Chức năng
Các loại cơ bản
- 4.5 là một giá trị thập phân được gọi là sô học.
- 4 là giá trị tự nhiên được gọi là số nguyên. Số nguyên cũng là số.
- TRUE hoặc FALSE là giá trị Boolean được gọi là hợp lý toán tử nhị phân trong R.
- Giá trị bên trong ” ” hoặc '' là văn bản (chuỗi). Chúng được gọi là nhân vật.
Chúng ta có thể kiểm tra loại biến bằng hàm lớp
Ví dụ 1
# Declare variables of different types # Numeric x <- 28 class(x)
Đầu ra:
## [1] "numeric"
Ví dụ 2
# String y <- "R is Fantastic" class(y)
Đầu ra:
## [1] "character"
Ví dụ 3
# Boolean z <- TRUE class(z)
Đầu ra:
## [1] "logical"
Biến
Biến là một trong những kiểu dữ liệu cơ bản trong R lưu trữ giá trị và là thành phần quan trọng trong Lập trình R, đặc biệt đối với một nhà khoa học dữ liệu. Một biến trong kiểu dữ liệu R có thể lưu trữ một số, một đối tượng, một kết quả thống kê, vectơ, tập dữ liệu, một dự đoán mô hình về cơ bản là bất kỳ thứ gì R đưa ra. Chúng ta có thể sử dụng biến đó sau này chỉ bằng cách gọi tên biến.
Để khai báo cấu trúc dữ liệu biến trong R, chúng ta cần gán tên biến. Tên không nên có khoảng trắng. Chúng ta có thể sử dụng _ để kết nối với các từ.
Để thêm giá trị cho biến trong kiểu dữ liệu trong lập trình R, hãy sử dụng <- hoặc =.
Đây là cú pháp:
# First way to declare a variable: use the `<-` name_of_variable <- value # Second way to declare a variable: use the `=` name_of_variable = value
Trên dòng lệnh, chúng ta có thể viết các mã sau để xem điều gì xảy ra:
Ví dụ 1
# Print variable x x <- 42 x
Đầu ra:
## [1] 42
Ví dụ 2
y <- 10 y
Đầu ra:
## [1] 10
Ví dụ 3
# We call x and y and apply a subtraction x-y
Đầu ra:
## [1] 32
Vectơ
Vector là mảng một chiều. Chúng ta có thể tạo một vectơ với tất cả các kiểu dữ liệu R cơ bản mà chúng ta đã học trước đó. Cách đơn giản nhất để xây dựng cấu trúc dữ liệu vectơ trong R là sử dụng lệnh c.
Ví dụ 1
# Numerical vec_num <- c(1, 10, 49) vec_num
Đầu ra:
## [1] 1 10 49
Ví dụ 2
# Character vec_chr <- c("a", "b", "c") vec_chr
Đầu ra:
## [1] "a" "b" "c"
Ví dụ 3
# Boolean vec_bool <- c(TRUE, FALSE, TRUE) vec_bool
Đầu ra:
##[1] TRUE FALSE TRUE
Chúng ta có thể thực hiện các phép tính số học trên các toán tử nhị phân vectơ trong R.
Ví dụ 4
# Create the vectors vect_1 <- c(1, 3, 5) vect_2 <- c(2, 4, 6) # Take the sum of A_vector and B_vector sum_vect <- vect_1 + vect_2 # Print out total_vector sum_vect
Đầu ra:
[1] 3 7 11
Ví dụ 5
Trong R, có thể cắt một vectơ. Trong một số trường hợp, chúng ta chỉ quan tâm đến năm hàng đầu tiên của vectơ. Chúng ta có thể sử dụng lệnh [1:5] để trích xuất giá trị từ 1 đến 5.
# Slice the first five rows of the vector slice_vector <- c(1,2,3,4,5,6,7,8,9,10) slice_vector[1:5]
Đầu ra:
## [1] 1 2 3 4 5
Ví dụ 6
Cách ngắn nhất để tạo một phạm vi giá trị là sử dụng: giữa hai số. Chẳng hạn, từ ví dụ trên, chúng ta có thể viết c(1:10) để tạo một vectơ có giá trị từ một đến mười.
# Faster way to create adjacent values c(1:10)
Đầu ra:
## [1] 1 2 3 4 5 6 7 8 9 10
R Số học Operaxoắn
Đầu tiên chúng ta sẽ xem các toán tử số học cơ bản trong các kiểu dữ liệu R. Sau đây là các toán tử số học và boolean trong lập trình R, đại diện cho:
Operator | Mô tả |
---|---|
+ | Ngoài ra |
– | Trừ |
* | Phép nhân |
/ | Phòng |
^ hoặc ** | Phép tính |
Ví dụ 1
# An addition 3 + 4
Đầu ra:
## [1] 7
Bạn có thể dễ dàng sao chép và dán mã R ở trên vào Bảng điều khiển Rstudio. Các đầu ra được hiển thị sau ký tự #. Ví dụ: chúng tôi viết mã print('Guru99') thì kết quả đầu ra sẽ là ##[1] Guru99.
## có nghĩa là chúng tôi in đầu ra và số trong ngoặc vuông ([1]) là số hiển thị
Những câu bắt đầu bằng # chú thích. Chúng ta có thể sử dụng # bên trong tập lệnh R để thêm bất kỳ nhận xét nào chúng ta muốn. R sẽ không đọc nó trong thời gian chạy.
Ví dụ 2
# A multiplication 3*5
Đầu ra:
## [1] 15
Ví dụ 3
# A division (5+5)/2
Đầu ra:
## [1] 5
Ví dụ 4
# Exponentiation 2^5
Đầu ra:
Ví dụ 5
## [1] 32
# Modulo 28%%6
Đầu ra:
## [1] 4
R Hợp lý Operaxoắn
Với các toán tử logic, chúng ta muốn trả về các giá trị bên trong vector dựa trên các điều kiện logic. Sau đây là danh sách chi tiết các toán tử logic của các kiểu dữ liệu trong lập trình R
Các câu lệnh logic trong R được gói bên trong []. Chúng ta có thể thêm bao nhiêu câu điều kiện tùy thích nhưng chúng ta cần đưa chúng vào dấu ngoặc đơn. Chúng ta có thể làm theo cấu trúc này để tạo một câu lệnh có điều kiện:
variable_name[(conditional_statement)]
Với biến_name đề cập đến biến, chúng tôi muốn sử dụng cho câu lệnh. Chúng ta tạo câu lệnh logic tức là tên biến > 0. Cuối cùng, chúng ta sử dụng dấu ngoặc vuông để hoàn thiện câu lệnh logic. Dưới đây là một ví dụ về một tuyên bố logic.
Ví dụ 1
# Create a vector from 1 to 10 logical_vector <- c(1:10) logical_vector>5
Đầu ra:
## [1]FALSE FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE TRUE
Trong đầu ra ở trên, R đọc từng giá trị và so sánh với câu lệnh logical_vector>5. Nếu giá trị lớn hơn năm thì điều kiện là ĐÚNG, nếu không thì SAI. R trả về một vector TRUE và FALSE.
Ví dụ 2
Trong ví dụ bên dưới, chúng tôi muốn trích xuất các giá trị chỉ đáp ứng điều kiện 'hoàn toàn vượt trội so với năm'. Để làm được điều đó, chúng ta có thể gói điều kiện bên trong một dấu ngoặc vuông đặt trước vectơ chứa các giá trị.
# Print value strictly above 5 logical_vector[(logical_vector>5)]
Đầu ra:
## [1] 6 7 8 9 10
Ví dụ 3
# Print 5 and 6 logical_vector <- c(1:10) logical_vector[(logical_vector>4) & (logical_vector<7)]
Đầu ra:
## [1] 5 6