Як експортувати дані з R у CSV, Excel
Як експортувати дані з R
У цьому посібнику ми дізнаємося, як експортувати дані із середовища R у різні формати.
Щоб експортувати дані на жорсткий диск, потрібен шлях до файлу та розширення. Перш за все, шлях - це місце, де будуть зберігатися дані. У цьому посібнику ви побачите, як зберігати дані на:
- Жорсткий диск
- Google Drive
- Dropbox
По-друге, R дозволяє користувачам експортувати дані в різні типи файлів. Ми розглядаємо основні розширення файлу:
- CSV
- XLSX
- RDS
- ПАР
- SPSS
- STATA
Загалом, експортувати дані з R. нескладно.
Експорт на жорсткий диск
Для початку ви можете зберегти дані прямо в робочу директорію. Наступний код друкує шлях вашого робочого каталогу:
directory <-getwd() directory
вихід:
## [1] "/Users/15_Export_to_do"
За замовчуванням файл буде збережено за вказаним нижче шляхом.
Для Mac OS:
/Users/USERNAME/Downloads/
для Windows:
C:\Users\USERNAME\Documents\
Ви, звичайно, можете встановити інший шлях. Наприклад, ви можете змінити шлях до папки завантажень.
Створити кадр даних
Перш за все, давайте імпортуємо набір даних mtcars і отримаємо середнє значення mpg і disp, згрупованих за передачами.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
вихід:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
Таблиця містить три рядки і три стовпці. Ви можете створити файл CSV за допомогою функції write.csv у R.
Як експортувати DataFrame у файл CSV у R
Основний синтаксис write.csv у R для експорту DataFrame до CSV у R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
приклад:
write.csv(df, "table_car.csv")
Пояснення коду
- write.csv(df, “table_car.csv”): Створіть файл CSV на жорсткому диску:
- df: назва кадру даних у середовищі
- “table_car.csv”: назвіть файл table_car і збережіть його як CSV
Примітка:: Ви можете використовувати функцію write.csv у R як write.csv2(), щоб відокремити рядки крапкою з комою для експорту R у дані CSV.
write.csv2(df, "table_car.csv")
Примітка:: Лише з педагогічною метою ми створили функцію під назвою open_folder(), щоб відкрити для вас папку каталогу. Вам просто потрібно запустити наведений нижче код і побачити, де зберігається файл csv. Ви повинні побачити імена файлів table_car.csv для експорту даних R у CSV.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Як експортувати дані з R у файл Excel
Тепер ми дізнаємося, як експортувати дані з R в Excel:
Експортувати дані з R в Excel нескладно Windows користувачів і складніше для користувачів Mac OS. Обидва користувачі використовуватимуть бібліотеку xlsx для створення файлу Excel. Невелика різниця виникає через встановлення бібліотеки. Дійсно, бібліотека xlsx використовує Java щоб створити файл. Java потрібно інсталювати, якщо його немає на вашому комп’ютері для експорту даних R до Excel.
Windows користувачі
Якщо ви є Windows користувача, ви можете встановити бібліотеку безпосередньо за допомогою conda, щоб експортувати фрейм даних до excel R:
conda install -c r r-xlsx
Після встановлення бібліотеки ви можете використовувати функцію write.xlsx(). Нова книга Excel створюється в робочому каталозі для експорту R до даних Excel
library(xlsx) write.xlsx(df, "table_car.xlsx")
Якщо ви користуєтеся Mac OS, вам потрібно виконати такі дії:
- Крок 1. Установіть останню версію Java
- Крок 2: Встановіть бібліотеку rJava
- Крок 3: Встановіть бібліотеку xlsx
Крок 1) Ви можете завантажити Java від офіційного Oracle сайту та встановіть його.
Ви можете повернутися до Rstudio і перевірити, яка версія Java встановлена.
system("java -version")
На момент підручника остання версія Java є 9.0.4.
Крок 2) Вам потрібно встановити java в R. Ми рекомендуємо вам інсталювати R і Rstudio з Anaconda. Anaconda керує залежностями між бібліотеками. У цьому сенсі Anaconda впорається з тонкощами rJava установка.
Перш за все, вам потрібно оновити conda, а потім встановити бібліотека. Ви можете скопіювати та вставити наступні два рядки коду в терміналі.
conda - conda update conda install -c r r-rjava
Далі відкрийте java в Rstudio
library(rJava)
Крок 3) Нарешті настав час встановити xlsx. Ще раз можна використовувати Конда зробити це:
conda install -c r r-xlsx
Як і користувачі Windows, ви можете зберігати дані за допомогою функції write.xlsx()
library(xlsx)
вихід:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Експорт даних із R до іншого програмного забезпечення
Експортувати дані в інше програмне забезпечення так само просто, як і імпортувати їх. Бібліотека «haven» забезпечує зручний спосіб експорту даних
- spss
- ПАР
- були
Перш за все, імпортуйте бібліотеку. Якщо у вас немає «притулку», можете йти тут для встановлення.
library(haven)
файл SPSS
Нижче наведено код для експорту даних до програмного забезпечення SPSS:
write_sav(df, "table_car.sav")
Експорт даних із R у файл SAS
Так само просто, як spss, ви можете експортувати в sas
write_sas(df, "table_car.sas7bdat")
Як експортувати дані з R у файл STATA
Нарешті, бібліотека haven дозволяє писати файл .dta.
write_dta(df, "table_car.dta")
R
Якщо ви хочете зберегти фрейм даних або будь-який інший об’єкт R, ви можете скористатися функцією save().
save(df, file ='table_car.RData')
Ви можете перевірити створені вище файли в поточному робочому каталозі
Взаємодія з хмарними службами
І останнє, але не в останню чергу, R оснащений фантастичними бібліотеками для взаємодії з хмарними обчислювальними службами. Остання частина цього підручника стосується експорту/імпорту файлів із:
- Google Drive
- Dropbox
Примітка:: Ця частина підручника передбачає, що у вас є обліковий запис Google і Dropbox. Якщо ні, ви можете швидко створити його для – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Вам потрібно встановити бібліотеку googledrive, щоб отримати доступ до функції, яка дозволяє взаємодіяти з Google Drive.
Бібліотека ще не доступна в Anaconda. Ви можете встановити його за допомогою наведеного нижче коду в консолі.
install.packages("googledrive")
і ви відкриваєте бібліотеку.
library(googledrive)
Для користувачів, які не є conda, установити бібліотеку легко, ви можете скористатися функцією install.packages('NAME OF PACKAGE) з назвою пакета в дужках. Не забудьте " ". Зауважте, що R повинен автоматично встановлювати пакет у `libPaths(). Варто побачити це в дії.
Завантажити в Google Drive
Щоб завантажити файл на Google диск, потрібно скористатися функцією drive_upload().
Щоразу, коли ви перезапускаєте Rstudio, вам буде запропоновано надати доступ до tidyverse Google Drive.
Основний синтаксис drive_upload() такий
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Після запуску коду потрібно підтвердити кілька запитань
drive_upload%<("table_car.csv", name ="table_car")
вихід:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Ви вводите 1 у консолі, щоб підтвердити доступ
Потім ви перенаправляєтесь до Google API, щоб надати доступ. Натисніть Дозволити.
Після завершення автентифікації ви можете закрити браузер.
У консолі Rstudio ви можете побачити підсумок виконаного кроку. Google успішно завантажив файл, розташований локально на Диску. Google призначив ідентифікатор кожному файлу на диску.
Ви можете побачити цей файл у Google Spreadsheet.
drive_browse("table_car")
вихід:
Ви будете перенаправлені на Google Spreadsheet
Імпорт із Google Drive
Завантажити файл із Google Drive з ID зручно. Якщо ви знаєте назву файлу, ви можете отримати його ідентифікатор наступним чином:
Примітка:: Залежно від підключення до Інтернету та розміру Диска це займає певний час.
x <-drive_get("table_car") as_id(x)
Ви зберегли ідентифікатор у змінній x. Функція drive_download() дозволяє завантажити файл з Google Drive.
Основний синтаксис:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Нарешті ви можете завантажити файл:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Пояснення коду
- drive_download(): функція для завантаження файлу Google Drive
- as_id(x): використовуйте ідентифікатор для перегляду файлу Google Drive
- overwrite = TRUE: якщо файл існує, перезапишіть його, інакше виконання зупинено. Щоб побачити назву файлу локально, ви можете використати:
вихід:
Файл зберігається у вашому робочому каталозі. Пам’ятайте, що вам потрібно додати розширення файлу, щоб відкрити його в R. Ви можете створити повне ім’я за допомогою функції paste() (тобто table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
вихід:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Нарешті, ви можете видалити файл зі свого диска Google.
## remove file drive_find("table_car") %>%drive_rm()
вихід:
Це повільний процес. Для видалення потрібен час
Експортувати в Dropbox
R взаємодіє з Dropbox через бібліотеку rdrop2. Бібліотека також недоступна в Anaconda. Ви можете встановити його через консоль
install.packages('rdrop2')
library(rdrop2)
Потрібно надати тимчасовий доступ до Dropbox з обліковими даними. Після ідентифікації R може створювати, видаляти завантаження та завантажувати на ваш Dropbox.
Перш за все, вам потрібно надати доступ до свого облікового запису. Облікові дані зберігаються в кеші протягом усього сеансу.
drop_auth()
Ви будете перенаправлені на Dropbox щоб підтвердити автентифікацію.
Ви отримаєте сторінку підтвердження. Ви можете закрити його та повернутися до R
Ви можете створити папку за допомогою функції drop_create().
- drop_create('my_first_drop'): Створіть папку в першій гілці Dropbox
- drop_create('First_branch/my_first_drop'): Створіть папку всередині існуючої папки First_branch.
drop_create('my_first_drop')
вихід:
В DropBox
Щоб завантажити файл .csv у ваш Dropbox, використовуйте функцію drop_upload().
Основний синтаксис:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
вихід:
У DropBox
Ви можете прочитати файл csv з Dropbox за допомогою функції drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
вихід:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Коли ви закінчите використовувати файл і хочете його видалити. Потрібно прописати шлях до файлу у функції drop_delete()
drop_delete('my_first_drop/table_car.csv')
вихід:
Також можна видалити папку
drop_delete('my_first_drop')
вихід:
Підсумки
Ми можемо узагальнити всі функції в таблиці нижче
Library | мета | функція |
---|---|---|
база | Експорт CSV | write.csv() |
XLSX | Експорт Excel | write.xlsx() |
притулок | Експорт spss | write_sav() |
притулок | Експорт sas | write_sas() |
притулок | Експорт даних | write_dta() |
база | Експорт Р | зберегти () |
Гугедріве | Завантажувати Google Drive | drive_upload() |
Гугедріве | відкрити в Google Drive | drive_browse() |
Гугедріве | Отримати ідентифікатор файлу | drive_get(as_id()) |
Гугедріве | Завантажити з Google Drive | download_google() |
Гугедріве | Видалити файл із Google Drive | drive_rm() |
rdrop2 | ідентифікація | drop_auth() |
rdrop2 | Створіть папку | drop_create() |
rdrop2 | Завантажити в Dropbox | drop_upload() |
rdrop2 | Прочитати csv з Dropbox | drop_read_csv |
rdrop2 | Видалити файл із Dropbox | drop_delete() |