Як експортувати дані з R у CSV, Excel

Як експортувати дані з R

У цьому посібнику ми дізнаємося, як експортувати дані із середовища R у різні формати.

Щоб експортувати дані на жорсткий диск, потрібен шлях до файлу та розширення. Перш за все, шлях - це місце, де будуть зберігатися дані. У цьому посібнику ви побачите, як зберігати дані на:

  • Жорсткий диск
  • Google Drive
  • Dropbox

По-друге, R дозволяє користувачам експортувати дані в різні типи файлів. Ми розглядаємо основні розширення файлу:

  • CSV
  • XLSX
  • RDS
  • ПАР
  • SPSS
  • STATA

Загалом, експортувати дані з R. нескладно.

Експорт на жорсткий диск

Для початку ви можете зберегти дані прямо в робочу директорію. Наступний код друкує шлях вашого робочого каталогу:

directory <-getwd()
directory

вихід:

## [1] "/Users/15_Export_to_do"

За замовчуванням файл буде збережено за вказаним нижче шляхом.

Для Mac OS:

/Users/USERNAME/Downloads/

для Windows:

C:\Users\USERNAME\Documents\

Ви, звичайно, можете встановити інший шлях. Наприклад, ви можете змінити шлях до папки завантажень.

Створити кадр даних

Перш за все, давайте імпортуємо набір даних mtcars і отримаємо середнє значення mpg і disp, згрупованих за передачами.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

вихід:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Таблиця містить три рядки і три стовпці. Ви можете створити файл CSV за допомогою функції write.csv у R.

Як експортувати DataFrame у файл CSV у R

Основний синтаксис write.csv у R для експорту DataFrame до CSV у R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

приклад:

write.csv(df, "table_car.csv")

Пояснення коду

  • write.csv(df, “table_car.csv”): Створіть файл CSV на жорсткому диску:
    • df: назва кадру даних у середовищі
    • “table_car.csv”: назвіть файл table_car і збережіть його як CSV

Примітка:: Ви можете використовувати функцію write.csv у R як write.csv2(), щоб відокремити рядки крапкою з комою для експорту R у дані CSV.

write.csv2(df, "table_car.csv")

Примітка:: Лише з педагогічною метою ми створили функцію під назвою open_folder(), щоб відкрити для вас папку каталогу. Вам просто потрібно запустити наведений нижче код і побачити, де зберігається файл csv. Ви повинні побачити імена файлів table_car.csv для експорту даних R у CSV.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Як експортувати дані з R у файл Excel

Тепер ми дізнаємося, як експортувати дані з R в Excel:

Експортувати дані з R в Excel нескладно Windows користувачів і складніше для користувачів Mac OS. Обидва користувачі використовуватимуть бібліотеку xlsx для створення файлу Excel. Невелика різниця виникає через встановлення бібліотеки. Дійсно, бібліотека xlsx використовує Java щоб створити файл. Java потрібно інсталювати, якщо його немає на вашому комп’ютері для експорту даних R до Excel.

Windows користувачі

Якщо ви є Windows користувача, ви можете встановити бібліотеку безпосередньо за допомогою conda, щоб експортувати фрейм даних до excel R:

conda install -c r r-xlsx

Після встановлення бібліотеки ви можете використовувати функцію write.xlsx(). Нова книга Excel створюється в робочому каталозі для експорту R до даних Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Якщо ви користуєтеся Mac OS, вам потрібно виконати такі дії:

  • Крок 1. Установіть останню версію Java
  • Крок 2: Встановіть бібліотеку rJava
  • Крок 3: Встановіть бібліотеку xlsx

Крок 1) Ви можете завантажити Java від офіційного Oracle сайту та встановіть його.

Ви можете повернутися до Rstudio і перевірити, яка версія Java встановлена.

system("java -version")

На момент підручника остання версія Java є 9.0.4.

Крок 2) Вам потрібно встановити java в R. Ми рекомендуємо вам інсталювати R і Rstudio з Anaconda. Anaconda керує залежностями між бібліотеками. У цьому сенсі Anaconda впорається з тонкощами rJava установка.

Перш за все, вам потрібно оновити conda, а потім встановити бібліотека. Ви можете скопіювати та вставити наступні два рядки коду в терміналі.

conda - conda update
conda install -c r r-rjava

Далі відкрийте java в Rstudio

library(rJava)

Крок 3) Нарешті настав час встановити xlsx. Ще раз можна використовувати Конда зробити це:

conda install -c r r-xlsx

Як і користувачі Windows, ви можете зберігати дані за допомогою функції write.xlsx()

library(xlsx)

вихід:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Експорт даних із R до іншого програмного забезпечення

Експортувати дані в інше програмне забезпечення так само просто, як і імпортувати їх. Бібліотека «haven» забезпечує зручний спосіб експорту даних

  • spss
  • ПАР
  • були

Перш за все, імпортуйте бібліотеку. Якщо у вас немає «притулку», можете йти тут для встановлення.

library(haven)

файл SPSS

Нижче наведено код для експорту даних до програмного забезпечення SPSS:

write_sav(df, "table_car.sav")

Експорт даних із R у файл SAS

Так само просто, як spss, ви можете експортувати в sas

write_sas(df, "table_car.sas7bdat")

Як експортувати дані з R у файл STATA

Нарешті, бібліотека haven дозволяє писати файл .dta.

write_dta(df, "table_car.dta")

R

Якщо ви хочете зберегти фрейм даних або будь-який інший об’єкт R, ви можете скористатися функцією save().

save(df, file ='table_car.RData')

Ви можете перевірити створені вище файли в поточному робочому каталозі

Експорт даних із R у файл STATA

Взаємодія з хмарними службами

І останнє, але не в останню чергу, R оснащений фантастичними бібліотеками для взаємодії з хмарними обчислювальними службами. Остання частина цього підручника стосується експорту/імпорту файлів із:

  • Google Drive
  • Dropbox

Примітка:: Ця частина підручника передбачає, що у вас є обліковий запис Google і Dropbox. Якщо ні, ви можете швидко створити його для – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Вам потрібно встановити бібліотеку googledrive, щоб отримати доступ до функції, яка дозволяє взаємодіяти з Google Drive.

Бібліотека ще не доступна в Anaconda. Ви можете встановити його за допомогою наведеного нижче коду в консолі.

install.packages("googledrive")

і ви відкриваєте бібліотеку.

library(googledrive)

Для користувачів, які не є conda, установити бібліотеку легко, ви можете скористатися функцією install.packages('NAME OF PACKAGE) з назвою пакета в дужках. Не забудьте " ". Зауважте, що R повинен автоматично встановлювати пакет у `libPaths(). Варто побачити це в дії.

Завантажити в Google Drive

Щоб завантажити файл на Google диск, потрібно скористатися функцією drive_upload().

Щоразу, коли ви перезапускаєте Rstudio, вам буде запропоновано надати доступ до tidyverse Google Drive.

Основний синтаксис drive_upload() такий

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Після запуску коду потрібно підтвердити кілька запитань

drive_upload%<("table_car.csv", name ="table_car")

вихід:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Ви вводите 1 у консолі, щоб підтвердити доступ

Google Drive

Потім ви перенаправляєтесь до Google API, щоб надати доступ. Натисніть Дозволити.

Google Drive

Після завершення автентифікації ви можете закрити браузер.

Google Drive

У консолі Rstudio ви можете побачити підсумок виконаного кроку. Google успішно завантажив файл, розташований локально на Диску. Google призначив ідентифікатор кожному файлу на диску.

Google Drive

Ви можете побачити цей файл у Google Spreadsheet.

drive_browse("table_car")

вихід:

Ви будете перенаправлені на Google Spreadsheet

Google Drive

Імпорт із Google Drive

Завантажити файл із Google Drive з ID зручно. Якщо ви знаєте назву файлу, ви можете отримати його ідентифікатор наступним чином:

Примітка:: Залежно від підключення до Інтернету та розміру Диска це займає певний час.

x <-drive_get("table_car")
as_id(x)

Google Drive

Ви зберегли ідентифікатор у змінній x. Функція drive_download() дозволяє завантажити файл з Google Drive.

Основний синтаксис:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Нарешті ви можете завантажити файл:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Пояснення коду

  • drive_download(): функція для завантаження файлу Google Drive
  • as_id(x): використовуйте ідентифікатор для перегляду файлу Google Drive
  • overwrite = TRUE: якщо файл існує, перезапишіть його, інакше виконання зупинено. Щоб побачити назву файлу локально, ви можете використати:

вихід:

Google Drive

Файл зберігається у вашому робочому каталозі. Пам’ятайте, що вам потрібно додати розширення файлу, щоб відкрити його в R. Ви можете створити повне ім’я за допомогою функції paste() (тобто table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

вихід:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Нарешті, ви можете видалити файл зі свого диска Google.

## remove file
drive_find("table_car") %>%drive_rm()

вихід:

Google Drive

Це повільний процес. Для видалення потрібен час

Експортувати в Dropbox

R взаємодіє з Dropbox через бібліотеку rdrop2. Бібліотека також недоступна в Anaconda. Ви можете встановити його через консоль

install.packages('rdrop2')
library(rdrop2)

Потрібно надати тимчасовий доступ до Dropbox з обліковими даними. Після ідентифікації R може створювати, видаляти завантаження та завантажувати на ваш Dropbox.

Перш за все, вам потрібно надати доступ до свого облікового запису. Облікові дані зберігаються в кеші протягом усього сеансу.

drop_auth()

Ви будете перенаправлені на Dropbox щоб підтвердити автентифікацію.

Експортувати в Dropbox

Ви отримаєте сторінку підтвердження. Ви можете закрити його та повернутися до R

Експортувати в Dropbox

Ви можете створити папку за допомогою функції drop_create().

  • drop_create('my_first_drop'): Створіть папку в першій гілці Dropbox
  • drop_create('First_branch/my_first_drop'): Створіть папку всередині існуючої папки First_branch.
drop_create('my_first_drop')

вихід:

Експортувати в Dropbox

В DropBox

Експортувати в Dropbox

Щоб завантажити файл .csv у ваш Dropbox, використовуйте функцію drop_upload().

Основний синтаксис:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

вихід:

Експортувати в Dropbox

У DropBox

Експортувати в Dropbox

Ви можете прочитати файл csv з Dropbox за допомогою функції drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

вихід:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Коли ви закінчите використовувати файл і хочете його видалити. Потрібно прописати шлях до файлу у функції drop_delete()

drop_delete('my_first_drop/table_car.csv')

вихід:

Експортувати в Dropbox

Також можна видалити папку

drop_delete('my_first_drop')

вихід:

Експортувати в Dropbox

Підсумки

Ми можемо узагальнити всі функції в таблиці нижче

Library мета функція
база Експорт CSV write.csv()
XLSX Експорт Excel write.xlsx()
притулок Експорт spss write_sav()
притулок Експорт sas write_sas()
притулок Експорт даних write_dta()
база Експорт Р зберегти ()
Гугедріве Завантажувати Google Drive drive_upload()
Гугедріве відкрити в Google Drive drive_browse()
Гугедріве Отримати ідентифікатор файлу drive_get(as_id())
Гугедріве Завантажити з Google Drive download_google()
Гугедріве Видалити файл із Google Drive drive_rm()
rdrop2 ідентифікація drop_auth()
rdrop2 Створіть папку drop_create()
rdrop2 Завантажити в Dropbox drop_upload()
rdrop2 Прочитати csv з Dropbox drop_read_csv
rdrop2 Видалити файл із Dropbox drop_delete()