Как экспортировать данные из R в CSV, Excel
Как экспортировать данные из R
В этом уроке мы научимся экспортировать данные из среды R в различные форматы.
Чтобы экспортировать данные на жесткий диск, вам понадобится путь к файлу и расширение. Прежде всего, путь — это место, где будут храниться данные. В этом уроке вы увидите, как хранить данные:
- Жесткий диск
- Google Drive
- Dropbox
Во-вторых, R позволяет пользователям экспортировать данные в файлы разных типов. Мы рассмотрим расширение основного файла:
- CSV
- XLSX
- RDS
- ПАВ
- SPSS
- СТАТА
В целом экспортировать данные из R.
Экспорт на жесткий диск
Для начала вы можете сохранить данные прямо в рабочий каталог. Следующий код печатает путь к вашему рабочему каталогу:
directory <-getwd() directory
Вывод:
## [1] "/Users/15_Export_to_do"
По умолчанию файл будет сохранен по указанному ниже пути.
Для Mac OS:
/Users/USERNAME/Downloads/
Что касается Windows:
C:\Users\USERNAME\Documents\
Вы, конечно, можете указать другой путь. Например, вы можете изменить путь к папке загрузки.
Создать фрейм данных
Прежде всего, давайте импортируем набор данных mtcars и получим средние значения миль на галлон и расход топлива, сгруппированные по передаче.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
Вывод:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
Таблица содержит три строки и три столбца. Вы можете создать файл CSV с помощью функции write.csv в R.
Как экспортировать DataFrame в файл CSV в R
Основной синтаксис write.csv в R для экспорта DataFrame в CSV в R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Пример:
write.csv(df, "table_car.csv")
Код Пояснение
- write.csv(df, «table_car.csv»): создайте файл CSV на жестком диске:
- df: имя фрейма данных в среде.
- «table_car.csv»: назовите файл table_car и сохраните его как csv.
Внимание: вы можете использовать функцию write.csv в R как write.csv2() для разделения строк точкой с запятой для экспорта R в данные CSV.
write.csv2(df, "table_car.csv")
Внимание: Исключительно в педагогических целях мы создали функцию open_folder(), которая открывает вам папку каталога. Вам просто нужно запустить приведенный ниже код и посмотреть, где хранится CSV-файл. Вы должны увидеть имена файлов table_car.csv для экспорта данных R в CSV.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Как экспортировать данные из R в файл Excel
Теперь мы научимся экспортировать данные из R в Excel:
Экспорт данных из R в Excel тривиален для Windows пользователей и сложнее для пользователей Mac OS. Оба пользователя будут использовать библиотеку xlsx для создания файла Excel. Небольшая разница связана с установкой библиотеки. Действительно, библиотека xlsx использует Java для создания файла. Java необходимо установить, если он отсутствует на вашем компьютере, для экспорта данных R в Excel.
Windows пользователей
Если вы Windows пользователь, вы можете установить библиотеку напрямую с помощью conda, чтобы экспортировать фрейм данных в Excel R:
conda install -c r r-xlsx
После установки библиотеки вы можете использовать функцию write.xlsx(). В рабочем каталоге создается новая книга Excel для экспорта R в данные Excel.
library(xlsx) write.xlsx(df, "table_car.xlsx")
Если вы являетесь пользователем Mac OS, вам необходимо выполнить следующие действия:
- Шаг 1. Установите последнюю версию Java
- Шаг 2. Установите библиотеку rJava
- Шаг 3. Установите библиотеку xlsx.
Шаг 1) Вы можете скачать Java из официальных Oracle сайт и установите его.
Вы можете вернуться в Rstudio и проверить, какая версия Java установлен.
system("java -version")
На момент обучения использовалась последняя версия Java это 9.0.4.
Шаг 2) Вам необходимо установить rjava в R. Мы рекомендовали вам установить R и Rstudio с Anaconda. Anaconda управляет зависимостями между библиотеками. В этом смысле Anaconda будет управлять тонкостями rJava установка.
Прежде всего вам необходимо обновить conda, а затем установить библиотека. Вы можете скопировать и вставить следующие две строки кода в терминал.
conda - conda update conda install -c r r-rjava
Далее откройте rjava в Rstudio.
library(rJava)
Шаг 3) Наконец, пришло время установить xlsx. Еще раз, вы можете использовать Conda сделать это:
conda install -c r r-xlsx
Как и пользователи Windows, вы можете сохранять данные с помощью функции write.xlsx().
library(xlsx)
Вывод:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Экспорт данных из R в другое программное обеспечение
Экспортировать данные в другое программное обеспечение так же просто, как и импортировать. Библиотека «гавань» предоставляет удобный способ экспорта данных в
- SPSS
- ПАВ
- Stata
Прежде всего импортируйте библиотеку. Если у вас нет «убежища», вы можете пойти здесь для его установки.
library(haven)
SPSS-файл
Ниже приведен код для экспорта данных в программное обеспечение SPSS:
write_sav(df, "table_car.sav")
Экспорт данных из R в файл SAS
Так же просто, как spss, вы можете экспортировать в Sas.
write_sas(df, "table_car.sas7bdat")
Как экспортировать данные из R в файл STATA
Наконец, библиотека Have позволяет записывать файл .dta.
write_dta(df, "table_car.dta")
R
Если вы хотите сохранить фрейм данных или любой другой объект R, вы можете использовать функцию save().
save(df, file ='table_car.RData')
Вы можете проверить файлы, созданные выше, в текущем рабочем каталоге.
Взаимодействие с облачными сервисами
Последнее, но не менее R оснащен фантастическими библиотеками для взаимодействия со службами облачных вычислений. Последняя часть этого руководства посвящена экспорту/импорту файлов из:
- Google Drive
- Dropbox
Внимание: В этой части руководства предполагается, что у вас есть учетная запись Google и Dropbox. Если нет, вы можете быстро создать его для – Google Drive: https://accounts.google.com/SignUp?hl=en – Dropbox: https://www.dropbox.com/h
Google Drive
Вам необходимо установить библиотеку googledrive для доступа к функции, позволяющей взаимодействовать с Google Drive.
Библиотека в Анаконде пока недоступна. Вы можете установить его с помощью кода ниже в консоли.
install.packages("googledrive")
и вы открываете библиотеку.
library(googledrive)
Для пользователей, не использующих Conda, установка библиотеки проста: вы можете использовать функцию install.packages('NAME OF PACKAGE) с именем пакета в скобках. Не забудьте ''. Обратите внимание, что R должен автоматически установить пакет в libPaths(). Стоит увидеть это в действии.
Загрузить на Google Drive
Чтобы загрузить файл на Google диск, вам нужно использовать функцию Drive_upload().
Каждый раз, когда вы перезапускаете Rstudio, вам будет предложено разрешить доступ tidyverse к Google Drive.
Основной синтаксис Drive_upload():
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
После запуска кода вам необходимо подтвердить несколько вопросов
drive_upload%<("table_car.csv", name ="table_car")
Вывод:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Вы вводите 1 в консоли, чтобы подтвердить доступ
Затем вы будете перенаправлены на Google API, чтобы разрешить доступ. Нажмите Разрешить.
После завершения аутентификации вы можете выйти из браузера.
В консоли Rstudio вы можете увидеть сводку выполненного шага. Google успешно загрузил файл, расположенный локально на Диске. Google присвоил идентификатор каждому файлу на диске.
Вы можете увидеть этот файл в Google Spreadsheet.
drive_browse("table_car")
Вывод:
Вы будете перенаправлены на Google Spreadsheet
Импорт из Google Drive
Загрузите файл из Google Drive с ID удобно. Если вы знаете имя файла, вы можете получить его идентификатор следующим образом:
Внимание: в зависимости от вашего подключения к Интернету и размера вашего Диска это может занять некоторое время.
x <-drive_get("table_car") as_id(x)
Вы сохранили идентификатор в переменной x. Функцияdrive_download() позволяет загрузить файл с Google Drive.
Основной синтаксис:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Наконец, вы можете скачать файл:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Код Пояснение
- Drive_download(): Функция для загрузки файла с Google Drive
- as_id(x): используйте идентификатор для просмотра файла в Google Drive
- overwrite = TRUE: если файл существует, перезапишите его, иначе выполнение остановлено. Чтобы просмотреть имя файла локально, вы можете использовать:
Вывод:
Файл хранится в вашем рабочем каталоге. Помните, что вам нужно добавить расширение файла, чтобы открыть его в R. Вы можете создать полное имя с помощью функции пасты() (например, table_car.csv).
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
Вывод:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Наконец, вы можете удалить файл со своего диска Google.
## remove file drive_find("table_car") %>%drive_rm()
Вывод:
Это медленный процесс. Требуется время, чтобы удалить
Экспорт в Dropbox
R взаимодействует с Dropbox через библиотеку rdrop2. Библиотека также недоступна в Анаконде. Установить его можно через консоль
install.packages('rdrop2')
library(rdrop2)
Вам необходимо предоставить временный доступ к Dropbox с вашими полномочиями. После завершения идентификации R может создавать, удалять загрузку и загрузку на ваш компьютер. Dropbox.
Прежде всего, вам необходимо предоставить доступ к своему аккаунту. Учетные данные кэшируются в течение всего сеанса.
drop_auth()
Вы будете перенаправлены на Dropbox для подтверждения аутентификации.
Вы получите страницу подтверждения. Вы можете закрыть его и вернуться к R.
Вы можете создать папку с помощью функции drop_create().
- drop_create('my_first_drop'): Создайте папку в первой ветке Dropbox
- drop_create('First_branch/my_first_drop'): Создайте папку внутри существующей папки First_branch.
drop_create('my_first_drop')
Вывод:
В паденииBox
Чтобы загрузить файл .csv в свой Dropbox, используйте функцию drop_upload().
Базовый синтаксис:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Вывод:
В паденииBox
Вы можете прочитать файл csv из Dropbox с помощью функции drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
Вывод:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Когда вы закончите использовать файл и захотите его удалить. Вам нужно прописать путь к файлу в функции drop_delete().
drop_delete('my_first_drop/table_car.csv')
Вывод:
Также возможно удалить папку
drop_delete('my_first_drop')
Вывод:
Итого
Мы можем суммировать все функции в таблице ниже.
Библиотека | Цель | Функция |
---|---|---|
Использование темпера с изогнутым основанием | Экспорт csv | запись.csv() |
XLSX | Экспортировать в Excel | запись.xlsx() |
убежище | Экспортировать спсс | write_sav() |
убежище | Экспортировать САС | write_sas() |
убежище | Экспортировать данные | write_dta() |
Использование темпера с изогнутым основанием | Экспорт Р | спасти() |
Google Drive | Загрузите Google Drive | Drive_upload() |
Google Drive | Открыть в Google Drive | диск_обзор() |
Google Drive | Получить идентификатор файла | диск_get(as_id()) |
Google Drive | Скачать с Google Drive | download_google() |
Google Drive | Удалить файл из Google Drive | диск_rm() |
рдроп2 | идентификация | drop_auth() |
рдроп2 | Создать папку | drop_create() |
рдроп2 | Загрузить на Dropbox | drop_upload() |
рдроп2 | Прочитать CSV из Dropbox | drop_read_csv |
рдроп2 | Удалить файл из Dropbox | drop_delete() |