Как экспортировать данные из R в CSV, Excel

Как экспортировать данные из R

В этом уроке мы научимся экспортировать данные из среды R в различные форматы.

Чтобы экспортировать данные на жесткий диск, вам понадобится путь к файлу и расширение. Прежде всего, путь — это место, где будут храниться данные. В этом уроке вы увидите, как хранить данные:

  • Жесткий диск
  • Google Drive
  • Dropbox

Во-вторых, R позволяет пользователям экспортировать данные в файлы разных типов. Мы рассмотрим расширение основного файла:

  • CSV
  • XLSX
  • RDS
  • ПАВ
  • SPSS
  • СТАТА

В целом экспортировать данные из R.

Экспорт на жесткий диск

Для начала вы можете сохранить данные прямо в рабочий каталог. Следующий код печатает путь к вашему рабочему каталогу:

directory <-getwd()
directory

Вывод:

## [1] "/Users/15_Export_to_do"

По умолчанию файл будет сохранен по указанному ниже пути.

Для Mac OS:

/Users/USERNAME/Downloads/

Что касается Windows:

C:\Users\USERNAME\Documents\

Вы, конечно, можете указать другой путь. Например, вы можете изменить путь к папке загрузки.

Создать фрейм данных

Прежде всего, давайте импортируем набор данных mtcars и получим средние значения миль на галлон и расход топлива, сгруппированные по передаче.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Вывод:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Таблица содержит три строки и три столбца. Вы можете создать файл CSV с помощью функции write.csv в R.

Как экспортировать DataFrame в файл CSV в R

Основной синтаксис write.csv в R для экспорта DataFrame в CSV в R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Пример:

write.csv(df, "table_car.csv")

Код Пояснение

  • write.csv(df, «table_car.csv»): создайте файл CSV на жестком диске:
    • df: имя фрейма данных в среде.
    • «table_car.csv»: назовите файл table_car и сохраните его как csv.

Внимание: вы можете использовать функцию write.csv в R как write.csv2() для разделения строк точкой с запятой для экспорта R в данные CSV.

write.csv2(df, "table_car.csv")

Внимание: Исключительно в педагогических целях мы создали функцию open_folder(), которая открывает вам папку каталога. Вам просто нужно запустить приведенный ниже код и посмотреть, где хранится CSV-файл. Вы должны увидеть имена файлов table_car.csv для экспорта данных R в CSV.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Как экспортировать данные из R в файл Excel

Теперь мы научимся экспортировать данные из R в Excel:

Экспорт данных из R в Excel тривиален для Windows пользователей и сложнее для пользователей Mac OS. Оба пользователя будут использовать библиотеку xlsx для создания файла Excel. Небольшая разница связана с установкой библиотеки. Действительно, библиотека xlsx использует Java для создания файла. Java необходимо установить, если он отсутствует на вашем компьютере, для экспорта данных R в Excel.

Windows пользователей

Если вы Windows пользователь, вы можете установить библиотеку напрямую с помощью conda, чтобы экспортировать фрейм данных в Excel R:

conda install -c r r-xlsx

После установки библиотеки вы можете использовать функцию write.xlsx(). В рабочем каталоге создается новая книга Excel для экспорта R в данные Excel.

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Если вы являетесь пользователем Mac OS, вам необходимо выполнить следующие действия:

  • Шаг 1. Установите последнюю версию Java
  • Шаг 2. Установите библиотеку rJava
  • Шаг 3. Установите библиотеку xlsx.

Шаг 1) Вы можете скачать Java из официальных Oracle сайт и установите его.

Вы можете вернуться в Rstudio и проверить, какая версия Java установлен.

system("java -version")

На момент обучения использовалась последняя версия Java это 9.0.4.

Шаг 2) Вам необходимо установить rjava в R. Мы рекомендовали вам установить R и Rstudio с Anaconda. Anaconda управляет зависимостями между библиотеками. В этом смысле Anaconda будет управлять тонкостями rJava установка.

Прежде всего вам необходимо обновить conda, а затем установить библиотека. Вы можете скопировать и вставить следующие две строки кода в терминал.

conda - conda update
conda install -c r r-rjava

Далее откройте rjava в Rstudio.

library(rJava)

Шаг 3) Наконец, пришло время установить xlsx. Еще раз, вы можете использовать Conda сделать это:

conda install -c r r-xlsx

Как и пользователи Windows, вы можете сохранять данные с помощью функции write.xlsx().

library(xlsx)

Вывод:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Экспорт данных из R в другое программное обеспечение

Экспортировать данные в другое программное обеспечение так же просто, как и импортировать. Библиотека «гавань» предоставляет удобный способ экспорта данных в

  • SPSS
  • ПАВ
  • Stata

Прежде всего импортируйте библиотеку. Если у вас нет «убежища», вы можете пойти здесь для его установки.

library(haven)

SPSS-файл

Ниже приведен код для экспорта данных в программное обеспечение SPSS:

write_sav(df, "table_car.sav")

Экспорт данных из R в файл SAS

Так же просто, как spss, вы можете экспортировать в Sas.

write_sas(df, "table_car.sas7bdat")

Как экспортировать данные из R в файл STATA

Наконец, библиотека Have позволяет записывать файл .dta.

write_dta(df, "table_car.dta")

R

Если вы хотите сохранить фрейм данных или любой другой объект R, вы можете использовать функцию save().

save(df, file ='table_car.RData')

Вы можете проверить файлы, созданные выше, в текущем рабочем каталоге.

Экспорт данных из R в файл STATA

Взаимодействие с облачными сервисами

Последнее, но не менее R оснащен фантастическими библиотеками для взаимодействия со службами облачных вычислений. Последняя часть этого руководства посвящена экспорту/импорту файлов из:

  • Google Drive
  • Dropbox

Внимание: В этой части руководства предполагается, что у вас есть учетная запись Google и Dropbox. Если нет, вы можете быстро создать его для – Google Drive: https://accounts.google.com/SignUp?hl=en – Dropbox: https://www.dropbox.com/h

Google Drive

Вам необходимо установить библиотеку googledrive для доступа к функции, позволяющей взаимодействовать с Google Drive.

Библиотека в Анаконде пока недоступна. Вы можете установить его с помощью кода ниже в консоли.

install.packages("googledrive")

и вы открываете библиотеку.

library(googledrive)

Для пользователей, не использующих Conda, установка библиотеки проста: вы можете использовать функцию install.packages('NAME OF PACKAGE) с именем пакета в скобках. Не забудьте ''. Обратите внимание, что R должен автоматически установить пакет в libPaths(). Стоит увидеть это в действии.

Загрузить на Google Drive

Чтобы загрузить файл на Google диск, вам нужно использовать функцию Drive_upload().

Каждый раз, когда вы перезапускаете Rstudio, вам будет предложено разрешить доступ tidyverse к Google Drive.

Основной синтаксис Drive_upload():

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

После запуска кода вам необходимо подтвердить несколько вопросов

drive_upload%<("table_car.csv", name ="table_car")

Вывод:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Вы вводите 1 в консоли, чтобы подтвердить доступ

Google Drive

Затем вы будете перенаправлены на Google API, чтобы разрешить доступ. Нажмите Разрешить.

Google Drive

После завершения аутентификации вы можете выйти из браузера.

Google Drive

В консоли Rstudio вы можете увидеть сводку выполненного шага. Google успешно загрузил файл, расположенный локально на Диске. Google присвоил идентификатор каждому файлу на диске.

Google Drive

Вы можете увидеть этот файл в Google Spreadsheet.

drive_browse("table_car")

Вывод:

Вы будете перенаправлены на Google Spreadsheet

Google Drive

Импорт из Google Drive

Загрузите файл из Google Drive с ID удобно. Если вы знаете имя файла, вы можете получить его идентификатор следующим образом:

Внимание: в зависимости от вашего подключения к Интернету и размера вашего Диска это может занять некоторое время.

x <-drive_get("table_car")
as_id(x)

Google Drive

Вы сохранили идентификатор в переменной x. Функцияdrive_download() позволяет загрузить файл с Google Drive.

Основной синтаксис:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Наконец, вы можете скачать файл:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Код Пояснение

  • Drive_download(): Функция для загрузки файла с Google Drive
  • as_id(x): используйте идентификатор для просмотра файла в Google Drive
  • overwrite = TRUE: если файл существует, перезапишите его, иначе выполнение остановлено. Чтобы просмотреть имя файла локально, вы можете использовать:

Вывод:

Google Drive

Файл хранится в вашем рабочем каталоге. Помните, что вам нужно добавить расширение файла, чтобы открыть его в R. Вы можете создать полное имя с помощью функции пасты() (например, table_car.csv).

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Вывод:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Наконец, вы можете удалить файл со своего диска Google.

## remove file
drive_find("table_car") %>%drive_rm()

Вывод:

Google Drive

Это медленный процесс. Требуется время, чтобы удалить

Экспорт в Dropbox

R взаимодействует с Dropbox через библиотеку rdrop2. Библиотека также недоступна в Анаконде. Установить его можно через консоль

install.packages('rdrop2')
library(rdrop2)

Вам необходимо предоставить временный доступ к Dropbox с вашими полномочиями. После завершения идентификации R может создавать, удалять загрузку и загрузку на ваш компьютер. Dropbox.

Прежде всего, вам необходимо предоставить доступ к своему аккаунту. Учетные данные кэшируются в течение всего сеанса.

drop_auth()

Вы будете перенаправлены на Dropbox для подтверждения аутентификации.

Экспорт в Dropbox

Вы получите страницу подтверждения. Вы можете закрыть его и вернуться к R.

Экспорт в Dropbox

Вы можете создать папку с помощью функции drop_create().

  • drop_create('my_first_drop'): Создайте папку в первой ветке Dropbox
  • drop_create('First_branch/my_first_drop'): Создайте папку внутри существующей папки First_branch.
drop_create('my_first_drop')

Вывод:

Экспорт в Dropbox

В паденииBox

Экспорт в Dropbox

Чтобы загрузить файл .csv в свой Dropbox, используйте функцию drop_upload().

Базовый синтаксис:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Вывод:

Экспорт в Dropbox

В паденииBox

Экспорт в Dropbox

Вы можете прочитать файл csv из Dropbox с помощью функции drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Вывод:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Когда вы закончите использовать файл и захотите его удалить. Вам нужно прописать путь к файлу в функции drop_delete().

drop_delete('my_first_drop/table_car.csv')

Вывод:

Экспорт в Dropbox

Также возможно удалить папку

drop_delete('my_first_drop')

Вывод:

Экспорт в Dropbox

Итого

Мы можем суммировать все функции в таблице ниже.

Библиотека Цель Функция
Использование темпера с изогнутым основанием Экспорт csv запись.csv()
XLSX Экспортировать в Excel запись.xlsx()
убежище Экспортировать спсс write_sav()
убежище Экспортировать САС write_sas()
убежище Экспортировать данные write_dta()
Использование темпера с изогнутым основанием Экспорт Р спасти()
Google Drive Загрузите Google Drive Drive_upload()
Google Drive Открыть в Google Drive диск_обзор()
Google Drive Получить идентификатор файла диск_get(as_id())
Google Drive Скачать с Google Drive download_google()
Google Drive Удалить файл из Google Drive диск_rm()
рдроп2 идентификация drop_auth()
рдроп2 Создать папку drop_create()
рдроп2 Загрузить на Dropbox drop_upload()
рдроп2 Прочитать CSV из Dropbox drop_read_csv
рдроп2 Удалить файл из Dropbox drop_delete()