Jak eksportować dane z R do CSV, Excel

Jak wyeksportować dane z R

W tym samouczku nauczymy się eksportować dane ze środowiska R do różnych formatów.

Aby wyeksportować dane na dysk twardy, potrzebujesz ścieżki pliku i rozszerzenia. Po pierwsze, ścieżka to miejsce, w którym będą przechowywane dane. W tym samouczku zobaczysz, jak przechowywać dane na:

  • Dysk twardy
  • Google Drive
  • Dropbox

Po drugie, R pozwala użytkownikom eksportować dane do różnych typów plików. Omawiamy podstawowe rozszerzenie pliku:

  • CSV
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATY

Ogólnie rzecz biorąc, eksportowanie danych z R.

Eksportuj na dysk twardy

Na początek możesz zapisać dane bezpośrednio w katalogu roboczym. Poniższy kod drukuje ścieżkę do katalogu roboczego:

directory <-getwd()
directory

Wyjście:

## [1] "/Users/15_Export_to_do"

Domyślnie plik zostanie zapisany w poniższej ścieżce.

Dla Mac OS:

/Users/USERNAME/Downloads/

Dla litu szacuje się Windows:

C:\Users\USERNAME\Documents\

Możesz oczywiście ustawić inną ścieżkę. Możesz na przykład zmienić ścieżkę do folderu pobierania.

Utwórz ramkę danych

Przede wszystkim zaimportujmy zbiór danych mtcars i uzyskajmy średnią z mpg i disp pogrupowanych według biegu.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Wyjście:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Tabela zawiera trzy wiersze i trzy kolumny. Możesz utworzyć plik CSV za pomocą funkcji write.csv w R.

Jak wyeksportować ramkę danych do pliku CSV w R

Podstawowa składnia write.csv w R, aby wyeksportować DataFrame do CSV w R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Przykład:

write.csv(df, "table_car.csv")

Objaśnienie kodu

  • write.csv(df, „table_car.csv”): Utwórz plik CSV na dysku twardym:
    • df: nazwa ramki danych w środowisku
    • „table_car.csv”: nadaj plikowi nazwę table_car i zapisz go jako csv

Note: Możesz użyć funkcji write.csv w R jako write.csv2() do oddzielenia wierszy średnikiem w przypadku eksportu R do danych CSV.

write.csv2(df, "table_car.csv")

Note: Wyłącznie do celów pedagogicznych stworzyliśmy funkcję o nazwie open_folder(), która umożliwia otwarcie folderu katalogu. Wystarczy uruchomić poniższy kod i sprawdzić, gdzie przechowywany jest plik csv. Powinieneś zobaczyć plik o nazwie table_car.csv dla eksportu danych R do CSV.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Jak wyeksportować dane z R do pliku Excel

Teraz nauczymy się eksportować dane z R do Excela:

Eksport danych z R do Excela jest banalny Windows użytkowników i trudniejsze dla użytkownika systemu Mac OS. Obaj użytkownicy będą używać biblioteki xlsx do tworzenia pliku Excel. Niewielka różnica wynika z instalacji biblioteki. Rzeczywiście, używa biblioteki xlsx Java aby utworzyć plik. Java należy zainstalować, jeśli nie ma go na komputerze w celu eksportu danych R do programu Excel.

Windows Użytkownicy

Jeśli jesteś Windows użytkownik, możesz zainstalować bibliotekę bezpośrednio z Condą, aby wyeksportować ramkę danych do programu Excel R:

conda install -c r r-xlsx

Po zainstalowaniu biblioteki możesz użyć funkcji write.xlsx(). W katalogu roboczym zostanie utworzony nowy skoroszyt programu Excel dla eksportu R do danych programu Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Jeśli jesteś użytkownikiem systemu Mac OS, musisz wykonać następujące kroki:

  • Krok 1: Zainstaluj najnowszą wersję Java
  • Krok 2: Zainstaluj bibliotekę rJava
  • Krok 3: Zainstaluj bibliotekę xlsx

Krok 1) Mógłbyś pobrać Java od urzędnika Oracle stronę i zainstaluj ją.

Możesz wrócić do Rstudio i sprawdzić, która wersja Java jest zainstalowana.

system("java -version")

W momencie tutoriala najnowsza wersja Java to 9.0.4.

Krok 2) Musisz zainstalować rjava w R. Zalecamy zainstalowanie R i Rstudio za pomocą Anaconda. Anaconda zarządza zależnościami między bibliotekami. W tym sensie Anaconda poradzi sobie ze złożonościami rJava instalacja.

Przede wszystkim musisz zaktualizować Condę, a następnie zainstalować biblioteka. Możesz skopiować i wkleić kolejne dwie linie kodu w terminalu.

conda - conda update
conda install -c r r-rjava

Następnie otwórz rjava w Rstudio

library(rJava)

Krok 3) Wreszcie nadszedł czas na instalację xlsx. Jeszcze raz możesz skorzystać Conda zrobić to:

conda install -c r r-xlsx

Podobnie jak użytkownicy systemu Windows, możesz zapisać dane za pomocą funkcji write.xlsx()

library(xlsx)

Wyjście:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Eksportowanie danych z R do innego oprogramowania

Eksportowanie danych do różnych programów jest tak proste, jak ich importowanie. Biblioteka „haven” zapewnia wygodny sposób eksportowania danych do

  • sps
  • sas
  • stata

Przede wszystkim zaimportuj bibliotekę. Jeśli nie masz „haven”, możesz przejść tutaj zainstalować.

library(haven)

plik SPSS

Poniżej znajduje się kod umożliwiający eksport danych do oprogramowania SPSS:

write_sav(df, "table_car.sav")

Eksportowanie danych z R do pliku SAS

Tak proste jak spss, możesz eksportować do sas

write_sas(df, "table_car.sas7bdat")

Jak wyeksportować dane z R do pliku STATA

Biblioteka haven pozwala na zapis pliku .dta.

write_dta(df, "table_car.dta")

R

Jeśli chcesz zapisać ramkę danych lub inny obiekt R, możesz użyć funkcji save().

save(df, file ='table_car.RData')

Możesz sprawdzić pliki utworzone powyżej w bieżącym katalogu roboczym

Eksportuj dane z R do pliku STATA

Interakcja z usługami w chmurze

Ostatni, ale nie najmniej, R jest wyposażony w fantastyczne biblioteki umożliwiające interakcję z usługami przetwarzania w chmurze. Ostatnia część tego samouczka dotyczy eksportu/importu plików z:

  • Google Drive
  • Dropbox

Note: W tej części samouczka założono, że masz konto w Google i Dropbox. Jeśli nie, możesz szybko utworzyć taki dla – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Aby uzyskać dostęp do funkcji umożliwiającej interakcję z usługą GoogleDrive, należy zainstalować bibliotekę GoogleDrive. Google Drive.

Biblioteka nie jest jeszcze dostępna w Anacondzie. Możesz go zainstalować za pomocą poniższego kodu w konsoli.

install.packages("googledrive")

i otwierasz bibliotekę.

library(googledrive)

Dla użytkowników innych niż Conda instalacja biblioteki jest łatwa, możesz użyć funkcji install.packages('NAZWA PAKIETU) z nazwą pakietu w nawiasie. Nie zapomnij o „”. Zauważ, że R powinien automatycznie zainstalować pakiet w `libPaths(). Warto zobaczyć to w akcji.

Przesłać do Google Drive

Aby przesłać plik na Dysk Google, należy użyć funkcji drive_upload().

Za każdym razem, gdy ponownie uruchomisz Rstudio, zostaniesz poproszony o zezwolenie na dostęp do tidyverse Google Drive.

Podstawowa składnia drive_upload() jest następująca

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Po uruchomieniu kodu musisz potwierdzić kilka pytań

drive_upload%<("table_car.csv", name ="table_car")

Wyjście:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Wpisz 1 w konsoli, aby potwierdzić dostęp

Google Drive

Następnie zostaniesz przekierowany do Google API, aby umożliwić dostęp. Kliknij Zezwalaj.

Google Drive

Po zakończeniu uwierzytelniania możesz zamknąć przeglądarkę.

Google Drive

W konsoli Rstudio możesz zobaczyć podsumowanie wykonanego kroku. Google pomyślnie przesłał plik znajdujący się lokalnie na Dysku. Google przypisał identyfikator każdemu plikowi na dysku.

Google Drive

Możesz zobaczyć ten plik w Google Spreadsheet.

drive_browse("table_car")

Wyjście:

Nastąpi przekierowanie do Google Spreadsheet

Google Drive

Importuj z Google Drive

Prześlij plik z Google Drive z identyfikatorem jest wygodne. Jeśli znasz nazwę pliku, możesz uzyskać jego identyfikator w następujący sposób:

Note: w zależności od połączenia internetowego i rozmiaru dysku może to zająć trochę czasu.

x <-drive_get("table_car")
as_id(x)

Google Drive

Zapisałeś identyfikator w zmiennej x. Funkcja drive_download() umożliwia pobranie pliku z Google Drive.

Podstawowa składnia to:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Wreszcie możesz pobrać plik:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Objaśnienie kodu

  • drive_download(): Funkcja umożliwiająca pobranie pliku Google Drive
  • as_id(x): Użyj identyfikatora, aby przeglądać plik Google Drive
  • overwrite = TRUE: Jeśli plik istnieje, nadpisz go, w przeciwnym razie wykonanie zostanie zatrzymane. Aby lokalnie zobaczyć nazwę pliku, możesz użyć:

Wyjście:

Google Drive

Plik jest przechowywany w katalogu roboczym. Pamiętaj, że aby otworzyć plik w R, musisz dodać rozszerzenie pliku. Pełną nazwę możesz utworzyć za pomocą funkcji paste() (np. table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Wyjście:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Na koniec możesz usunąć plik z Dysku Google.

## remove file
drive_find("table_car") %>%drive_rm()

Wyjście:

Google Drive

To powolny proces. Usunięcie wymaga czasu

Eksportować do Dropbox

R wchodzi w interakcję z Dropbox poprzez bibliotekę rdrop2. Biblioteka nie jest również dostępna w Anacondzie. Można go zainstalować poprzez konsolę

install.packages('rdrop2')
library(rdrop2)

Musisz zapewnić tymczasowy dostęp do Dropbox z Twoimi referencjami. Po zakończeniu identyfikacji R może utworzyć, usunąć przesyłanie i pobieranie do Twojego Dropbox.

Przede wszystkim musisz przyznać dostęp do swojego konta. Poświadczenia są buforowane podczas całej sesji.

drop_auth()

Nastąpi przekierowanie do Dropbox aby potwierdzić uwierzytelnienie.

Eksportować do Dropbox

Otrzymasz stronę z potwierdzeniem. Możesz je zamknąć i wrócić do R

Eksportować do Dropbox

Możesz utworzyć folder za pomocą funkcji drop_create().

  • drop_create('my_first_drop'): Utwórz folder w pierwszej gałęzi Dropbox
  • drop_create('First_branch/my_first_drop'): Utwórz folder w istniejącym folderze First_branch.
drop_create('my_first_drop')

Wyjście:

Eksportować do Dropbox

W kropliBox

Eksportować do Dropbox

Aby przesłać plik .csv do swojego Dropbox, użyj funkcji drop_upload().

Podstawowa składnia:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Wyjście:

Eksportować do Dropbox

W DropieBox

Eksportować do Dropbox

Możesz odczytać plik csv z Dropbox z funkcją drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Wyjście:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Kiedy skończysz korzystać z pliku i chcesz go usunąć. Musisz wpisać ścieżkę pliku w funkcji drop_delete()

drop_delete('my_first_drop/table_car.csv')

Wyjście:

Eksportować do Dropbox

Możliwe jest również usunięcie folderu

drop_delete('my_first_drop')

Wyjście:

Eksportować do Dropbox

Podsumowanie

Wszystkie funkcje możemy podsumować w poniższej tabeli

Biblioteka Cel Funkcjonować
baza Eksportuj plik csv napisz.csv()
xlsx Eksportuj Excela napisz.xlsx()
przystań Eksportuj sps write_sav()
przystań Eksportuj sas write_sas()
przystań Eksportuj statystyki write_dta()
baza Eksport R zapisać()
napęd google Prześlij Google Drive drive_upload()
napęd google Otwórz w Google Drive drive_browse()
napęd google Pobierz identyfikator pliku drive_get(as_id())
napęd google Pobierz z Google Drive pobierz_google()
napęd google Usuń plik z Google Drive dysk_rm()
rdrop2 uwierzytelnianie drop_auth()
rdrop2 Utwórz folder drop_create()
rdrop2 Przesłać do Dropbox drop_upload()
rdrop2 Przeczytaj plik CSV z Dropbox drop_read_csv
rdrop2 Usuń plik z Dropbox drop_delete()