Jak eksportować dane z R do CSV, Excel
Jak wyeksportować dane z R
W tym samouczku nauczymy się eksportować dane ze środowiska R do różnych formatów.
Aby wyeksportować dane na dysk twardy, potrzebujesz ścieżki pliku i rozszerzenia. Po pierwsze, ścieżka to miejsce, w którym będą przechowywane dane. W tym samouczku zobaczysz, jak przechowywać dane na:
- Dysk twardy
- Google Drive
- Dropbox
Po drugie, R pozwala użytkownikom eksportować dane do różnych typów plików. Omawiamy podstawowe rozszerzenie pliku:
- CSV
- xlsx
- RDS
- SAS
- SPSS
- STATY
Ogólnie rzecz biorąc, eksportowanie danych z R.
Eksportuj na dysk twardy
Na początek możesz zapisać dane bezpośrednio w katalogu roboczym. Poniższy kod drukuje ścieżkę do katalogu roboczego:
directory <-getwd() directory
Wyjście:
## [1] "/Users/15_Export_to_do"
Domyślnie plik zostanie zapisany w poniższej ścieżce.
Dla Mac OS:
/Users/USERNAME/Downloads/
Dla litu szacuje się Windows:
C:\Users\USERNAME\Documents\
Możesz oczywiście ustawić inną ścieżkę. Możesz na przykład zmienić ścieżkę do folderu pobierania.
Utwórz ramkę danych
Przede wszystkim zaimportujmy zbiór danych mtcars i uzyskajmy średnią z mpg i disp pogrupowanych według biegu.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
Wyjście:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
Tabela zawiera trzy wiersze i trzy kolumny. Możesz utworzyć plik CSV za pomocą funkcji write.csv w R.
Jak wyeksportować ramkę danych do pliku CSV w R
Podstawowa składnia write.csv w R, aby wyeksportować DataFrame do CSV w R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Przykład:
write.csv(df, "table_car.csv")
Objaśnienie kodu
- write.csv(df, „table_car.csv”): Utwórz plik CSV na dysku twardym:
- df: nazwa ramki danych w środowisku
- „table_car.csv”: nadaj plikowi nazwę table_car i zapisz go jako csv
Note: Możesz użyć funkcji write.csv w R jako write.csv2() do oddzielenia wierszy średnikiem w przypadku eksportu R do danych CSV.
write.csv2(df, "table_car.csv")
Note: Wyłącznie do celów pedagogicznych stworzyliśmy funkcję o nazwie open_folder(), która umożliwia otwarcie folderu katalogu. Wystarczy uruchomić poniższy kod i sprawdzić, gdzie przechowywany jest plik csv. Powinieneś zobaczyć plik o nazwie table_car.csv dla eksportu danych R do CSV.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Jak wyeksportować dane z R do pliku Excel
Teraz nauczymy się eksportować dane z R do Excela:
Eksport danych z R do Excela jest banalny Windows użytkowników i trudniejsze dla użytkownika systemu Mac OS. Obaj użytkownicy będą używać biblioteki xlsx do tworzenia pliku Excel. Niewielka różnica wynika z instalacji biblioteki. Rzeczywiście, używa biblioteki xlsx Java aby utworzyć plik. Java należy zainstalować, jeśli nie ma go na komputerze w celu eksportu danych R do programu Excel.
Windows Użytkownicy
Jeśli jesteś Windows użytkownik, możesz zainstalować bibliotekę bezpośrednio z Condą, aby wyeksportować ramkę danych do programu Excel R:
conda install -c r r-xlsx
Po zainstalowaniu biblioteki możesz użyć funkcji write.xlsx(). W katalogu roboczym zostanie utworzony nowy skoroszyt programu Excel dla eksportu R do danych programu Excel
library(xlsx) write.xlsx(df, "table_car.xlsx")
Jeśli jesteś użytkownikiem systemu Mac OS, musisz wykonać następujące kroki:
- Krok 1: Zainstaluj najnowszą wersję Java
- Krok 2: Zainstaluj bibliotekę rJava
- Krok 3: Zainstaluj bibliotekę xlsx
Krok 1) Mógłbyś pobrać Java od urzędnika Oracle stronę i zainstaluj ją.
Możesz wrócić do Rstudio i sprawdzić, która wersja Java jest zainstalowana.
system("java -version")
W momencie tutoriala najnowsza wersja Java to 9.0.4.
Krok 2) Musisz zainstalować rjava w R. Zalecamy zainstalowanie R i Rstudio za pomocą Anaconda. Anaconda zarządza zależnościami między bibliotekami. W tym sensie Anaconda poradzi sobie ze złożonościami rJava instalacja.
Przede wszystkim musisz zaktualizować Condę, a następnie zainstalować biblioteka. Możesz skopiować i wkleić kolejne dwie linie kodu w terminalu.
conda - conda update conda install -c r r-rjava
Następnie otwórz rjava w Rstudio
library(rJava)
Krok 3) Wreszcie nadszedł czas na instalację xlsx. Jeszcze raz możesz skorzystać Conda zrobić to:
conda install -c r r-xlsx
Podobnie jak użytkownicy systemu Windows, możesz zapisać dane za pomocą funkcji write.xlsx()
library(xlsx)
Wyjście:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Eksportowanie danych z R do innego oprogramowania
Eksportowanie danych do różnych programów jest tak proste, jak ich importowanie. Biblioteka „haven” zapewnia wygodny sposób eksportowania danych do
- sps
- sas
- stata
Przede wszystkim zaimportuj bibliotekę. Jeśli nie masz „haven”, możesz przejść tutaj zainstalować.
library(haven)
plik SPSS
Poniżej znajduje się kod umożliwiający eksport danych do oprogramowania SPSS:
write_sav(df, "table_car.sav")
Eksportowanie danych z R do pliku SAS
Tak proste jak spss, możesz eksportować do sas
write_sas(df, "table_car.sas7bdat")
Jak wyeksportować dane z R do pliku STATA
Biblioteka haven pozwala na zapis pliku .dta.
write_dta(df, "table_car.dta")
R
Jeśli chcesz zapisać ramkę danych lub inny obiekt R, możesz użyć funkcji save().
save(df, file ='table_car.RData')
Możesz sprawdzić pliki utworzone powyżej w bieżącym katalogu roboczym
Interakcja z usługami w chmurze
Ostatni, ale nie najmniej, R jest wyposażony w fantastyczne biblioteki umożliwiające interakcję z usługami przetwarzania w chmurze. Ostatnia część tego samouczka dotyczy eksportu/importu plików z:
- Google Drive
- Dropbox
Note: W tej części samouczka założono, że masz konto w Google i Dropbox. Jeśli nie, możesz szybko utworzyć taki dla – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Aby uzyskać dostęp do funkcji umożliwiającej interakcję z usługą GoogleDrive, należy zainstalować bibliotekę GoogleDrive. Google Drive.
Biblioteka nie jest jeszcze dostępna w Anacondzie. Możesz go zainstalować za pomocą poniższego kodu w konsoli.
install.packages("googledrive")
i otwierasz bibliotekę.
library(googledrive)
Dla użytkowników innych niż Conda instalacja biblioteki jest łatwa, możesz użyć funkcji install.packages('NAZWA PAKIETU) z nazwą pakietu w nawiasie. Nie zapomnij o „”. Zauważ, że R powinien automatycznie zainstalować pakiet w `libPaths(). Warto zobaczyć to w akcji.
Przesłać do Google Drive
Aby przesłać plik na Dysk Google, należy użyć funkcji drive_upload().
Za każdym razem, gdy ponownie uruchomisz Rstudio, zostaniesz poproszony o zezwolenie na dostęp do tidyverse Google Drive.
Podstawowa składnia drive_upload() jest następująca
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Po uruchomieniu kodu musisz potwierdzić kilka pytań
drive_upload%<("table_car.csv", name ="table_car")
Wyjście:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Wpisz 1 w konsoli, aby potwierdzić dostęp
Następnie zostaniesz przekierowany do Google API, aby umożliwić dostęp. Kliknij Zezwalaj.
Po zakończeniu uwierzytelniania możesz zamknąć przeglądarkę.
W konsoli Rstudio możesz zobaczyć podsumowanie wykonanego kroku. Google pomyślnie przesłał plik znajdujący się lokalnie na Dysku. Google przypisał identyfikator każdemu plikowi na dysku.
Możesz zobaczyć ten plik w Google Spreadsheet.
drive_browse("table_car")
Wyjście:
Nastąpi przekierowanie do Google Spreadsheet
Importuj z Google Drive
Prześlij plik z Google Drive z identyfikatorem jest wygodne. Jeśli znasz nazwę pliku, możesz uzyskać jego identyfikator w następujący sposób:
Note: w zależności od połączenia internetowego i rozmiaru dysku może to zająć trochę czasu.
x <-drive_get("table_car") as_id(x)
Zapisałeś identyfikator w zmiennej x. Funkcja drive_download() umożliwia pobranie pliku z Google Drive.
Podstawowa składnia to:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Wreszcie możesz pobrać plik:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Objaśnienie kodu
- drive_download(): Funkcja umożliwiająca pobranie pliku Google Drive
- as_id(x): Użyj identyfikatora, aby przeglądać plik Google Drive
- overwrite = TRUE: Jeśli plik istnieje, nadpisz go, w przeciwnym razie wykonanie zostanie zatrzymane. Aby lokalnie zobaczyć nazwę pliku, możesz użyć:
Wyjście:
Plik jest przechowywany w katalogu roboczym. Pamiętaj, że aby otworzyć plik w R, musisz dodać rozszerzenie pliku. Pełną nazwę możesz utworzyć za pomocą funkcji paste() (np. table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
Wyjście:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Na koniec możesz usunąć plik z Dysku Google.
## remove file drive_find("table_car") %>%drive_rm()
Wyjście:
To powolny proces. Usunięcie wymaga czasu
Eksportować do Dropbox
R wchodzi w interakcję z Dropbox poprzez bibliotekę rdrop2. Biblioteka nie jest również dostępna w Anacondzie. Można go zainstalować poprzez konsolę
install.packages('rdrop2')
library(rdrop2)
Musisz zapewnić tymczasowy dostęp do Dropbox z Twoimi referencjami. Po zakończeniu identyfikacji R może utworzyć, usunąć przesyłanie i pobieranie do Twojego Dropbox.
Przede wszystkim musisz przyznać dostęp do swojego konta. Poświadczenia są buforowane podczas całej sesji.
drop_auth()
Nastąpi przekierowanie do Dropbox aby potwierdzić uwierzytelnienie.
Otrzymasz stronę z potwierdzeniem. Możesz je zamknąć i wrócić do R
Możesz utworzyć folder za pomocą funkcji drop_create().
- drop_create('my_first_drop'): Utwórz folder w pierwszej gałęzi Dropbox
- drop_create('First_branch/my_first_drop'): Utwórz folder w istniejącym folderze First_branch.
drop_create('my_first_drop')
Wyjście:
W kropliBox
Aby przesłać plik .csv do swojego Dropbox, użyj funkcji drop_upload().
Podstawowa składnia:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Wyjście:
W DropieBox
Możesz odczytać plik csv z Dropbox z funkcją drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
Wyjście:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Kiedy skończysz korzystać z pliku i chcesz go usunąć. Musisz wpisać ścieżkę pliku w funkcji drop_delete()
drop_delete('my_first_drop/table_car.csv')
Wyjście:
Możliwe jest również usunięcie folderu
drop_delete('my_first_drop')
Wyjście:
Podsumowanie
Wszystkie funkcje możemy podsumować w poniższej tabeli
Biblioteka | Cel | Funkcjonować |
---|---|---|
baza | Eksportuj plik csv | napisz.csv() |
xlsx | Eksportuj Excela | napisz.xlsx() |
przystań | Eksportuj sps | write_sav() |
przystań | Eksportuj sas | write_sas() |
przystań | Eksportuj statystyki | write_dta() |
baza | Eksport R | zapisać() |
napęd google | Prześlij Google Drive | drive_upload() |
napęd google | Otwórz w Google Drive | drive_browse() |
napęd google | Pobierz identyfikator pliku | drive_get(as_id()) |
napęd google | Pobierz z Google Drive | pobierz_google() |
napęd google | Usuń plik z Google Drive | dysk_rm() |
rdrop2 | uwierzytelnianie | drop_auth() |
rdrop2 | Utwórz folder | drop_create() |
rdrop2 | Przesłać do Dropbox | drop_upload() |
rdrop2 | Przeczytaj plik CSV z Dropbox | drop_read_csv |
rdrop2 | Usuń plik z Dropbox | drop_delete() |