Cum să exportați date din R în CSV, Excel
Cum să exportați date din R
În acest tutorial, vom învăța cum să exportăm date din mediul R în diferite formate.
Pentru a exporta date pe hard disk, aveți nevoie de calea fișierului și de o extensie. În primul rând, calea este locația în care vor fi stocate datele. În acest tutorial, veți vedea cum să stocați date pe:
- Hard disk-ul
- Google Drive
- Dropbox
În al doilea rând, R permite utilizatorilor să exporte datele în diferite tipuri de fișiere. Acoperim extensia fișierului esențial:
- csv
- XLSX
- RDS
- SAS
- SPSS
- STATA
În general, nu este dificil să exportați date din R.
Exportați pe hard disk
Pentru început, puteți salva datele direct în directorul de lucru. Următorul cod imprimă calea directorului de lucru:
directory <-getwd() directory
ieșire:
## [1] "/Users/15_Export_to_do"
În mod implicit, fișierul va fi salvat în calea de mai jos.
Pentru Mac OS:
/Users/USERNAME/Downloads/
Pentru Windows:
C:\Users\USERNAME\Documents\
Puteți, desigur, să setați o cale diferită. De exemplu, puteți schimba calea către folderul de descărcare.
Creați un cadru de date
Mai întâi de toate, să importăm setul de date mtcars și să obținem media mpg și disp grupate în funcție de viteză.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
ieșire:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
Tabelul conține trei rânduri și trei coloane. Puteți crea un fișier CSV cu funcția write.csv în R.
Cum să exportați un cadru de date într-un fișier CSV în R
Sintaxa de bază pentru write.csv în R pentru a exporta DataFrame în CSV în R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Exemplu:
write.csv(df, "table_car.csv")
Explicarea codului
- write.csv(df, „table_car.csv”): creați un fișier CSV pe hard disk:
- df: numele cadrului de date din mediu
- „table_car.csv”: Denumiți fișierul table_car și stocați-l ca csv
notițe: Puteți utiliza funcția write.csv în R ca write.csv2() pentru a separa rândurile cu un punct și virgulă pentru exportul R în date csv.
write.csv2(df, "table_car.csv")
notițe: Numai în scop pedagogic, am creat o funcție numită open_folder() pentru a deschide folderul director pentru dvs. Trebuie doar să rulați codul de mai jos și să vedeți unde este stocat fișierul csv. Ar trebui să vedeți un fișier cu numele table_car.csv pentru exportul de date R în csv.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Cum să exportați date din R în fișierul Excel
Acum, vom învăța cum să exportăm date din R în Excel:
Exportul de date din R în Excel este banal pentru Windows utilizatorii și mai complicat pentru utilizatorii de Mac OS. Ambii utilizatori vor folosi biblioteca xlsx pentru a crea un fișier Excel. Ușoară diferență vine de la instalarea bibliotecii. Într-adevăr, biblioteca xlsx folosește Java pentru a crea fișierul. Java trebuie instalat dacă nu este prezent în mașina dvs. pentru exportul Data R în Excel.
Windows utilizatorii
Dacă sunteți un Windows utilizator, puteți instala biblioteca direct cu conda pentru a exporta dataframe în excel R:
conda install -c r r-xlsx
Odată instalată biblioteca, puteți utiliza funcția write.xlsx(). Un nou registru de lucru Excel este creat în directorul de lucru pentru exportul R în datele Excel
library(xlsx) write.xlsx(df, "table_car.xlsx")
Dacă sunteți utilizator Mac OS, trebuie să urmați acești pași:
- Pasul 1: Instalați cea mai recentă versiune a Java
- Pasul 2: Instalați biblioteca rJava
- Pasul 3: Instalați biblioteca xlsx
Pas 1) Ai putea descărca Java din oficial Oracle site-ul și instalați-l.
Puteți reveni la Rstudio și puteți verifica ce versiune a Java este instalat.
system("java -version")
La momentul tutorialului, cea mai recentă versiune a Java este 9.0.4.
Pas 2) Trebuie să instalați rjava în R. V-am recomandat să instalați R și Rstudio cu Anaconda. Anaconda gestionează dependențele dintre biblioteci. În acest sens, Anaconda se va ocupa de complexitatea rJava instalare.
În primul rând, trebuie să actualizați conda și apoi să instalați bibliotecă. Puteți copia și lipi următoarele două linii de cod în terminal.
conda - conda update conda install -c r r-rjava
Apoi, deschideți rjava în Rstudio
library(rJava)
Pas 3) În sfârșit, este timpul să instalați xlsx. Încă o dată, puteți folosi judetul să o facă:
conda install -c r r-xlsx
La fel ca utilizatorii de Windows, puteți salva date cu funcția write.xlsx()
library(xlsx)
ieșire:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Exportarea datelor de la R la un software diferit
Exportul datelor către diferite programe este la fel de simplu ca importarea acestora. Biblioteca „paradis” oferă o modalitate convenabilă de a exporta date către
- spss
- sas
- Stata
În primul rând, importați biblioteca. Dacă nu ai „paradis”, poți merge aici pentru ao instala.
library(haven)
fișier SPSS
Mai jos este codul pentru a exporta datele în software-ul SPSS:
write_sav(df, "table_car.sav")
Exportarea datelor din R în fișierul SAS
La fel de simplu ca spss, puteți exporta în sas
write_sas(df, "table_car.sas7bdat")
Cum să exportați date din R în fișierul STATA
În cele din urmă, biblioteca Haven permite scrierea fișierului .dta.
write_dta(df, "table_car.dta")
R
Dacă doriți să salvați un cadru de date sau orice alt obiect R, puteți utiliza funcția save().
save(df, file ='table_car.RData')
Puteți verifica fișierele create mai sus în directorul de lucru actual
Interacționați cu serviciile cloud
, Ultimul, dar nu cel din R este echipat cu biblioteci fantastice pentru a interacționa cu serviciile de cloud computing. Ultima parte a acestui tutorial tratează fișierele de export/import din:
- Google Drive
- Dropbox
notițe: Această parte a tutorialului presupune că aveți un cont la Google și Dropbox. Dacă nu, puteți crea rapid unul pentru - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Trebuie să instalați biblioteca googledrive pentru a accesa funcția care vă permite să interacționați cu Google Drive.
Biblioteca nu este încă disponibilă la Anaconda. Îl poți instala cu codul de mai jos în consolă.
install.packages("googledrive")
și deschizi biblioteca.
library(googledrive)
Pentru utilizatorii non-conda, instalarea unei biblioteci este ușoară, puteți folosi funcția install.packages('NAME OF PACKAGE) cu numele pachetului în paranteză. Nu uitați de „ „. Rețineți că, R ar trebui să instaleze automat pachetul în `libPaths(). Merită să-l vezi în acțiune.
Încărcați la Google Drive
Pentru a încărca un fișier pe Google Drive, trebuie să utilizați funcția drive_upload().
De fiecare dată când reporniți Rstudio, vi se va solicita să permiteți accesul tidyverse la Google Drive.
Sintaxa de bază a drive_upload() este
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
După ce lansați codul, trebuie să confirmați mai multe întrebări
drive_upload%<("table_car.csv", name ="table_car")
ieșire:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Tastați 1 în consolă pentru a confirma accesul
Apoi, sunteți redirecționat către Google API pentru a permite accesul. Faceți clic pe Permite.
Odată ce autentificarea este completă, puteți părăsi browserul.
În consola Rstudio, puteți vedea rezumatul pasului făcut. Google a încărcat cu succes fișierul localizat local pe Drive. Google a atribuit un ID fiecărui fișier din unitate.
Puteți vedea acest fișier în Google Spreadsheet.
drive_browse("table_car")
ieșire:
Vei fi redirecționat către Google Spreadsheet
Importat din Google Drive
Încărcați un fișier de la Google Drive cu actul de identitate este convenabil. Dacă cunoașteți numele fișierului, puteți obține ID-ul acestuia după cum urmează:
notițe: În funcție de conexiunea dvs. la internet și de dimensiunea Drive, durează timp.
x <-drive_get("table_car") as_id(x)
Ați stocat ID-ul în variabila x. Funcția drive_download() permite descărcarea unui fișier din Google Drive.
Sintaxa de bază este:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
În sfârșit puteți descărca fișierul:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Explicarea codului
- drive_download(): Funcție pentru a descărca un fișier din Google Drive
- as_id(x): Folosiți ID-ul pentru a căuta fișierul Google Drive
- overwrite = TRUE: Dacă fișierul există, suprascrieți-l, altfel execuția este oprită Pentru a vedea numele fișierului la nivel local, puteți utiliza:
ieșire:
Fișierul este stocat în directorul dvs. de lucru. Amintiți-vă, trebuie să adăugați extensia fișierului pentru a-l deschide în R. Puteți crea numele complet cu funcția paste() (adică table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
ieșire:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
În cele din urmă, puteți elimina fișierul de pe Google Drive.
## remove file drive_find("table_car") %>%drive_rm()
ieșire:
Este un proces lent. Este nevoie de timp pentru a șterge
Export către Dropbox
R interacționează cu Dropbox prin biblioteca rdrop2. Biblioteca nu este disponibilă nici la Anaconda. Îl poți instala prin consolă
install.packages('rdrop2')
library(rdrop2)
Trebuie să oferiți acces temporar la Dropbox cu acreditarea dvs. După ce identificarea este făcută, R poate crea, elimina încărcarea și descărcarea pe dvs Dropbox.
În primul rând, trebuie să acordați acces la contul dvs. Acreditările sunt stocate în cache în timpul întregii sesiuni.
drop_auth()
Vei fi redirecționat către Dropbox pentru a confirma autentificarea.
Veți primi o pagină de confirmare. Puteți să-l închideți și să reveniți la R
Puteți crea un folder cu funcția drop_create().
- drop_create('my_first_drop'): creează un folder în prima ramură a Dropbox
- drop_create('First_branch/my_first_drop'): Creați un folder în folderul existent First_branch.
drop_create('my_first_drop')
ieșire:
În DropBox
Pentru a încărca fișierul .csv în fișierul dvs Dropbox, utilizați funcția drop_upload().
Sintaxa de baza:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
ieșire:
La DropBox
Puteți citi fișierul csv din Dropbox cu funcția drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
ieșire:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Când ați terminat de utilizat fișierul și doriți să-l ștergeți. Trebuie să scrieți calea fișierului în funcția drop_delete()
drop_delete('my_first_drop/table_car.csv')
ieșire:
De asemenea, este posibil să ștergeți un folder
drop_delete('my_first_drop')
ieșire:
Rezumat
Putem rezuma toate funcțiile în tabelul de mai jos
Bibliotecă | Obiectiv | Funcţie |
---|---|---|
de bază | Exportați csv | scrie.csv() |
XLSX | Export Excel | scrie.xlsx() |
refugiu | Export spss | scrie_sav() |
refugiu | Export sas | scrie_sas() |
refugiu | Export statal | scrie_dta() |
de bază | Export R | salva() |
Google Drive | Încărcați Google Drive | drive_upload() |
Google Drive | Deschideți Google Drive | drive_browse() |
Google Drive | Preluați ID-ul fișierului | drive_get(as_id()) |
Google Drive | Descărcați de la Google Drive | download_google() |
Google Drive | Eliminați fișierul din Google Drive | drive_rm() |
drop2 | autentificare | drop_auth() |
drop2 | Creați un folder | drop_create() |
drop2 | Încărcați la Dropbox | drop_upload() |
drop2 | Citiți csv de la Dropbox | drop_read_csv |
drop2 | Ștergeți fișierul din Dropbox | drop_delete() |