Come esportare dati da R a CSV, Excel
Come esportare i dati da R
In questo tutorial impareremo come esportare i dati dall'ambiente R in diversi formati.
Per esportare i dati sul disco rigido, sono necessari il percorso del file e un'estensione. Innanzitutto, il percorso è la posizione in cui verranno archiviati i dati. In questo tutorial vedrai come archiviare i dati su:
- Il disco rigido
- Google Drive
- Dropbox
In secondo luogo, R consente agli utenti di esportare i dati in diversi tipi di file. Copriamo l'estensione del file essenziale:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATO
Nel complesso, non è difficile esportare i dati da R.
Esporta su disco rigido
Per iniziare, puoi salvare i dati direttamente nella directory di lavoro. Il seguente codice stampa il percorso della tua directory di lavoro:
directory <-getwd() directory
Produzione:
## [1] "/Users/15_Export_to_do"
Per impostazione predefinita, il file verrà salvato nel percorso seguente.
Per Mac OS:
/Users/USERNAME/Downloads/
Per Windows:
C:\Users\USERNAME\Documents\
Ovviamente puoi impostare un percorso diverso. Ad esempio, puoi modificare il percorso della cartella di download.
Crea frame di dati
Prima di tutto, importiamo il set di dati mtcars e otteniamo la media di mpg e disp raggruppati per marcia.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
Produzione:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
La tabella contiene tre righe e tre colonne. È possibile creare un file CSV con la funzione write.csv in R.
Come esportare un DataFrame in un file CSV in R
La sintassi di base di write.csv in R per esportare DataFrame in CSV in R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Esempio:
write.csv(df, "table_car.csv")
Spiegazione del codice
- write.csv(df, “table_car.csv”): crea un file CSV nel disco rigido:
- df: nome del frame di dati nell'ambiente
- “table_car.csv”: nomina il file table_car e memorizzalo come csv
Note:: è possibile utilizzare la funzione write.csv in R come write.csv2() per separare le righe con un punto e virgola per l'esportazione di R in dati CSV.
write.csv2(df, "table_car.csv")
Note:: Solo a scopo pedagogico, abbiamo creato una funzione chiamata open_folder() per aprire la cartella della directory per te. Devi solo eseguire il codice seguente e vedere dove è archiviato il file CSV. Dovresti vedere un file con nomi table_car.csv per l'esportazione dei dati R in CSV.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Come esportare dati da R a file Excel
Ora impareremo come esportare i dati da R a Excel:
Esportare i dati da R a Excel è banale Windows utenti e più complicato per gli utenti Mac OS. Entrambi gli utenti utilizzeranno la libreria xlsx per creare un file Excel. La leggera differenza deriva dall'installazione della libreria. In effetti, la libreria xlsx utilizza Java per creare il file. Java deve essere installato se non presente nel computer per l'esportazione di dati R in Excel.
Windows utenti
Se sei unə Windows utente, puoi installare la libreria direttamente con conda per esportare dataframe in Excel R:
conda install -c r r-xlsx
Una volta installata la libreria, è possibile utilizzare la funzione write.xlsx(). Viene creata una nuova cartella di lavoro di Excel nella directory di lavoro per l'esportazione R in dati Excel
library(xlsx) write.xlsx(df, "table_car.xlsx")
Se sei un utente Mac OS, devi seguire questi passaggi:
- Passaggio 1: installa l'ultima versione di Java
- Passaggio 2: installare la libreria rJava
- Passaggio 3: installa la libreria xlsx
Passo 1) Potresti scaricare Java da ufficiale Oracle sito e installarlo.
Puoi tornare a Rstudio e verificare quale versione di Java è installato.
system("java -version")
Al momento del tutorial, l'ultima versione di Java è 9.0.4.
Passo 2) Devi installare rjava in R. Ti consigliamo di installare R e Rstudio con Anaconda. Anaconda gestisce le dipendenze tra le librerie. In questo senso, Anaconda gestirà le complessità di rJava installazione.
Prima di tutto, devi aggiornare conda e quindi installare il file biblioteca. Puoi copiare e incollare le prossime due righe di codice nel terminale.
conda - conda update conda install -c r r-rjava
Successivamente, apri rjava in Rstudio
library(rJava)
Passo 3) Finalmente è il momento di installare xlsx. Ancora una volta, puoi usare contea per farlo:
conda install -c r r-xlsx
Proprio come gli utenti Windows, puoi salvare i dati con la funzione write.xlsx()
library(xlsx)
Produzione:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Esportazione dei dati da R a software diversi
Esportare dati su software diversi è semplice come importarli. La libreria "haven" fornisce un modo comodo per esportare dati su
- SPSS
- sas
- Stata
Per prima cosa, importa la libreria. Se non hai "haven", puoi andare qui per installarlo.
library(haven)
File SPSS
Di seguito è riportato il codice per esportare i dati nel software SPSS:
write_sav(df, "table_car.sav")
Esportazione dei dati da R a file SAS
Semplice come spss, puoi esportare in sas
write_sas(df, "table_car.sas7bdat")
Come esportare i dati da R al file STATA
Infine, la libreria haven consente la scrittura di file .dta.
write_dta(df, "table_car.dta")
R
Se vuoi salvare un data frame o qualsiasi altro oggetto R, puoi usare la funzione save().
save(df, file ='table_car.RData')
Puoi controllare i file creati sopra nella directory di lavoro attuale
Interagisci con i servizi cloud
, Ultimo, ma non meno importante R è dotato di fantastiche librerie per interagire con i servizi di cloud computing. L'ultima parte di questo tutorial riguarda l'esportazione/importazione di file da:
- Google Drive
- Dropbox
Note:: questa parte del tutorial presuppone che tu abbia un account Google e Dropbox. In caso contrario, puoi crearne rapidamente uno per: Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
È necessario installare la libreria googledrive per accedere alla funzione che consente di interagire con Google Drive.
La biblioteca non è ancora disponibile su Anaconda. Puoi installarlo con il codice seguente nella console.
install.packages("googledrive")
e apri la libreria.
library(googledrive)
Per gli utenti non conda, installare una libreria è semplice, è possibile utilizzare la funzione install.packages('NAME OF PACKAGE) con il nome del pacchetto tra parentesi. Non dimenticare il ''. Tieni presente che R dovrebbe installare automaticamente il pacchetto in `libPaths(). Vale la pena vederlo in azione.
Carica su Google Drive
Per caricare un file su Google Drive, è necessario utilizzare la funzione drive_upload().
Ogni volta che riavvii Rstudio, ti verrà richiesto di consentire l'accesso a tidyverse Google Drive.
La sintassi di base di drive_upload() è
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Dopo aver avviato il codice, è necessario confermare diverse domande
drive_upload%<("table_car.csv", name ="table_car")
Produzione:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Digiti 1 nella console per confermare l'accesso
Quindi, verrai reindirizzato all'API di Google per consentire l'accesso. Fare clic su Consenti.
Una volta completata l'autenticazione, puoi chiudere il browser.
Nella console di Rstudio, puoi vedere il riepilogo del passaggio eseguito. Google ha caricato correttamente il file che si trova localmente su Drive. Google ha assegnato un ID a ciascun file nell'unità.
Puoi vedere questo file in Google Spreadsheet.
drive_browse("table_car")
Produzione:
Sarai reindirizzato a Google Spreadsheet
Importare da Google Drive
Carica un file da Google Drive con l'ID è conveniente. Se conosci il nome del file, puoi ottenere il suo ID come segue:
Note:: A seconda della connessione Internet e delle dimensioni dell'unità, l'operazione richiede del tempo.
x <-drive_get("table_car") as_id(x)
Hai memorizzato l'ID nella variabile x. La funzione drive_download() consente di scaricare un file da Google Drive.
La sintassi di base è:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Puoi finalmente scaricare il file:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Spiegazione del codice
- drive_download(): funzione da cui scaricare un file Google Drive
- as_id(x): utilizza l'ID per sfogliare il file Google Drive
- overwrite = TRUE: se il file esiste, lo sovrascrive, altrimenti l'esecuzione viene interrotta. Per vedere il nome del file localmente, puoi usare:
Produzione:
Il file è archiviato nella directory di lavoro. Ricorda, devi aggiungere l'estensione del file per aprirlo in R. Puoi creare il nome completo con la funzione paste() (ad esempio table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
Produzione:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Infine, puoi rimuovere il file dal tuo Google Drive.
## remove file drive_find("table_car") %>%drive_rm()
Produzione:
È un processo lento. Richiede tempo per essere eliminato
Esporta a Dropbox
R interagisce con Dropbox tramite la libreria rdrop2. La biblioteca non è disponibile anche su Anaconda. Puoi installarlo tramite la console
install.packages('rdrop2')
library(rdrop2)
È necessario fornire un accesso temporaneo a Dropbox con le tue credenziali Una volta completata l'identificazione, R può creare, rimuovere il caricamento e scaricarlo sul tuo Dropbox.
Prima di tutto, devi dare accesso al tuo account. Le credenziali vengono memorizzate nella cache durante tutta la sessione.
drop_auth()
Sarai reindirizzato a Dropbox per confermare l'autenticazione.
Riceverai una pagina di conferma. Puoi chiuderlo e tornare a R
Puoi creare una cartella con la funzione drop_create().
- drop_create('my_first_drop'): Crea una cartella nel primo ramo di Dropbox
- drop_create('First_branch/my_first_drop'): crea una cartella all'interno della cartella First_branch esistente.
drop_create('my_first_drop')
Produzione:
In cadutaBox
Per caricare il file .csv nel tuo Dropbox, utilizzare la funzione drop_upload().
Sintassi di base:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Produzione:
Alla cadutaBox
Puoi leggere il file CSV da Dropbox con la funzione drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
Produzione:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Quando hai finito di utilizzare il file e desideri eliminarlo. Devi scrivere il percorso del file nella funzione drop_delete()
drop_delete('my_first_drop/table_car.csv')
Produzione:
È anche possibile eliminare una cartella
drop_delete('my_first_drop')
Produzione:
Sommario
Possiamo riassumere tutte le funzioni nella tabella sottostante
Biblioteca | Obiettivo | Funzione |
---|---|---|
base | Esporta CSV | scrivere.csv() |
xlsx | Esporta Excel | scrivere.xlsx() |
porto | Esporta spss | write_sav() |
porto | Esportazione sas | write_sas() |
porto | Stato di esportazione | write_dta() |
base | Esporta R | Salva() |
Google Drive | Caricare Google Drive | caricamento_unità() |
Google Drive | aprire in Google Drive | guida_sfoglia() |
Google Drive | Recupera l'ID del file | unità_get(as_id()) |
Google Drive | Scarica da Google Drive | download_google() |
Google Drive | Rimuovi file da Google Drive | unità_rm() |
rdrop2 | autenticazione | drop_auth() |
rdrop2 | Crea una cartella | drop_crea() |
rdrop2 | Carica su Dropbox | drop_upload() |
rdrop2 | Leggi CSV da Dropbox | drop_read_csv |
rdrop2 | Elimina file da Dropbox | drop_delete() |