Come esportare dati da R a CSV, Excel

Come esportare i dati da R

In questo tutorial impareremo come esportare i dati dall'ambiente R in diversi formati.

Per esportare i dati sul disco rigido, sono necessari il percorso del file e un'estensione. Innanzitutto, il percorso è la posizione in cui verranno archiviati i dati. In questo tutorial vedrai come archiviare i dati su:

  • Il disco rigido
  • Google Drive
  • Dropbox

In secondo luogo, R consente agli utenti di esportare i dati in diversi tipi di file. Copriamo l'estensione del file essenziale:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATO

Nel complesso, non è difficile esportare i dati da R.

Esporta su disco rigido

Per iniziare, puoi salvare i dati direttamente nella directory di lavoro. Il seguente codice stampa il percorso della tua directory di lavoro:

directory <-getwd()
directory

Produzione:

## [1] "/Users/15_Export_to_do"

Per impostazione predefinita, il file verrà salvato nel percorso seguente.

Per Mac OS:

/Users/USERNAME/Downloads/

Per Windows:

C:\Users\USERNAME\Documents\

Ovviamente puoi impostare un percorso diverso. Ad esempio, puoi modificare il percorso della cartella di download.

Crea frame di dati

Prima di tutto, importiamo il set di dati mtcars e otteniamo la media di mpg e disp raggruppati per marcia.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Produzione:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

La tabella contiene tre righe e tre colonne. È possibile creare un file CSV con la funzione write.csv in R.

Come esportare un DataFrame in un file CSV in R

La sintassi di base di write.csv in R per esportare DataFrame in CSV in R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Esempio:

write.csv(df, "table_car.csv")

Spiegazione del codice

  • write.csv(df, “table_car.csv”): crea un file CSV nel disco rigido:
    • df: nome del frame di dati nell'ambiente
    • “table_car.csv”: nomina il file table_car e memorizzalo come csv

Note:: è possibile utilizzare la funzione write.csv in R come write.csv2() per separare le righe con un punto e virgola per l'esportazione di R in dati CSV.

write.csv2(df, "table_car.csv")

Note:: Solo a scopo pedagogico, abbiamo creato una funzione chiamata open_folder() per aprire la cartella della directory per te. Devi solo eseguire il codice seguente e vedere dove è archiviato il file CSV. Dovresti vedere un file con nomi table_car.csv per l'esportazione dei dati R in CSV.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Come esportare dati da R a file Excel

Ora impareremo come esportare i dati da R a Excel:

Esportare i dati da R a Excel è banale Windows utenti e più complicato per gli utenti Mac OS. Entrambi gli utenti utilizzeranno la libreria xlsx per creare un file Excel. La leggera differenza deriva dall'installazione della libreria. In effetti, la libreria xlsx utilizza Java per creare il file. Java deve essere installato se non presente nel computer per l'esportazione di dati R in Excel.

Windows utenti

Se sei unə Windows utente, puoi installare la libreria direttamente con conda per esportare dataframe in Excel R:

conda install -c r r-xlsx

Una volta installata la libreria, è possibile utilizzare la funzione write.xlsx(). Viene creata una nuova cartella di lavoro di Excel nella directory di lavoro per l'esportazione R in dati Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Se sei un utente Mac OS, devi seguire questi passaggi:

  • Passaggio 1: installa l'ultima versione di Java
  • Passaggio 2: installare la libreria rJava
  • Passaggio 3: installa la libreria xlsx

Passo 1) Potresti scaricare Java da ufficiale Oracle sito e installarlo.

Puoi tornare a Rstudio e verificare quale versione di Java è installato.

system("java -version")

Al momento del tutorial, l'ultima versione di Java è 9.0.4.

Passo 2) Devi installare rjava in R. Ti consigliamo di installare R e Rstudio con Anaconda. Anaconda gestisce le dipendenze tra le librerie. In questo senso, Anaconda gestirà le complessità di rJava installazione.

Prima di tutto, devi aggiornare conda e quindi installare il file biblioteca. Puoi copiare e incollare le prossime due righe di codice nel terminale.

conda - conda update
conda install -c r r-rjava

Successivamente, apri rjava in Rstudio

library(rJava)

Passo 3) Finalmente è il momento di installare xlsx. Ancora una volta, puoi usare contea per farlo:

conda install -c r r-xlsx

Proprio come gli utenti Windows, puoi salvare i dati con la funzione write.xlsx()

library(xlsx)

Produzione:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Esportazione dei dati da R a software diversi

Esportare dati su software diversi è semplice come importarli. La libreria "haven" fornisce un modo comodo per esportare dati su

  • SPSS
  • sas
  • Stata

Per prima cosa, importa la libreria. Se non hai "haven", puoi andare qui per installarlo.

library(haven)

File SPSS

Di seguito è riportato il codice per esportare i dati nel software SPSS:

write_sav(df, "table_car.sav")

Esportazione dei dati da R a file SAS

Semplice come spss, puoi esportare in sas

write_sas(df, "table_car.sas7bdat")

Come esportare i dati da R al file STATA

Infine, la libreria haven consente la scrittura di file .dta.

write_dta(df, "table_car.dta")

R

Se vuoi salvare un data frame o qualsiasi altro oggetto R, puoi usare la funzione save().

save(df, file ='table_car.RData')

Puoi controllare i file creati sopra nella directory di lavoro attuale

Esporta dati da R a file STATA

Interagisci con i servizi cloud

, Ultimo, ma non meno importante R è dotato di fantastiche librerie per interagire con i servizi di cloud computing. L'ultima parte di questo tutorial riguarda l'esportazione/importazione di file da:

  • Google Drive
  • Dropbox

Note:: questa parte del tutorial presuppone che tu abbia un account Google e Dropbox. In caso contrario, puoi crearne rapidamente uno per: Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

È necessario installare la libreria googledrive per accedere alla funzione che consente di interagire con Google Drive.

La biblioteca non è ancora disponibile su Anaconda. Puoi installarlo con il codice seguente nella console.

install.packages("googledrive")

e apri la libreria.

library(googledrive)

Per gli utenti non conda, installare una libreria è semplice, è possibile utilizzare la funzione install.packages('NAME OF PACKAGE) con il nome del pacchetto tra parentesi. Non dimenticare il ''. Tieni presente che R dovrebbe installare automaticamente il pacchetto in `libPaths(). Vale la pena vederlo in azione.

Carica su Google Drive

Per caricare un file su Google Drive, è necessario utilizzare la funzione drive_upload().

Ogni volta che riavvii Rstudio, ti verrà richiesto di consentire l'accesso a tidyverse Google Drive.

La sintassi di base di drive_upload() è

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Dopo aver avviato il codice, è necessario confermare diverse domande

drive_upload%<("table_car.csv", name ="table_car")

Produzione:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Digiti 1 nella console per confermare l'accesso

Google Drive

Quindi, verrai reindirizzato all'API di Google per consentire l'accesso. Fare clic su Consenti.

Google Drive

Una volta completata l'autenticazione, puoi chiudere il browser.

Google Drive

Nella console di Rstudio, puoi vedere il riepilogo del passaggio eseguito. Google ha caricato correttamente il file che si trova localmente su Drive. Google ha assegnato un ID a ciascun file nell'unità.

Google Drive

Puoi vedere questo file in Google Spreadsheet.

drive_browse("table_car")

Produzione:

Sarai reindirizzato a Google Spreadsheet

Google Drive

Importare da Google Drive

Carica un file da Google Drive con l'ID è conveniente. Se conosci il nome del file, puoi ottenere il suo ID come segue:

Note:: A seconda della connessione Internet e delle dimensioni dell'unità, l'operazione richiede del tempo.

x <-drive_get("table_car")
as_id(x)

Google Drive

Hai memorizzato l'ID nella variabile x. La funzione drive_download() consente di scaricare un file da Google Drive.

La sintassi di base è:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Puoi finalmente scaricare il file:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Spiegazione del codice

  • drive_download(): funzione da cui scaricare un file Google Drive
  • as_id(x): utilizza l'ID per sfogliare il file Google Drive
  • overwrite = TRUE: se il file esiste, lo sovrascrive, altrimenti l'esecuzione viene interrotta. Per vedere il nome del file localmente, puoi usare:

Produzione:

Google Drive

Il file è archiviato nella directory di lavoro. Ricorda, devi aggiungere l'estensione del file per aprirlo in R. Puoi creare il nome completo con la funzione paste() (ad esempio table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Produzione:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Infine, puoi rimuovere il file dal tuo Google Drive.

## remove file
drive_find("table_car") %>%drive_rm()

Produzione:

Google Drive

È un processo lento. Richiede tempo per essere eliminato

Esporta a Dropbox

R interagisce con Dropbox tramite la libreria rdrop2. La biblioteca non è disponibile anche su Anaconda. Puoi installarlo tramite la console

install.packages('rdrop2')
library(rdrop2)

È necessario fornire un accesso temporaneo a Dropbox con le tue credenziali Una volta completata l'identificazione, R può creare, rimuovere il caricamento e scaricarlo sul tuo Dropbox.

Prima di tutto, devi dare accesso al tuo account. Le credenziali vengono memorizzate nella cache durante tutta la sessione.

drop_auth()

Sarai reindirizzato a Dropbox per confermare l'autenticazione.

Esporta a Dropbox

Riceverai una pagina di conferma. Puoi chiuderlo e tornare a R

Esporta a Dropbox

Puoi creare una cartella con la funzione drop_create().

  • drop_create('my_first_drop'): Crea una cartella nel primo ramo di Dropbox
  • drop_create('First_branch/my_first_drop'): crea una cartella all'interno della cartella First_branch esistente.
drop_create('my_first_drop')

Produzione:

Esporta a Dropbox

In cadutaBox

Esporta a Dropbox

Per caricare il file .csv nel tuo Dropbox, utilizzare la funzione drop_upload().

Sintassi di base:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Produzione:

Esporta a Dropbox

Alla cadutaBox

Esporta a Dropbox

Puoi leggere il file CSV da Dropbox con la funzione drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Produzione:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Quando hai finito di utilizzare il file e desideri eliminarlo. Devi scrivere il percorso del file nella funzione drop_delete()

drop_delete('my_first_drop/table_car.csv')

Produzione:

Esporta a Dropbox

È anche possibile eliminare una cartella

drop_delete('my_first_drop')

Produzione:

Esporta a Dropbox

Sommario

Possiamo riassumere tutte le funzioni nella tabella sottostante

Biblioteca Obiettivo Funzione
base Esporta CSV scrivere.csv()
xlsx Esporta Excel scrivere.xlsx()
porto Esporta spss write_sav()
porto Esportazione sas write_sas()
porto Stato di esportazione write_dta()
base Esporta R Salva()
Google Drive Caricare Google Drive caricamento_unità()
Google Drive aprire in Google Drive guida_sfoglia()
Google Drive Recupera l'ID del file unità_get(as_id())
Google Drive Scarica da Google Drive download_google()
Google Drive Rimuovi file da Google Drive unità_rm()
rdrop2 autenticazione drop_auth()
rdrop2 Crea una cartella drop_crea()
rdrop2 Carica su Dropbox drop_upload()
rdrop2 Leggi CSV da Dropbox drop_read_csv
rdrop2 Elimina file da Dropbox drop_delete()