Cum să exportați date din R în CSV, Excel

Cum să exportați date din R

În acest tutorial, vom învăța cum să exportăm date din mediul R în diferite formate.

Pentru a exporta date pe hard disk, aveți nevoie de calea fișierului și de o extensie. În primul rând, calea este locația în care vor fi stocate datele. În acest tutorial, veți vedea cum să stocați date pe:

  • Hard disk-ul
  • Google Drive
  • Dropbox

În al doilea rând, R permite utilizatorilor să exporte datele în diferite tipuri de fișiere. Acoperim extensia fișierului esențial:

  • csv
  • XLSX
  • RDS
  • SAS
  • SPSS
  • STATA

În general, nu este dificil să exportați date din R.

Exportați pe hard disk

Pentru început, puteți salva datele direct în directorul de lucru. Următorul cod imprimă calea directorului de lucru:

directory <-getwd()
directory

ieșire:

## [1] "/Users/15_Export_to_do"

În mod implicit, fișierul va fi salvat în calea de mai jos.

Pentru Mac OS:

/Users/USERNAME/Downloads/

Pentru Windows:

C:\Users\USERNAME\Documents\

Puteți, desigur, să setați o cale diferită. De exemplu, puteți schimba calea către folderul de descărcare.

Creați un cadru de date

Mai întâi de toate, să importăm setul de date mtcars și să obținem media mpg și disp grupate în funcție de viteză.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

ieșire:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Tabelul conține trei rânduri și trei coloane. Puteți crea un fișier CSV cu funcția write.csv în R.

Cum să exportați un cadru de date într-un fișier CSV în R

Sintaxa de bază pentru write.csv în R pentru a exporta DataFrame în CSV în R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Exemplu:

write.csv(df, "table_car.csv")

Explicarea codului

  • write.csv(df, „table_car.csv”): creați un fișier CSV pe hard disk:
    • df: numele cadrului de date din mediu
    • „table_car.csv”: Denumiți fișierul table_car și stocați-l ca csv

notițe: Puteți utiliza funcția write.csv în R ca write.csv2() pentru a separa rândurile cu un punct și virgulă pentru exportul R în date csv.

write.csv2(df, "table_car.csv")

notițe: Numai în scop pedagogic, am creat o funcție numită open_folder() pentru a deschide folderul director pentru dvs. Trebuie doar să rulați codul de mai jos și să vedeți unde este stocat fișierul csv. Ar trebui să vedeți un fișier cu numele table_car.csv pentru exportul de date R în csv.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Cum să exportați date din R în fișierul Excel

Acum, vom învăța cum să exportăm date din R în Excel:

Exportul de date din R în Excel este banal pentru Windows utilizatorii și mai complicat pentru utilizatorii de Mac OS. Ambii utilizatori vor folosi biblioteca xlsx pentru a crea un fișier Excel. Ușoară diferență vine de la instalarea bibliotecii. Într-adevăr, biblioteca xlsx folosește Java pentru a crea fișierul. Java trebuie instalat dacă nu este prezent în mașina dvs. pentru exportul Data R în Excel.

Windows utilizatorii

Dacă sunteți un Windows utilizator, puteți instala biblioteca direct cu conda pentru a exporta dataframe în excel R:

conda install -c r r-xlsx

Odată instalată biblioteca, puteți utiliza funcția write.xlsx(). Un nou registru de lucru Excel este creat în directorul de lucru pentru exportul R în datele Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Dacă sunteți utilizator Mac OS, trebuie să urmați acești pași:

  • Pasul 1: Instalați cea mai recentă versiune a Java
  • Pasul 2: Instalați biblioteca rJava
  • Pasul 3: Instalați biblioteca xlsx

Pas 1) Ai putea descărca Java din oficial Oracle site-ul și instalați-l.

Puteți reveni la Rstudio și puteți verifica ce versiune a Java este instalat.

system("java -version")

La momentul tutorialului, cea mai recentă versiune a Java este 9.0.4.

Pas 2) Trebuie să instalați rjava în R. V-am recomandat să instalați R și Rstudio cu Anaconda. Anaconda gestionează dependențele dintre biblioteci. În acest sens, Anaconda se va ocupa de complexitatea rJava instalare.

În primul rând, trebuie să actualizați conda și apoi să instalați bibliotecă. Puteți copia și lipi următoarele două linii de cod în terminal.

conda - conda update
conda install -c r r-rjava

Apoi, deschideți rjava în Rstudio

library(rJava)

Pas 3) În sfârșit, este timpul să instalați xlsx. Încă o dată, puteți folosi judetul să o facă:

conda install -c r r-xlsx

La fel ca utilizatorii de Windows, puteți salva date cu funcția write.xlsx()

library(xlsx)

ieșire:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Exportarea datelor de la R la un software diferit

Exportul datelor către diferite programe este la fel de simplu ca importarea acestora. Biblioteca „paradis” oferă o modalitate convenabilă de a exporta date către

  • spss
  • sas
  • Stata

În primul rând, importați biblioteca. Dacă nu ai „paradis”, poți merge aici pentru ao instala.

library(haven)

fișier SPSS

Mai jos este codul pentru a exporta datele în software-ul SPSS:

write_sav(df, "table_car.sav")

Exportarea datelor din R în fișierul SAS

La fel de simplu ca spss, puteți exporta în sas

write_sas(df, "table_car.sas7bdat")

Cum să exportați date din R în fișierul STATA

În cele din urmă, biblioteca Haven permite scrierea fișierului .dta.

write_dta(df, "table_car.dta")

R

Dacă doriți să salvați un cadru de date sau orice alt obiect R, puteți utiliza funcția save().

save(df, file ='table_car.RData')

Puteți verifica fișierele create mai sus în directorul de lucru actual

Exportați datele din R în fișierul STATA

Interacționați cu serviciile cloud

, Ultimul, dar nu cel din R este echipat cu biblioteci fantastice pentru a interacționa cu serviciile de cloud computing. Ultima parte a acestui tutorial tratează fișierele de export/import din:

  • Google Drive
  • Dropbox

notițe: Această parte a tutorialului presupune că aveți un cont la Google și Dropbox. Dacă nu, puteți crea rapid unul pentru - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Trebuie să instalați biblioteca googledrive pentru a accesa funcția care vă permite să interacționați cu Google Drive.

Biblioteca nu este încă disponibilă la Anaconda. Îl poți instala cu codul de mai jos în consolă.

install.packages("googledrive")

și deschizi biblioteca.

library(googledrive)

Pentru utilizatorii non-conda, instalarea unei biblioteci este ușoară, puteți folosi funcția install.packages('NAME OF PACKAGE) cu numele pachetului în paranteză. Nu uitați de „ „. Rețineți că, R ar trebui să instaleze automat pachetul în `libPaths(). Merită să-l vezi în acțiune.

Încărcați la Google Drive

Pentru a încărca un fișier pe Google Drive, trebuie să utilizați funcția drive_upload().

De fiecare dată când reporniți Rstudio, vi se va solicita să permiteți accesul tidyverse la Google Drive.

Sintaxa de bază a drive_upload() este

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

După ce lansați codul, trebuie să confirmați mai multe întrebări

drive_upload%<("table_car.csv", name ="table_car")

ieșire:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Tastați 1 în consolă pentru a confirma accesul

Google Drive

Apoi, sunteți redirecționat către Google API pentru a permite accesul. Faceți clic pe Permite.

Google Drive

Odată ce autentificarea este completă, puteți părăsi browserul.

Google Drive

În consola Rstudio, puteți vedea rezumatul pasului făcut. Google a încărcat cu succes fișierul localizat local pe Drive. Google a atribuit un ID fiecărui fișier din unitate.

Google Drive

Puteți vedea acest fișier în Google Spreadsheet.

drive_browse("table_car")

ieșire:

Vei fi redirecționat către Google Spreadsheet

Google Drive

Importat din Google Drive

Încărcați un fișier de la Google Drive cu actul de identitate este convenabil. Dacă cunoașteți numele fișierului, puteți obține ID-ul acestuia după cum urmează:

notițe: În funcție de conexiunea dvs. la internet și de dimensiunea Drive, durează timp.

x <-drive_get("table_car")
as_id(x)

Google Drive

Ați stocat ID-ul în variabila x. Funcția drive_download() permite descărcarea unui fișier din Google Drive.

Sintaxa de bază este:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

În sfârșit puteți descărca fișierul:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explicarea codului

  • drive_download(): Funcție pentru a descărca un fișier din Google Drive
  • as_id(x): Folosiți ID-ul pentru a căuta fișierul Google Drive
  • overwrite = TRUE: Dacă fișierul există, suprascrieți-l, altfel execuția este oprită Pentru a vedea numele fișierului la nivel local, puteți utiliza:

ieșire:

Google Drive

Fișierul este stocat în directorul dvs. de lucru. Amintiți-vă, trebuie să adăugați extensia fișierului pentru a-l deschide în R. Puteți crea numele complet cu funcția paste() (adică table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

ieșire:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

În cele din urmă, puteți elimina fișierul de pe Google Drive.

## remove file
drive_find("table_car") %>%drive_rm()

ieșire:

Google Drive

Este un proces lent. Este nevoie de timp pentru a șterge

Export către Dropbox

R interacționează cu Dropbox prin biblioteca rdrop2. Biblioteca nu este disponibilă nici la Anaconda. Îl poți instala prin consolă

install.packages('rdrop2')
library(rdrop2)

Trebuie să oferiți acces temporar la Dropbox cu acreditarea dvs. După ce identificarea este făcută, R poate crea, elimina încărcarea și descărcarea pe dvs Dropbox.

În primul rând, trebuie să acordați acces la contul dvs. Acreditările sunt stocate în cache în timpul întregii sesiuni.

drop_auth()

Vei fi redirecționat către Dropbox pentru a confirma autentificarea.

Export către Dropbox

Veți primi o pagină de confirmare. Puteți să-l închideți și să reveniți la R

Export către Dropbox

Puteți crea un folder cu funcția drop_create().

  • drop_create('my_first_drop'): creează un folder în prima ramură a Dropbox
  • drop_create('First_branch/my_first_drop'): Creați un folder în folderul existent First_branch.
drop_create('my_first_drop')

ieșire:

Export către Dropbox

În DropBox

Export către Dropbox

Pentru a încărca fișierul .csv în fișierul dvs Dropbox, utilizați funcția drop_upload().

Sintaxa de baza:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

ieșire:

Export către Dropbox

La DropBox

Export către Dropbox

Puteți citi fișierul csv din Dropbox cu funcția drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

ieșire:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Când ați terminat de utilizat fișierul și doriți să-l ștergeți. Trebuie să scrieți calea fișierului în funcția drop_delete()

drop_delete('my_first_drop/table_car.csv')

ieșire:

Export către Dropbox

De asemenea, este posibil să ștergeți un folder

drop_delete('my_first_drop')

ieșire:

Export către Dropbox

Rezumat

Putem rezuma toate funcțiile în tabelul de mai jos

Bibliotecă Obiectiv Funcţie
de bază Exportați csv scrie.csv()
XLSX Export Excel scrie.xlsx()
refugiu Export spss scrie_sav()
refugiu Export sas scrie_sas()
refugiu Export statal scrie_dta()
de bază Export R salva()
Google Drive Încărcați Google Drive drive_upload()
Google Drive Deschideți Google Drive drive_browse()
Google Drive Preluați ID-ul fișierului drive_get(as_id())
Google Drive Descărcați de la Google Drive download_google()
Google Drive Eliminați fișierul din Google Drive drive_rm()
drop2 autentificare drop_auth()
drop2 Creați un folder drop_create()
drop2 Încărcați la Dropbox drop_upload()
drop2 Citiți csv de la Dropbox drop_read_csv
drop2 Ștergeți fișierul din Dropbox drop_delete()