Sådan eksporteres data fra R til CSV, Excel

Sådan eksporteres data fra R

I denne tutorial lærer vi, hvordan du eksporterer data fra R-miljøet til forskellige formater.

For at eksportere data til harddisken skal du bruge filstien og en udvidelse. Først og fremmest er stien det sted, hvor dataene vil blive gemt. I denne vejledning vil du se, hvordan du gemmer data på:

  • Harddisken
  • Google Drive
  • Dropbox

For det andet giver R brugerne mulighed for at eksportere dataene til forskellige typer filer. Vi dækker den væsentlige fils udvidelse:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Samlet set er det ikke svært at eksportere data fra R.

Eksporter til harddisk

Til at begynde med kan du gemme dataene direkte i arbejdsbiblioteket. Følgende kode udskriver stien til din arbejdsmappe:

directory <-getwd()
directory

Output:

## [1] "/Users/15_Export_to_do"

Som standard vil filen blive gemt i nedenstående sti.

Til Mac OS:

/Users/USERNAME/Downloads/

Til Windows:

C:\Users\USERNAME\Documents\

Du kan selvfølgelig vælge en anden vej. For eksempel kan du ændre stien til downloadmappen.

Opret dataramme

Først og fremmest, lad os importere mtcars-datasættet og få gennemsnittet af mpg og disp grupperet efter gear.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Output:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Tabellen indeholder tre rækker og tre kolonner. Du kan oprette en CSV-fil med funktionen write.csv i R.

Sådan eksporteres en dataramme til en CSV-fil i R

Den grundlæggende syntaks for write.csv i R for at eksportere DataFrame til CSV i R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Eksempel:

write.csv(df, "table_car.csv")

Kode Forklaring

  • write.csv(df, “table_car.csv”): Opret en CSV-fil på harddisken:
    • df: navn på datarammen i miljøet
    • "table_car.csv": Navngiv filen table_car og gem den som csv

Bemærk: Du kan bruge funktionen write.csv i R som write.csv2() til at adskille rækkerne med et semikolon for R eksport til csv-data.

write.csv2(df, "table_car.csv")

Bemærk: Kun til pædagogiske formål oprettede vi en funktion kaldet open_folder() for at åbne mappen for dig. Du skal bare køre koden nedenfor og se, hvor csv-filen er gemt. Du bør se en fil med navnet table_car.csv for data R-eksport til csv.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Sådan eksporteres data fra R til Excel-fil

Nu vil vi lære, hvordan du eksporterer data fra R til Excel:

Eksport af data fra R til Excel er trivielt for Windows brugere og vanskeligere for Mac OS-brugere. Begge brugere vil bruge biblioteket xlsx til at oprette en Excel-fil. Den lille forskel kommer fra installationen af ​​biblioteket. Faktisk bruger biblioteket xlsx Java for at oprette filen. Java skal installeres, hvis den ikke er til stede i din maskine for at eksportere Data R til Excel.

Windows brugere

Hvis du er en Windows bruger, kan du installere biblioteket direkte med conda for at eksportere dataramme til excel R:

conda install -c r r-xlsx

Når biblioteket er installeret, kan du bruge funktionen write.xlsx(). En ny Excel-projektmappe oprettes i arbejdsmappen til R-eksport til Excel-data

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Hvis du er en Mac OS-bruger, skal du følge disse trin:

  • Trin 1: Installer den nyeste version af Java
  • Trin 2: Installer bibliotek rJava
  • Trin 3: Installer biblioteket xlsx

Trin 1) Du kunne downloade Java fra officielle Oracle websted og installer det.

Du kan gå tilbage til Rstudio og tjekke hvilken version af Java er installeret.

system("java -version")

På tidspunktet for selvstudiet var den seneste version af Java er 9.0.4.

Trin 2) Du skal installere rjava i R. Vi anbefalede dig at installere R og Rstudio med Anaconda. Anaconda styrer afhængighederne mellem biblioteker. I denne forstand vil Anaconda håndtere forviklingerne ved rJava installation.

Først og fremmest skal du opdatere conda og derefter installere bibliotek. Du kan kopiere og indsætte de næste to linjer kode i terminalen.

conda - conda update
conda install -c r r-rjava

Åbn derefter rjava i Rstudio

library(rJava)

Trin 3) Endelig er det tid til at installere xlsx. Endnu en gang kan du bruge Conda at gøre det:

conda install -c r r-xlsx

Ligesom Windows-brugere kan du gemme data med funktionen write.xlsx()

library(xlsx)

Output:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Eksport af data fra R til forskellig software

Eksport af data til forskellig software er lige så simpelt som at importere dem. Biblioteket "haven" giver en bekvem måde at eksportere data til

  • SPSS
  • sas
  • Stata

Først og fremmest skal du importere biblioteket. Hvis du ikke har "havn", kan du gå link. at installere det.

library(haven)

SPSS fil

Nedenfor er koden til at eksportere data til SPSS-software:

write_sav(df, "table_car.sav")

Eksport af data fra R til SAS-fil

Lige så simpelt som spss, du kan eksportere til sas

write_sas(df, "table_car.sas7bdat")

Sådan eksporteres data fra R til STATA-fil

Endelig tillader haven bibliotek at skrive .dta-fil.

write_dta(df, "table_car.dta")

R

Hvis du vil gemme en dataramme eller ethvert andet R-objekt, kan du bruge save()-funktionen.

save(df, file ='table_car.RData')

Du kan kontrollere filerne oprettet ovenfor i den nuværende arbejdsmappe

Eksporter data fra R til STATA-fil

Interagere med Cloud Services

Sidst men ikke mindst, R er udstyret med fantastiske biblioteker til at interagere med cloud computing-tjenesterne. Den sidste del af denne tutorial omhandler eksport/import af filer fra:

  • Google Drive
  • Dropbox

Bemærk: Denne del af selvstudiet forudsætter, at du har en konto hos Google og Dropbox. Hvis ikke, kan du hurtigt oprette en til – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Du skal installere biblioteket googledrive for at få adgang til den funktion, der tillader at interagere med Google Drive.

Biblioteket er endnu ikke tilgængeligt hos Anaconda. Du kan installere det med koden nedenfor i konsollen.

install.packages("googledrive")

og du åbner biblioteket.

library(googledrive)

For ikke-conda-brugere er det nemt at installere et bibliotek, du kan bruge funktionen install.packages('NAME OF PACKAGE) med navnet på pakken inden for parentesen. Glem ikke ' '. Bemærk, at R formodes at installere pakken i `libPaths() automatisk. Det er værd at se det i aktion.

Upload til Google Drive

For at uploade en fil til Google drev skal du bruge funktionen drive_upload().

Hver gang du genstarter Rstudio, vil du blive bedt om at tillade adgang tidyverse til Google Drive.

Den grundlæggende syntaks for drive_upload() er

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Når du har startet koden, skal du bekræfte flere spørgsmål

drive_upload%<("table_car.csv", name ="table_car")

Output:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Du skriver 1 i konsollen for at bekræfte adgangen

Google Drive

Derefter bliver du omdirigeret til Google API for at tillade adgangen. Klik på Tillad.

Google Drive

Når godkendelsen er fuldført, kan du afslutte din browser.

Google Drive

I Rstudios konsol kan du se oversigten over det udførte trin. Google uploadede filen lokalt på Drevet. Google tildelte et id til hver fil i drevet.

Google Drive

Du kan se denne fil i Google Spreadsheet.

drive_browse("table_car")

Output:

Du bliver omdirigeret til Google Spreadsheet

Google Drive

Importer fra Google Drive

Upload en fil fra Google Drive med ID er praktisk. Hvis du kender filnavnet, kan du få dets ID som følger:

Bemærk: Afhængigt af din internetforbindelse og størrelsen på dit Drev, tager det tid.

x <-drive_get("table_car")
as_id(x)

Google Drive

Du har gemt ID'et i variablen x. Funktionen drive_download() gør det muligt at downloade en fil fra Google Drive.

Den grundlæggende syntaks er:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Du kan endelig downloade filen:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Kode Forklaring

  • drive_download(): Funktion til at downloade en fil fra Google Drive
  • as_id(x): Brug ID'et til at gennemse filen Google Drive
  • overskriv = TRUE: Hvis filen eksisterer, overskriv den, ellers standses udførelse For at se navnet på filen lokalt, kan du bruge:

Output:

Google Drive

Filen er gemt i din arbejdsmappe. Husk, at du skal tilføje filendelsen for at åbne den i R. Du kan oprette det fulde navn med funktionen paste() (dvs. table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Output:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Endelig kan du fjerne filen fra dit Google-drev.

## remove file
drive_find("table_car") %>%drive_rm()

Output:

Google Drive

Det er en langsom proces. Det tager tid at slette

Eksporter til Dropbox

R interagerer med Dropbox via rdrop2-biblioteket. Biblioteket er heller ikke tilgængeligt på Anaconda. Du kan installere det via konsollen

install.packages('rdrop2')
library(rdrop2)

Du skal give midlertidig adgang til Dropbox med din legitimation. Efter identifikationen er udført, kan R oprette, fjerne upload og downloade til din Dropbox.

Først og fremmest skal du give adgang til din konto. Legitimationsoplysningerne gemmes i cache under hele sessionen.

drop_auth()

Du bliver omdirigeret til Dropbox for at bekræfte godkendelsen.

Eksporter til Dropbox

Du får en bekræftelsesside. Du kan lukke den og vende tilbage til R

Eksporter til Dropbox

Du kan oprette en mappe med funktionen drop_create().

  • drop_create('my_first_drop'): Opret en mappe i den første gren af Dropbox
  • drop_create('First_branch/my_first_drop'): Opret en mappe i den eksisterende First_branch-mappe.
drop_create('my_first_drop')

Output:

Eksporter til Dropbox

I DropBox

Eksporter til Dropbox

For at uploade .csv-filen til din Dropbox, brug funktionen drop_upload().

Grundlæggende syntaks:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Output:

Eksporter til Dropbox

Hos DropBox

Eksporter til Dropbox

Du kan læse csv-filen fra Dropbox med funktionen drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Output:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Når du er færdig med at bruge filen og vil slette den. Du skal skrive stien til filen i funktionen drop_delete()

drop_delete('my_first_drop/table_car.csv')

Output:

Eksporter til Dropbox

Det er også muligt at slette en mappe

drop_delete('my_first_drop')

Output:

Eksporter til Dropbox

Resumé

Vi kan opsummere alle funktionerne i tabellen nedenfor

Bibliotek Objektiv Funktion
bund Eksporter csv skriv.csv()
xlsx Eksporter excel skriv.xlsx()
tilflugtssted Eksporter spss write_sav()
tilflugtssted Eksport sas skrive_sas()
tilflugtssted Eksporter stat skrive_dta()
bund Eksporter R Gemme()
Google Drev Upload Google Drive drive_upload()
Google Drev Åbn i Google Drive drive_browse()
Google Drev Hent fil-id drive_get(som_id())
Google Drev Download fra Google Drive download_google()
Google Drev Fjern fil fra Google Drive drive_rm()
rdrop2 autentificering drop_auth()
rdrop2 Opret en mappe drop_create()
rdrop2 Upload til Dropbox drop_upload()
rdrop2 Læs csv fra Dropbox drop_read_csv
rdrop2 Slet fil fra Dropbox drop_delete()