Hvordan eksportere data fra R til CSV, Excel

Hvordan eksportere data fra R

I denne opplæringen lærer vi hvordan du eksporterer data fra R-miljøet til forskjellige formater.

For å eksportere data til harddisken trenger du filbanen og en utvidelse. Først av alt er banen stedet der dataene skal lagres. I denne opplæringen vil du se hvordan du lagrer data på:

  • Harddisken
  • Google Drive
  • Dropbox

For det andre lar R brukerne eksportere dataene til forskjellige typer filer. Vi dekker den essensielle filens utvidelse:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Totalt sett er det ikke vanskelig å eksportere data fra R.

Eksporter til harddisk

Til å begynne med kan du lagre dataene direkte i arbeidskatalogen. Følgende kode skriver ut banen til arbeidskatalogen din:

directory <-getwd()
directory

Utgang:

## [1] "/Users/15_Export_to_do"

Som standard vil filen bli lagret i banen nedenfor.

For Mac OS:

/Users/USERNAME/Downloads/

Til Windows:

C:\Users\USERNAME\Documents\

Du kan selvfølgelig angi en annen vei. Du kan for eksempel endre banen til nedlastingsmappen.

Lag en dataramme

Først av alt, la oss importere mtcars-datasettet og få gjennomsnittet av mpg og disp gruppert etter utstyr.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Utgang:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Tabellen inneholder tre rader og tre kolonner. Du kan lage en CSV-fil med funksjonen write.csv i R.

Hvordan eksportere en dataramme til en CSV-fil i R

Den grunnleggende syntaksen for write.csv i R for å eksportere DataFrame til CSV i R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Eksempel:

write.csv(df, "table_car.csv")

Kode Forklaring

  • write.csv(df, “table_car.csv”): Lag en CSV-fil på harddisken:
    • df: navnet på datarammen i miljøet
    • "table_car.csv": Gi filen et navn table_car og lagre den som csv

Merknader: Du kan bruke funksjonen write.csv i R som write.csv2() for å skille radene med semikolon for R eksport til csv-data.

write.csv2(df, "table_car.csv")

Merknader: Kun for pedagogiske formål opprettet vi en funksjon kalt open_folder() for å åpne katalogmappen for deg. Du trenger bare å kjøre koden nedenfor og se hvor csv-filen er lagret. Du bør se et filnavn table_car.csv for data R-eksport til csv.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Hvordan eksportere data fra R til Excel-fil

Nå skal vi lære hvordan du eksporterer data fra R til Excel:

Eksport av data fra R til Excel er trivielt for Windows brukere og vanskeligere for Mac OS-brukere. Begge brukerne vil bruke biblioteket xlsx for å lage en Excel-fil. Den lille forskjellen kommer fra installasjonen av biblioteket. Faktisk bruker biblioteket xlsx Java for å lage filen. Java må installeres hvis den ikke finnes på maskinen din for Data R-eksport til Excel.

Windows Brukere

Hvis du er en Windows bruker, kan du installere biblioteket direkte med conda for å eksportere dataramme til excel R:

conda install -c r r-xlsx

Når biblioteket er installert, kan du bruke funksjonen write.xlsx(). En ny Excel-arbeidsbok opprettes i arbeidskatalogen for R-eksport til Excel-data

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Hvis du er en Mac OS-bruker, må du følge disse trinnene:

  • Trinn 1: Installer den nyeste versjonen av Java
  • Trinn 2: Installer bibliotek rJava
  • Trinn 3: Installer biblioteket xlsx

Trinn 1) Du kan laste ned Java fra offisiell Oracle nettstedet og installer det.

Du kan gå tilbake til Rstudio og sjekke hvilken versjon av Java er installert.

system("java -version")

På tidspunktet for opplæringen, den nyeste versjonen av Java er 9.0.4.

Trinn 2) Du må installere rjava i R. Vi anbefalte deg å installere R og Rstudio med Anaconda. Anaconda administrerer avhengighetene mellom bibliotekene. I denne forstand vil Anaconda håndtere vanskelighetene til rJava installasjon.

Først av alt må du oppdatere conda og deretter installere bibliotek. Du kan kopiere og lime inn de neste to linjene med kode i terminalen.

conda - conda update
conda install -c r r-rjava

Deretter åpner du rjava i Rstudio

library(rJava)

Trinn 3) Endelig er det på tide å installere xlsx. Nok en gang kan du bruke leilighet å gjøre det:

conda install -c r r-xlsx

Akkurat som Windows-brukere kan du lagre data med funksjonen write.xlsx()

library(xlsx)

Utgang:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Eksportere data fra R til annen programvare

Å eksportere data til annen programvare er like enkelt som å importere dem. Biblioteket "havn" gir en praktisk måte å eksportere data til

  • SPSS
  • sas
  • Stata

Først av alt, importer biblioteket. Hvis du ikke har "havn", kan du gå her. å installere den.

library(haven)

SPSS-fil

Nedenfor er koden for å eksportere dataene til SPSS-programvaren:

write_sav(df, "table_car.sav")

Eksportere data fra R til SAS-fil

Like enkelt som spss, du kan eksportere til sas

write_sas(df, "table_car.sas7bdat")

Hvordan eksportere data fra R til STATA-fil

Endelig tillater haven bibliotek å skrive .dta-fil.

write_dta(df, "table_car.dta")

R

Hvis du vil lagre en dataramme eller et annet R-objekt, kan du bruke save()-funksjonen.

save(df, file ='table_car.RData')

Du kan sjekke filene som er opprettet ovenfor i den nåværende arbeidskatalogen

Eksporter data fra R til STATA-fil

Samhandle med skytjenestene

Sist men ikke minst, R er utstyrt med fantastiske biblioteker for å samhandle med cloud computing-tjenestene. Den siste delen av denne opplæringen omhandler eksport/import av filer fra:

  • Google Drive
  • Dropbox

Merknader: Denne delen av opplæringen forutsetter at du har en konto hos Google og Dropbox. Hvis ikke, kan du raskt lage en for – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Du må installere biblioteket googledrive for å få tilgang til funksjonen som lar deg samhandle med Google Drive.

Biblioteket er ennå ikke tilgjengelig på Anaconda. Du kan installere den med koden nedenfor i konsollen.

install.packages("googledrive")

og du åpner biblioteket.

library(googledrive)

For ikke-conda-brukere er det enkelt å installere et bibliotek, du kan bruke funksjonen install.packages('NAME OF PACKAGE) med navnet på pakken innenfor parentes. Ikke glem ' '. Merk at R skal installere pakken i `libPaths() automatisk. Det er verdt å se det i aksjon.

Last opp til Google Drive

For å laste opp en fil til Google Drive, må du bruke funksjonen drive_upload().

Hver gang du starter Rstudio på nytt, vil du bli bedt om å tillate tilgang ryddig til Google Drive.

Den grunnleggende syntaksen til drive_upload() er

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Etter at du har startet koden, må du bekrefte flere spørsmål

drive_upload%<("table_car.csv", name ="table_car")

Utgang:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Du skriver 1 i konsollen for å bekrefte tilgangen

Google Drive

Deretter blir du omdirigert til Google API for å tillate tilgangen. Klikk Tillat.

Google Drive

Når autentiseringen er fullført, kan du avslutte nettleseren.

Google Drive

I Rstudios konsoll kan du se sammendraget av trinnet som er gjort. Google lastet opp filen lokalt på stasjonen. Google tildelte en ID til hver fil i stasjonen.

Google Drive

Du kan se denne filen i Google Spreadsheet.

drive_browse("table_car")

Utgang:

Du blir omdirigert til Google Spreadsheet

Google Drive

Import fra Google Drive

Last opp en fil fra Google Drive med ID er praktisk. Hvis du kjenner filnavnet, kan du få IDen som følger:

Merknader: Avhengig av Internett-tilkoblingen din og størrelsen på Disken din, tar det tid.

x <-drive_get("table_car")
as_id(x)

Google Drive

Du lagret IDen i variabelen x. Funksjonen drive_download() tillater nedlasting av en fil fra Google Drive.

Den grunnleggende syntaksen er:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Du kan endelig laste ned filen:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Kode Forklaring

  • drive_download(): Funksjon for å laste ned en fil fra Google Drive
  • as_id(x): Bruk ID-en for å bla gjennom filen Google Drive
  • overskriv = TRUE: Hvis filen eksisterer, overskriv den, ellers stanses kjøringen For å se navnet på filen lokalt, kan du bruke:

Utgang:

Google Drive

Filen er lagret i arbeidskatalogen din. Husk at du må legge til filtypen for å åpne den i R. Du kan lage hele navnet med funksjonen paste() (dvs. table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Utgang:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Til slutt kan du fjerne filen fra Google-stasjonen.

## remove file
drive_find("table_car") %>%drive_rm()

Utgang:

Google Drive

Det er en langsom prosess. Tar tid å slette

Eksport til Dropbox

R samhandler med Dropbox via rdrop2-biblioteket. Biblioteket er heller ikke tilgjengelig på Anaconda. Du kan installere den via konsollen

install.packages('rdrop2')
library(rdrop2)

Du må gi midlertidig tilgang til Dropbox med legitimasjonen din. Etter at identifiseringen er gjort, kan R opprette, fjerne opplasting og laste ned til din Dropbox.

Først av alt må du gi tilgang til kontoen din. Påloggingsinformasjonen bufres under hele økten.

drop_auth()

Du blir omdirigert til Dropbox for å bekrefte autentiseringen.

Eksport til Dropbox

Du får en bekreftelsesside. Du kan lukke den og gå tilbake til R

Eksport til Dropbox

Du kan opprette en mappe med funksjonen drop_create().

  • drop_create('my_first_drop'): Opprett en mappe i den første grenen av Dropbox
  • drop_create('First_branch/my_first_drop'): Opprett en mappe i den eksisterende First_branch-mappen.
drop_create('my_first_drop')

Utgang:

Eksport til Dropbox

I DropBox

Eksport til Dropbox

For å laste opp .csv-filen til din Dropbox, bruk funksjonen drop_upload().

Grunnleggende syntaks:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Utgang:

Eksport til Dropbox

På DropBox

Eksport til Dropbox

Du kan lese csv-filen fra Dropbox med funksjonen drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Utgang:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Når du er ferdig med å bruke filen og vil slette den. Du må skrive banen til filen i funksjonen drop_delete()

drop_delete('my_first_drop/table_car.csv')

Utgang:

Eksport til Dropbox

Det er også mulig å slette en mappe

drop_delete('my_first_drop')

Utgang:

Eksport til Dropbox

Sammendrag

Vi kan oppsummere alle funksjonene i tabellen nedenfor

Bibliotek Målet Funksjon
basen Eksporter csv skrive.csv()
xlsx Eksporter excel write.xlsx()
haven Eksporter spss skrive_sav()
haven Eksporter sas skrive_sas()
haven Eksporter statistikk skrive_dta()
basen Eksporter R lagre()
Google Disk Last opp Google Drive drive_upload()
Google Disk åpne i Google Drive drive_browse()
Google Disk Hent fil-ID drive_get(som_id())
Google Disk Last ned fra Google Drive download_google()
Google Disk Fjern fil fra Google Drive drive_rm()
rdrop2 autentisering drop_auth()
rdrop2 Lag en mappe drop_create()
rdrop2 Last opp til Dropbox drop_upload()
rdrop2 Les csv fra Dropbox drop_read_csv
rdrop2 Slett fil fra Dropbox drop_delete()