Τρόπος εξαγωγής δεδομένων από R σε CSV, Excel

Πώς να εξάγετε δεδομένα από το R

Σε αυτό το σεμινάριο, θα μάθουμε πώς να εξάγουμε δεδομένα από το περιβάλλον R σε διαφορετικές μορφές.

Για να εξαγάγετε δεδομένα στον σκληρό δίσκο, χρειάζεστε τη διαδρομή του αρχείου και μια επέκταση. Πρώτα απ 'όλα, η διαδρομή είναι η τοποθεσία όπου θα αποθηκευτούν τα δεδομένα. Σε αυτό το σεμινάριο, θα δείτε πώς να αποθηκεύετε δεδομένα σχετικά με:

  • Ο σκληρός δίσκος
  • Google Drive
  • Dropbox

Δεύτερον, το R επιτρέπει στους χρήστες να εξάγουν τα δεδομένα σε διαφορετικούς τύπους αρχείων. Καλύπτουμε την επέκταση του βασικού αρχείου:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • ΣΤΑΤΑ

Συνολικά, δεν είναι δύσκολο να εξαχθούν δεδομένα από το R.

Εξαγωγή σε σκληρό δίσκο

Αρχικά, μπορείτε να αποθηκεύσετε τα δεδομένα απευθείας στον κατάλογο εργασίας. Ο παρακάτω κώδικας εκτυπώνει τη διαδρομή του καταλόγου εργασίας σας:

directory <-getwd()
directory

Παραγωγή:

## [1] "/Users/15_Export_to_do"

Από προεπιλογή, το αρχείο θα αποθηκευτεί στην παρακάτω διαδρομή.

Για Mac OS:

/Users/USERNAME/Downloads/

Για Windows:

C:\Users\USERNAME\Documents\

Μπορείτε, φυσικά, να ορίσετε έναν διαφορετικό δρόμο. Για παράδειγμα, μπορείτε να αλλάξετε τη διαδρομή προς το φάκελο λήψης.

Δημιουργία πλαισίου δεδομένων

Πρώτα απ 'όλα, ας εισαγάγουμε το σύνολο δεδομένων mtcars και ας πάρουμε τη μέση τιμή mpg και την κατανομή ομαδοποιημένη ανά εργαλείο.

library(dplyr)
df <-mtcars % > %
    select(mpg, disp, gear) % > %
    group_by(gear) % > %
    summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))
df

Παραγωγή:

## # A tibble: 3 x 3
##	gear mean_mpg mean_disp
##	<dbl>	<dbl>	lt;dbl>
## 1	3 16.10667  326.3000
## 2 	4 24.53333  123.0167
## 3	5 21.38000  202.4800

Ο πίνακας περιέχει τρεις σειρές και τρεις στήλες. Μπορείτε να δημιουργήσετε ένα αρχείο CSV με τη συνάρτηση write.csv στο R.

Πώς να εξαγάγετε ένα DataFrame σε ένα αρχείο CSV στο R

Η βασική σύνταξη του write.csv στο R για την εξαγωγή του DataFrame σε CSV στο R:

write.csv(df, path)
arguments
-df: Dataset to save. Need to be the same name of the data frame in the environment.
-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Παράδειγμα:

write.csv(df, "table_car.csv")

Επεξήγηση κώδικα

  • write.csv(df, “table_car.csv”): Δημιουργήστε ένα αρχείο CSV στον σκληρό δίσκο:
    • df: όνομα του πλαισίου δεδομένων στο περιβάλλον
    • "table_car.csv": Ονομάστε το αρχείο table_car και αποθηκεύστε το ως csv

Σημείωση: Μπορείτε να χρησιμοποιήσετε τη συνάρτηση write.csv στο R ως write.csv2() για να διαχωρίσετε τις σειρές με ένα ερωτηματικό για εξαγωγή R σε δεδομένα csv.

write.csv2(df, "table_car.csv")

Σημείωση: Μόνο για παιδαγωγικούς σκοπούς, δημιουργήσαμε μια συνάρτηση που ονομάζεται open_folder() για να ανοίξει ο φάκελος καταλόγου για εσάς. Απλά πρέπει να εκτελέσετε τον παρακάτω κώδικα και να δείτε πού είναι αποθηκευμένο το αρχείο csv. Θα πρέπει να δείτε ένα αρχείο με ονόματα table_car.csv για εξαγωγή δεδομένων R σε csv.

# Run this code to create the function
open_folder <-function(dir){
	if (.Platform['OS.type'] == "windows"){
	shell.exec(dir)  
	} else {
	system(paste(Sys.getenv("R_BROWSER"), dir))
  }
}
# Call the function to open the folder
open_folder(directory)

Τρόπος εξαγωγής δεδομένων από R σε αρχείο Excel

Τώρα, θα μάθουμε πώς να εξάγουμε δεδομένα από το R στο Excel:

Η εξαγωγή δεδομένων από το R στο Excel είναι ασήμαντη Windows χρήστες και πιο δύσκολα για χρήστες Mac OS. Και οι δύο χρήστες θα χρησιμοποιήσουν τη βιβλιοθήκη xlsx για να δημιουργήσουν ένα αρχείο Excel. Η μικρή διαφορά προέρχεται από την εγκατάσταση της βιβλιοθήκης. Πράγματι, η βιβλιοθήκη xlsx χρησιμοποιεί Java για να δημιουργήσετε το αρχείο. Java πρέπει να εγκατασταθεί εάν δεν υπάρχει στο μηχάνημά σας για εξαγωγή δεδομένων R στο Excel.

Windows Χρήστες

Αν είστε ένας Windows χρήστη, μπορείτε να εγκαταστήσετε τη βιβλιοθήκη απευθείας με το conda για να εξάγετε το πλαίσιο δεδομένων στο Excel R:

conda install -c r r-xlsx

Μόλις εγκατασταθεί η βιβλιοθήκη, μπορείτε να χρησιμοποιήσετε τη συνάρτηση write.xlsx(). Ένα νέο βιβλίο εργασίας του Excel δημιουργείται στον κατάλογο εργασίας για εξαγωγή R σε δεδομένα Excel

library(xlsx)
write.xlsx(df, "table_car.xlsx")

Εάν είστε χρήστης Mac OS, πρέπει να ακολουθήσετε αυτά τα βήματα:

  • Βήμα 1: Εγκαταστήστε την πιο πρόσφατη έκδοση του Java
  • Βήμα 2: Εγκαταστήστε τη βιβλιοθήκη rJava
  • Βήμα 3: Εγκαταστήστε τη βιβλιοθήκη xlsx

Βήμα 1) Θα μπορούσατε να κάνετε λήψη Java από επίσημο Oracle τοποθεσία και εγκαταστήστε το.

Μπορείτε να επιστρέψετε στο Rstudio και να ελέγξετε ποια έκδοση Java έχει εγκατασταθεί.

system("java -version")

Την ώρα του σεμιναρίου, η πιο πρόσφατη έκδοση του Java είναι 9.0.4.

Βήμα 2) Πρέπει να εγκαταστήσετε το rjava στο R. Σας προτείνουμε να εγκαταστήσετε το R και το Rstudio με το Anaconda. Το Anaconda διαχειρίζεται τις εξαρτήσεις μεταξύ των βιβλιοθηκών. Υπό αυτή την έννοια, ο Anaconda θα χειριστεί τις περιπλοκές του rJava εγκατάσταση.

Πρώτα απ 'όλα, πρέπει να ενημερώσετε το conda και στη συνέχεια να εγκαταστήσετε το βιβλιοθήκη. Μπορείτε να αντιγράψετε και να επικολλήσετε τις επόμενες δύο γραμμές κώδικα στο τερματικό.

conda - conda update
conda install -c r r-rjava

Στη συνέχεια, ανοίξτε το rjava στο Rstudio

library(rJava)

Βήμα 3) Τέλος, ήρθε η ώρα να εγκαταστήσετε το xlsx. Για άλλη μια φορά, μπορείτε να χρησιμοποιήσετε Conda να το κάνω:

conda install -c r r-xlsx

Όπως και οι χρήστες των Windows, μπορείτε να αποθηκεύσετε δεδομένα με τη συνάρτηση write.xlsx()

library(xlsx)

Παραγωγή:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Εξαγωγή δεδομένων από το R σε διαφορετικό λογισμικό

Η εξαγωγή δεδομένων σε διαφορετικό λογισμικό είναι τόσο απλή όσο και η εισαγωγή τους. Το "καταφύγιο" της βιβλιοθήκης παρέχει έναν βολικό τρόπο εξαγωγής δεδομένων σε

  • spss
  • sas
  • ήταν

Πρώτα απ 'όλα, εισάγετε τη βιβλιοθήκη. Εάν δεν έχετε «καταφύγιο», μπορείτε να πάτε εδώ για να το εγκαταστήσετε.

library(haven)

Αρχείο SPSS

Ακολουθεί ο κώδικας για την εξαγωγή των δεδομένων σε λογισμικό SPSS:

write_sav(df, "table_car.sav")

Εξαγωγή δεδομένων από το R στο αρχείο SAS

Εξίσου απλό με το spss, μπορείτε να κάνετε εξαγωγή στο sas

write_sas(df, "table_car.sas7bdat")

Τρόπος εξαγωγής δεδομένων από R σε αρχείο STATA

Τέλος, η βιβλιοθήκη haven επιτρέπει τη σύνταξη αρχείου .dta.

write_dta(df, "table_car.dta")

R

Εάν θέλετε να αποθηκεύσετε ένα πλαίσιο δεδομένων ή οποιοδήποτε άλλο αντικείμενο R, μπορείτε να χρησιμοποιήσετε τη συνάρτηση save().

save(df, file ='table_car.RData')

Μπορείτε να ελέγξετε τα αρχεία που δημιουργήθηκαν παραπάνω στον παρόντα κατάλογο εργασίας

Εξαγωγή δεδομένων από το R στο αρχείο STATA

Αλληλεπίδραση με τις Υπηρεσίες Cloud

Τελευταίο αλλά εξίσου σημαντικό, R είναι εξοπλισμένο με φανταστικές βιβλιοθήκες για αλληλεπίδραση με τις υπηρεσίες υπολογιστικού νέφους. Το τελευταίο μέρος αυτού του σεμιναρίου ασχολείται με την εξαγωγή/εισαγωγή αρχείων από:

  • Google Drive
  • Dropbox

Σημείωση: Αυτό το μέρος του σεμιναρίου προϋποθέτει ότι έχετε λογαριασμό στην Google και Dropbox. Εάν όχι, μπορείτε να δημιουργήσετε γρήγορα ένα για - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Πρέπει να εγκαταστήσετε τη βιβλιοθήκη googledrive για να αποκτήσετε πρόσβαση στη λειτουργία που σας επιτρέπει να αλληλεπιδράσετε Google Drive.

Η βιβλιοθήκη δεν είναι ακόμη διαθέσιμη στο Anaconda. Μπορείτε να το εγκαταστήσετε με τον παρακάτω κώδικα στην κονσόλα.

install.packages("googledrive")

και ανοίγεις τη βιβλιοθήκη.

library(googledrive)

Για μη χρήστες της conda, η εγκατάσταση μιας βιβλιοθήκης είναι εύκολη, μπορείτε να χρησιμοποιήσετε τη συνάρτηση install.packages('NAME OF PACKAGE) με το όνομα του πακέτου μέσα στην παρένθεση. Μην ξεχνάτε το "". Σημειώστε ότι, ο R υποτίθεται ότι εγκαθιστά αυτόματα το πακέτο στο `libPaths(). Αξίζει να το δείτε στην πράξη.

Μεταφορτώστε στο Google Drive

Για να ανεβάσετε ένα αρχείο στο Google Drive, πρέπει να χρησιμοποιήσετε τη συνάρτηση drive_upload().

Κάθε φορά που κάνετε επανεκκίνηση του Rstudio, θα σας ζητείται να επιτρέψετε την πρόσβαση στο tidyverse Google Drive.

Η βασική σύνταξη της drive_upload() είναι

drive_upload(file, path = NULL, name = NULL)
arguments:
- file: Full name of the file to upload (i.e., including the extension)
- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.

Αφού εκκινήσετε τον κωδικό, πρέπει να επιβεβαιώσετε πολλές ερωτήσεις

drive_upload%<("table_car.csv", name ="table_car")

Παραγωγή:

## Local file: 
## * table_car.csv 
## uploaded into Drive file: 
## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk 
## with MIME type: 
## * text/csv

Πληκτρολογείτε 1 στην κονσόλα για να επιβεβαιώσετε την πρόσβαση

Google Drive

Στη συνέχεια, ανακατευθυνθείτε στο Google API για να επιτρέψετε την πρόσβαση. Κάντε κλικ στην επιλογή Να επιτρέπεται.

Google Drive

Μόλις ολοκληρωθεί ο έλεγχος ταυτότητας, μπορείτε να κλείσετε το πρόγραμμα περιήγησής σας.

Google Drive

Στην κονσόλα του Rstudio, μπορείτε να δείτε τη σύνοψη του βήματος που έγινε. Η Google ανέβασε με επιτυχία το αρχείο που βρίσκεται τοπικά στο Drive. Η Google εκχώρησε ένα αναγνωριστικό σε κάθε αρχείο στη μονάδα δίσκου.

Google Drive

Μπορείτε να δείτε αυτό το αρχείο στο Google Spreadsheet.

drive_browse("table_car")

Παραγωγή:

Θα γίνει ανακατεύθυνση σε Google Spreadsheet

Google Drive

Εισαγωγή από Google Drive

Ανεβάστε ένα αρχείο από Google Drive με την ταυτότητα είναι βολικό. Εάν γνωρίζετε το όνομα του αρχείου, μπορείτε να λάβετε το αναγνωριστικό του ως εξής:

Σημείωση: Ανάλογα με τη σύνδεσή σας στο Διαδίκτυο και το μέγεθος του Drive σας, χρειάζονται χρόνοι.

x <-drive_get("table_car")
as_id(x)

Google Drive

Αποθηκεύσατε το αναγνωριστικό στη μεταβλητή x. Η συνάρτηση drive_download() επιτρέπει τη λήψη ενός αρχείου από Google Drive.

Η βασική σύνταξη είναι:

drive_download(file, path = NULL, overwrite = FALSE)
arguments:
- file:  Name or id of the file to download
-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive
-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Μπορείτε επιτέλους να κατεβάσετε το αρχείο:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Επεξήγηση κώδικα

  • drive_download(): Λειτουργία από την οποία γίνεται λήψη ενός αρχείου Google Drive
  • as_id(x): Χρησιμοποιήστε το αναγνωριστικό για να περιηγηθείτε στο αρχείο Google Drive
  • overwrite = TRUE: Εάν υπάρχει αρχείο, αντικαταστήστε το, διαφορετικά η εκτέλεση διακόπηκε Για να δείτε το όνομα του αρχείου τοπικά, μπορείτε να χρησιμοποιήσετε:

Παραγωγή:

Google Drive

Το αρχείο αποθηκεύεται στον κατάλογο εργασίας σας. Θυμηθείτε, πρέπει να προσθέσετε την επέκταση του αρχείου για να το ανοίξετε στο R. Μπορείτε να δημιουργήσετε το πλήρες όνομα με τη συνάρτηση paste() (π.χ. table_car.csv)

google_file <-download_google$local_path
google_file
path <-paste(google_file, ".csv", sep = "")
google_table_car <-read.csv(path)
google_table_car

Παραγωγή:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Τέλος, μπορείτε να αφαιρέσετε το αρχείο από τη μονάδα δίσκου Google.

## remove file
drive_find("table_car") %>%drive_rm()

Παραγωγή:

Google Drive

Είναι μια αργή διαδικασία. Χρειάζεται χρόνος για τη διαγραφή

Εξαγωγή στο Dropbox

Το R αλληλεπιδρά με Dropbox μέσω της βιβλιοθήκης rdrop2. Η βιβλιοθήκη δεν είναι επίσης διαθέσιμη στο Anaconda. Μπορείτε να το εγκαταστήσετε μέσω της κονσόλας

install.packages('rdrop2')
library(rdrop2)

Πρέπει να παρέχετε προσωρινή πρόσβαση σε Dropbox με τα διαπιστευτήριά σας. Αφού ολοκληρωθεί η αναγνώριση, ο R μπορεί να δημιουργήσει, να αφαιρέσει τη μεταφόρτωση και να πραγματοποιήσει λήψη στο δικό σας Dropbox.

Πρώτα απ 'όλα, πρέπει να δώσετε πρόσβαση στον λογαριασμό σας. Τα διαπιστευτήρια αποθηκεύονται προσωρινά κατά τη διάρκεια όλης της περιόδου λειτουργίας.

drop_auth()

Θα γίνει ανακατεύθυνση σε Dropbox για να επιβεβαιώσετε τον έλεγχο ταυτότητας.

Εξαγωγή στο Dropbox

Θα λάβετε μια σελίδα επιβεβαίωσης. Μπορείτε να το κλείσετε και να επιστρέψετε στο R

Εξαγωγή στο Dropbox

Μπορείτε να δημιουργήσετε έναν φάκελο με τη συνάρτηση drop_create().

  • drop_create('my_first_drop'): Δημιουργήστε έναν φάκελο στον πρώτο κλάδο του Dropbox
  • drop_create('First_branch/my_first_drop'): Δημιουργήστε έναν φάκελο μέσα στον υπάρχοντα φάκελο First_branch.
drop_create('my_first_drop')

Παραγωγή:

Εξαγωγή στο Dropbox

Στο DropBox

Εξαγωγή στο Dropbox

Για να ανεβάσετε το αρχείο .csv στο δικό σας Dropbox, χρησιμοποιήστε τη συνάρτηση drop_upload().

Βασική σύνταξη:

drop_upload(file, path = NULL, mode = "overwrite")
arguments:
- file: local path
- path: Path on Dropbox 
- mode = "overwrite":  By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Παραγωγή:

Εξαγωγή στο Dropbox

Στο DropBox

Εξαγωγή στο Dropbox

Μπορείτε να διαβάσετε το αρχείο csv από Dropbox με τη συνάρτηση drop_read_csv()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")
dropbox_table_car

Παραγωγή:

##   X gear mean_mpg mean_disp
## 1 1    3 16.10667  326.3000
## 2 2    4 24.53333  123.0167
## 3 3    5 21.38000  202.4800

Όταν ολοκληρώσετε τη χρήση του αρχείου και θέλετε να το διαγράψετε. Πρέπει να γράψετε τη διαδρομή του αρχείου στη συνάρτηση drop_delete()

drop_delete('my_first_drop/table_car.csv')

Παραγωγή:

Εξαγωγή στο Dropbox

Είναι επίσης δυνατή η διαγραφή ενός φακέλου

drop_delete('my_first_drop')

Παραγωγή:

Εξαγωγή στο Dropbox

Περίληψη

Μπορούμε να συνοψίσουμε όλες τις συναρτήσεις στον παρακάτω πίνακα

Βιβλιοθήκη Σκοπός Λειτουργία
βάση Εξαγωγή csv write.csv()
xlsx Εξαγωγή excel write.xlsx()
επίνειο Εξαγωγή spss write_sav()
επίνειο Εξαγωγή sas write_sas()
επίνειο Εξαγωγή στατιστικών write_dta()
βάση Εξαγωγή R σώσει()
googledrive Μεταφόρτωση Google Drive drive_upload()
googledrive Ανοίξτε το Google Drive drive_browse()
googledrive Ανάκτηση αναγνωριστικού αρχείου drive_get(as_id())
googledrive Λήψη από Google Drive download_google()
googledrive Αφαίρεση αρχείου από Google Drive drive_rm()
rdrop2 πιστοποίηση drop_auth()
rdrop2 Δημιουργήστε ένα φάκελο drop_create()
rdrop2 Μεταφορτώστε στο Dropbox drop_upload()
rdrop2 Διαβάστε το csv από Dropbox drop_read_csv
rdrop2 Διαγραφή αρχείου από Dropbox drop_delete()