Como exportar dados de R para CSV, Excel
Como exportar dados de R
Neste tutorial, aprenderemos como exportar dados do ambiente R para diferentes formatos.
Para exportar dados para o disco rígido, você precisa do caminho do arquivo e de uma extensão. Em primeiro lugar, o caminho é o local onde os dados serão armazenados. Neste tutorial, você verá como armazenar dados em:
- O disco rígido
- Google Drive
- Dropbox
Em segundo lugar, R permite aos usuários exportar os dados para diferentes tipos de arquivos. Cobrimos a extensão do arquivo essencial:
- csv
- XLSX
- RDS
- SAS
- SPSS
- ESTADO
No geral, não é difícil exportar dados de R.
Exportar para disco rígido
Para começar, você pode salvar os dados diretamente no diretório de trabalho. O código a seguir imprime o caminho do seu diretório de trabalho:
directory <-getwd() directory
Saída:
## [1] "/Users/15_Export_to_do"
Por padrão, o arquivo será salvo no caminho abaixo.
Para Mac OS:
/Users/USERNAME/Downloads/
Para a Windows:
C:\Users\USERNAME\Documents\
Você pode, é claro, definir um caminho diferente. Por exemplo, você pode alterar o caminho para a pasta de download.
Criar quadro de dados
Primeiro de tudo, vamos importar o conjunto de dados mtcars e obter a média de mpg e disp agrupados por marcha.
library(dplyr) df <-mtcars % > % select(mpg, disp, gear) % > % group_by(gear) % > % summarize(mean_mpg = mean(mpg), mean_disp = mean(disp)) df
Saída:
## # A tibble: 3 x 3 ## gear mean_mpg mean_disp ## <dbl> <dbl> lt;dbl> ## 1 3 16.10667 326.3000 ## 2 4 24.53333 123.0167 ## 3 5 21.38000 202.4800
A tabela contém três linhas e três colunas. Você pode criar um arquivo CSV com a função write.csv em R.
Como exportar um DataFrame para um arquivo CSV em R
A sintaxe básica de write.csv em R para exportar o DataFrame para CSV em R:
write.csv(df, path) arguments -df: Dataset to save. Need to be the same name of the data frame in the environment. -path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Exemplo:
write.csv(df, "table_car.csv")
Explicação do código
- write.csv(df, “table_car.csv”): Crie um arquivo CSV no disco rígido:
- df: nome do quadro de dados no ambiente
- “table_car.csv”: Nomeie o arquivo table_car e armazene-o como csv
Note: Você pode usar a função write.csv em R como write.csv2() para separar as linhas com ponto e vírgula para exportação de R para dados csv.
write.csv2(df, "table_car.csv")
Note: Apenas para fins pedagógicos, criamos uma função chamada open_folder() para abrir a pasta do diretório para você. Você só precisa executar o código abaixo e ver onde o arquivo csv está armazenado. Você deverá ver um arquivo com os nomes table_car.csv para exportação de dados R para csv.
# Run this code to create the function open_folder <-function(dir){ if (.Platform['OS.type'] == "windows"){ shell.exec(dir) } else { system(paste(Sys.getenv("R_BROWSER"), dir)) } } # Call the function to open the folder open_folder(directory)
Como exportar dados de R para arquivo Excel
Agora aprenderemos como exportar dados de R para Excel:
Exportar dados de R para Excel é trivial para Windows usuários e mais complicado para usuários do Mac OS. Ambos os usuários usarão a biblioteca xlsx para criar um arquivo Excel. A ligeira diferença vem da instalação da biblioteca. Na verdade, a biblioteca xlsx usa Java para criar o arquivo. Java precisa ser instalado se não estiver presente em sua máquina para exportação de Data R para Excel.
Windows usuários
Se você é um Windows usuário, você pode instalar a biblioteca diretamente com conda para exportar dataframe para excel R:
conda install -c r r-xlsx
Depois que a biblioteca for instalada, você pode usar a função write.xlsx(). Uma nova pasta de trabalho do Excel é criada no diretório de trabalho para exportação do R para dados do Excel
library(xlsx) write.xlsx(df, "table_car.xlsx")
Se você for um usuário do Mac OS, precisará seguir estas etapas:
- Passo 1: Instale a versão mais recente do Java
- Etapa 2: instale a biblioteca rJava
- Etapa 3: instale a biblioteca xlsx
Passo 1) Você poderia baixar Java de oficial Oracle site e instale-o.
Você pode voltar ao Rstudio e verificar qual versão do Java está instalado.
system("java -version")
No momento do tutorial, a versão mais recente do Java é 9.0.4.
Passo 2) Você precisa instalar o rjava em R. Recomendamos que você instale o R e o Rstudio com o Anaconda. O Anaconda gerencia as dependências entre bibliotecas. Nesse sentido, o Anaconda lidará com as complexidades do rJava instalação.
Primeiro de tudo, você precisa atualizar o conda e depois instalar o biblioteca. Você pode copiar e colar as próximas duas linhas de código no terminal.
conda - conda update conda install -c r r-rjava
Em seguida, abra o rjava no Rstudio
library(rJava)
Passo 3) Finalmente, é hora de instalar o xlsx. Mais uma vez, você pode usar município para fazer:
conda install -c r r-xlsx
Assim como os usuários do Windows, você pode salvar dados com a função write.xlsx()
library(xlsx)
Saída:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Exportando dados de R para software diferente
Exportar dados para diferentes softwares é tão simples quanto importá-los. A biblioteca “refúgio” fornece uma maneira conveniente de exportar dados para
- spss
- sas
- stata
Primeiro de tudo, importe a biblioteca. Se você não tem “refúgio”, você pode ir aqui para instalá-lo.
library(haven)
arquivo SPSS
Abaixo está o código para exportar os dados para o software SPSS:
write_sav(df, "table_car.sav")
Exportando dados de R para arquivo SAS
Tão simples quanto spss, você pode exportar para sas
write_sas(df, "table_car.sas7bdat")
Como exportar dados de R para arquivo STATA
Finalmente, a biblioteca Haven permite gravar arquivos .dta.
write_dta(df, "table_car.dta")
R
Se quiser salvar um quadro de dados ou qualquer outro objeto R, você pode usar a função save().
save(df, file ='table_car.RData')
Você pode verificar os arquivos criados acima no diretório de trabalho atual
Interaja com os serviços em nuvem
Por último, mas não menos importante, R está equipado com bibliotecas fantásticas para interagir com os serviços de computação em nuvem. A última parte deste tutorial trata da exportação/importação de arquivos de:
- Google Drive
- Dropbox
Note: Esta parte do tutorial pressupõe que você tenha uma conta no Google e Dropbox. Caso contrário, você pode criar rapidamente um para – Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Você precisa instalar a biblioteca googledrive para acessar a função que permite interagir com Google Drive.
A biblioteca ainda não está disponível no Anaconda. Você pode instalá-lo com o código abaixo no console.
install.packages("googledrive")
e você abre a biblioteca.
library(googledrive)
Para usuários não-conda, instalar uma biblioteca é fácil, você pode usar a função install.packages('NAME OF PACKAGE) com o nome do pacote entre parênteses. Não se esqueça do ''. Observe que R deve instalar o pacote em `libPaths() automaticamente. Vale a pena vê-lo em ação.
Enviar para Google Drive
Para fazer upload de um arquivo para o Google Drive, você precisa usar a função drive_upload().
Cada vez que você reiniciar o Rstudio, você será solicitado a permitir o acesso ao tidyverse para Google Drive.
A sintaxe básica de drive_upload() é
drive_upload(file, path = NULL, name = NULL) arguments: - file: Full name of the file to upload (i.e., including the extension) - path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Depois de lançar o código, você precisa confirmar várias perguntas
drive_upload%<("table_car.csv", name ="table_car")
Saída:
## Local file: ## * table_car.csv ## uploaded into Drive file: ## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk ## with MIME type: ## * text/csv
Você digita 1 no console para confirmar o acesso
Em seguida, você é redirecionado para a API do Google para permitir o acesso. Clique em Permitir.
Assim que a autenticação for concluída, você pode sair do navegador.
No console do Rstudio você pode ver o resumo da etapa realizada. O Google carregou com sucesso o arquivo localizado localmente no Drive. O Google atribuiu um ID a cada arquivo na unidade.
Você pode ver este arquivo em Google Spreadsheet.
drive_browse("table_car")
Saída:
Você será redirecionado para Google Spreadsheet
Importado de Google Drive
Carregar um arquivo de Google Drive com o ID é conveniente. Se você souber o nome do arquivo, poderá obter seu ID da seguinte maneira:
Note: Dependendo da sua conexão com a internet e do tamanho do seu Drive, isso leva algum tempo.
x <-drive_get("table_car") as_id(x)
Você armazenou o ID na variável x. A função drive_download() permite baixar um arquivo de Google Drive.
A sintaxe básica é:
drive_download(file, path = NULL, overwrite = FALSE) arguments: - file: Name or id of the file to download -path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive -overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Você pode finalmente baixar o arquivo:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Explicação do código
- drive_download(): Função para baixar um arquivo de Google Drive
- as_id(x): Use o ID para navegar no arquivo em Google Drive
- overwrite = TRUE: Se o arquivo existir, sobrescreva-o, caso contrário a execução será interrompida. Para ver o nome do arquivo localmente, você pode usar:
Saída:
O arquivo é armazenado em seu diretório de trabalho. Lembre-se, você precisa adicionar a extensão do arquivo para abri-lo em R. Você pode criar o nome completo com a função paste() (ou seja, table_car.csv)
google_file <-download_google$local_path google_file path <-paste(google_file, ".csv", sep = "") google_table_car <-read.csv(path) google_table_car
Saída:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Finalmente, você pode remover o arquivo do seu Google Drive.
## remove file drive_find("table_car") %>%drive_rm()
Saída:
É um processo lento. Demora para excluir
Exportar para Dropbox
R interage com Dropbox através da biblioteca rdrop2. A biblioteca também não está disponível no Anaconda. Você pode instalá-lo através do console
install.packages('rdrop2')
library(rdrop2)
Você precisa fornecer acesso temporário a Dropbox com sua credencial. Após a identificação ser feita, R pode criar, remover upload e download para o seu Dropbox.
Primeiro de tudo, você precisa dar acesso à sua conta. As credenciais são armazenadas em cache durante toda a sessão.
drop_auth()
Você será redirecionado para Dropbox para confirmar a autenticação.
Você receberá uma página de confirmação. Você pode fechá-lo e voltar para R
Você pode criar uma pasta com a função drop_create().
- drop_create('my_first_drop'): Cria uma pasta na primeira ramificação do Dropbox
- drop_create('First_branch/my_first_drop'): Crie uma pasta dentro da pasta First_branch existente.
drop_create('my_first_drop')
Saída:
Em quedaBox
Para carregar o arquivo .csv em seu Dropbox, use a função drop_upload().
Sintaxe básica:
drop_upload(file, path = NULL, mode = "overwrite") arguments: - file: local path - path: Path on Dropbox - mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Saída:
Na quedaBox
Você pode ler o arquivo csv em Dropbox com a função drop_read_csv()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv") dropbox_table_car
Saída:
## X gear mean_mpg mean_disp ## 1 1 3 16.10667 326.3000 ## 2 2 4 24.53333 123.0167 ## 3 3 5 21.38000 202.4800
Quando você terminar de usar o arquivo e quiser excluí-lo. Você precisa escrever o caminho do arquivo na função drop_delete()
drop_delete('my_first_drop/table_car.csv')
Saída:
Também é possível excluir uma pasta
drop_delete('my_first_drop')
Saída:
Resumo
Podemos resumir todas as funções na tabela abaixo
Biblioteca | Objetivo | função |
---|---|---|
base | Exportar csv | escrever.csv() |
XLSX | Exportar Excel | escrever.xlsx() |
refúgio | Exportar spss | escrever_sav() |
refúgio | Exportar sas | escrever_sas() |
refúgio | Exportar estatísticas | escrever_dta() |
base | Exportar R | Salve () |
Google Drive | Escolher arquivo Google Drive | drive_upload() |
Google Drive | abrir em Google Drive | drive_browse() |
Google Drive | Recuperar ID do arquivo | drive_get(as_id()) |
Google Drive | Baixe de Google Drive | baixar_google() |
Google Drive | Remover arquivo de Google Drive | unidade_rm() |
rdrop2 | autenticação | drop_auth() |
rdrop2 | Crie uma pasta | drop_create() |
rdrop2 | Enviar para Dropbox | drop_upload() |
rdrop2 | Ler csv de Dropbox | drop_read_csv |
rdrop2 | Excluir arquivo de Dropbox | drop_delete() |