Tutorial SAS para iniciantes: o que é e exemplo de programação
O que é SAS?
SAS é um conjunto de software estatístico orientado por comando amplamente utilizado para análise e visualização de dados estatísticos. O formulário completo do SAS é um software de análise estatística. Ele permite que você use técnicas e processos qualitativos que ajudam a aumentar a produtividade dos funcionários e os lucros do negócio. O SAS também é usado para análises avançadas, como inteligência de negócios, investigação criminal e análise preditiva. SAS é pronunciado como “SaaS”.
No SAS, os dados são extraídos e categorizados, o que ajuda a identificar e analisar padrões de dados. É um conjunto de software que permite realizar análises avançadas, Business Intelligence, Análise Preditiva e gerenciamento de dados para operar de forma eficaz em condições de negócios competitivas e em constante mudança. Além disso, o SAS é independente de plataforma, o que significa que você pode executar o SAS em qualquer sistema operacional, seja Linux ou Windows.
Comparado com outros Ferramentas de BI, o SAS fornece amplo suporte para transformar e analisar dados de forma programática, além de usar a interface de arrastar e soltar. Isso fornece um controle muito granular sobre a manipulação e análise de dados, que é o seu USP.
Por que precisamos do SAS?
Vamos entender a necessidade do SAS com um exemplo simples:
Considere uma empresa de comércio eletrônico que deseja conhecer os padrões de compra de seus clientes com base em dados históricos. A empresa terá que considerar milhares de registros de vários clientes para obter uma visão generalizada.
A empresa pode não ter todos esses dados necessários para a análise. Por exemplo, se um cliente não comprou uma jaqueta, quais são os fatores que o impediram de comprar a jaqueta? Esses dados ausentes podem criar erros em sua análise. Como podemos nos livrar desses problemas? Como podemos lidar com esse tipo de dados?
Se for feita manualmente, esta tarefa exigirá centenas de analistas e milhares de horas de trabalho. Ao usar a ferramenta analítica SAS, você pode fazer a mesma análise em questão de horas com um único analista. A ferramenta SAS permite eliminar dados desnecessários e otimizar as informações relevantes. Isso permitirá que você preveja um resultado mesmo com dados ausentes. O SAS permite que você tome melhores decisões.
Ferramentas SAS alternativas
R: É um software de código aberto. É fácil aprender R porque está bem documentado. Ele oferece fortes recursos estatísticos.
Python é outra linguagem de script de código aberto popular. Suporta bibliotecas como Numpy, Scipy e MatPlotLib. Você pode realizar qualquer operação estatística ou construir qualquer modelo usando essas bibliotecas.
SAS: É a ferramenta analítica amplamente utilizada no mercado de análise comercial. Com uma infinidade de funções estatísticas e boa GUI.
Neste tutorial de programação SAS, discutiremos sobre Sistemas Analíticos Estatísticos e como eles podem ser usados para resolver nossos problemas.
história SAS
- SAS foi desenvolvido por Jim Goodnight e John Shall em 1970 na NC University
- Inicialmente foi desenvolvido para Pesquisa Agropecuária.
- Later, expandiu-se para uma gama de ferramentas que inclui análise preditiva, gerenciamento de dados, BI, entre outras.
- Hoje, 98 das principais empresas do mundo na Fortune 400 usam a ferramenta analítica de dados SAS para Análise de dados.
A seguir neste tutorial da linguagem SAS, aprenderemos sobre os recursos do SAS.
Recursos SAS
Os principais recursos do SAS são:
- Acesse facilmente arquivos e dados de dados brutos de um banco de dados externo. Leia e escreva quase qualquer formato de dados!
- Gerencie dados usando ferramentas para entrada de dados, edição, recuperação, formatação e conversão
- Analise dados usando técnicas descritivas, estatísticas, multivariadas, previsão, modelagem, programação linear
- A análise avançada ajuda você a fazer mudanças e melhorias nas práticas de negócios.
- Formação de relatórios com gráficos perfeitos
- Operapesquisa de ações e gerenciamento de projetos
- Atualização e modificação de dados
- Linguagem poderosa de manipulação de dados
- Excelentes funções de limpeza de dados
- Interaja com vários sistemas host
A seguir neste tutorial SAS para iniciantes, aprenderemos sobre o conjunto de produtos SAS.
Conjunto de produtos SAS
Existem muitos produtos SAS disponíveis no mercado. A seguir está uma lista dos mais populares.
Nome | Descrições Detalhadas |
---|---|
Base SAS | O software Base SAS oferece agilidade de hardware e integra-se a todos os tipos de ambiente de computação. |
SAS/GRÁFICO | Esta ferramenta ajuda você a representar dados estruturados em gráficos. |
SAS/STAT | Esta ferramenta ajuda você a realizar diferentes tipos de regressão, análise estatística de variância, regressão e análise psicométrica. |
SAS/ETS | É usado para previsões. Ajuda você a realizar a análise de série temporal. |
SAS/IML | A linguagem Matric Interativa é conhecida como IML. Esta ferramenta ajuda você a traduzir fórmulas matemáticas em um programa inovador. |
SAS EBI | Uma ferramenta para aplicações de Business Intelligence |
Gerenciador de grade SAS | É um componente central que oferece facilidade de gerenciamento de dados e uma linguagem de programação para análise de dados |
SAS/OU | Ferramenta para Operapesquisa de ção |
SAS/CQ | Use para controle de qualidade |
Minerador SAS/Enterprise | Mineração de dados |
SAS/PH | Análise de ensaios clínicos |
SAS/AF | Oferece facilidade de aplicação |
Guia Empresarial | É um editor de código e gerenciador de projetos baseado em GUI |
A seguir neste guia de tutoriais SAS, aprenderemos sobre a arquitetura SAS.
SAS Archiarquitetura
A arquitetura SAS é dividida principalmente em três partes:
- Camada do cliente
- Camada intermediária
- Camada posterior
Camada de cliente
A camada do cliente é onde o aplicativo é instalado em uma máquina, onde o usuário está sentado. Consiste nos componentes que são utilizados para visualizar o portal e seu conteúdo. Ele também inclui um navegador da web padrão que é usado para interagir com o portal por meio do protocolo HTTP ou HTTPS padrão. Também ajuda você a tornar o firewall do aplicativo da web SAS amigável.
Camada intermediária
A camada intermediária oferece um ponto de acesso centralizado para informações empresariais. Todo o acesso ao conteúdo é processado por componentes que operam nesta camada. A separação da lógica de negócios com a lógica de exibição ajuda você a aproveitar a lógica da camada intermediária. Além disso, os pontos de acesso centralizados facilitam a aplicação de regras de segurança, a administração do portal e o gerenciamento de alterações de código.
A camada intermediária hospeda as seguintes funções:
Aplicativo da Web do Portal de Entrega de Informações SAS: É a coleção de JSP, Java servlets, JavaBeans e outras classes e recursos. Esses componentes ajudam você a acessar informações armazenadas no diretório corporativo para criar uma interface personalizável para o usuário.
Motor servlet: O mecanismo de servlet também é chamado de contêiner de servlet. É responsável por gerenciar o aplicativo Web SAS Information Delivery Portal. O mecanismo de servlet oferece um ambiente de tempo de execução. Ele fornece simultaneidade, implantação, gerenciamento de ciclo de vida, etc.
Servidor web: O servidor Web oferece serviço para o mecanismo de servlet que pode ser usado para hospedar sites. Isso deve ser acessado através do portal.
Camada posterior
A camada posterior é uma área onde são executados os servidores de dados e computação, que podem conter objetos de negócios. É um servidor de diretório corporativo. O servidor de diretório corporativo mantém metadados sobre o conteúdo localizado em toda a empresa.
Como baixar e instalar o SAS
Download local em sua máquina
Etapa 1) Baixe o SAS do link fornecido
Vá para este link https://www.sas.com/en_in/software/university-edition.html e clique em Obter software grátis.
Etapa 2) Selecione seu OperaSistema de Ting
Selecione o sistema operacional de acordo com o seu sistema.
Etapa 3) Baixe e instale o software de virtualização
SAS requer software de virtualização como VirtualBox a ser instalado antes de poder ser instalado. Aqui estão as etapas detalhadas
Siga as etapas mencionadas na tela para instalar o SAS. Tendo VirtualBox e a instalação local às vezes pode ser complicada. Recomendamos a instalação da AWS-
Instalação AWS
Você pode implantar SAS na AWS. É elegível para nível gratuito.
Passo 1) Acesse https://aws.amazon.com/marketplace/pp/B00WH10IKW. Clique em “Continuar para se inscrever”
Passo 2) Na próxima tela, Aceite os Termos.
Passo 3) A assinatura está pendente leva até 10 minutos para ser aprovada. Você verá a seguinte tela.
Passo 4) Atualize a página e sua assinatura será confirmada. Clique em Continuar para configuração
Passo 5) Mantenha as configurações padrão e clique em Continuar para iniciar.
Passo 6) Revveja a página de configuração. Insira um par de valores-chave. As configurações de descanso devem ser o padrão. Clique em Iniciar
Passo 7) Acesse https://aws.amazon.com/marketplace/library/ e clique em Exibir instâncias.
Passo 8) No pop-up
- Observe o ID da instância. Esta é a sua senha
- Clique em Acessar software
Passo 9) No pop-up que aparece depois de clicar na etapa 8
- Insira as credenciais do usuário. Id: senha sasdemo: id da instância anotado na etapa 8
- Clique em Entrar
Passo 10) Você verá a tela de boas-vindas.
guia de solução de problemas
Se você não conseguir se conectar, vá para https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId e regras de entrada/saída para todos
Como usar o SAS?
Para usar o software SAS de maneira eficaz, você precisa seguir quatro etapas: Acessar dados, Gerenciar dados, Analisar, Apresentar
Dados de acesso:
O SAS permite que você acesse dados em qualquer formato desejado.
Você pode acessar dados armazenados em qualquer lugar, seja em um arquivo em seu sistema ou em dados armazenados em outro sistema de banco de dados. Pode ser um arquivo Oracle, um arquivo de banco de dados SAS, um arquivo de banco de dados Raw ou um arquivo XLS/CSV simples. Isso o ajudará a acessar esses dados com facilidade.
Gerenciar dados:
SAS oferece excelentes recursos de gerenciamento de dados. Você pode subconjunto/dividir dados com base em determinadas condições, criar variáveis, limpar e validar dados. Existem outras ferramentas que permitem realizar a mesma tarefa. No entanto, o SAS ajuda você a realizar esse trabalho com facilidade.
SAS possui bibliotecas e processos bem definidos que facilitam o processo de programação. Além disso, a criação de dados variáveis ou subconjuntos é um processo de apenas uma etapa. Isso evita que você escreva algoritmos complexos com apenas uma linha de código.
Analisar:
Você pode fazer vários tipos de análise usando SAS:
- Ele verifica o cálculo da frequência da média
- Regressão e Previsão
- Árvore de decisão
Todas essas análises podem ser facilmente tratadas pelo SAS. É a melhor ferramenta para previsões precisas.
Presente:
Se você visualizar os dados corretamente, será fácil para o público se identificar com eles. É fundamental que sua ferramenta apresente os dados de forma adequada. É isso que o SAS faz por você. Possui excelentes capacidades de apresentação.
Você pode:
1. Listar relatórios
2. Relatórios resumidos
3. Relatórios gráficos
4. Imprimir relatórios
Exemplo de programa SAS
O Programa SAS consiste em três etapas necessárias:
- Etapa de dados
- Etapa do procedimento
- Etapa de saída
Etapa DADOS
A etapa de dados carrega o conjunto de dados necessário na memória SAS e encontra as variáveis corretas do conjunto de dados. Ele também captura os registros. Podemos usar etapas de dados para:
- Insira dados em conjuntos de dados SAS
- Calcular valores
- Verifique ou corrija os dados
- Produza novos conjuntos de dados
A sintaxe da instrução DATA é:
Sintaxe
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Exemplo:
O exemplo a seguir mostra como definir uma variável, nomeando o conjunto de dados, criando novas variáveis e inserindo os dados. Neste exemplo, você pode ver que a variável string tem um $ no final e os valores numéricos não o têm.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Nota: Para executar a instrução SAS é necessário especificar o comando RUN.
Etapa PROC
Realiza análises ou funções específicas para produzir resultados e relatórios.
Sintaxe
PROC procedure_name options; #The name of the proc. RUN;
Exemplo
O exemplo dado usa o MEIOS procedimento para imprimir os valores médios das variáveis numéricas no conjunto de dados.
PROC MEANS; RUN;
A etapa de SAÍDA
Você pode exibir os dados dos dados com instruções de saída condicionais.
Sintaxe
PROC PRINT DATA = data_set; OPTIONS; RUN;
Todo programa SAS deve seguir todas as etapas mencionadas acima para ler os dados de entrada, analisar os dados e fornecer o resultado da análise. O CORRE instrução no final de cada etapa finaliza a execução dessa etapa.
O Programa SAS completo
Abaixo está o código completo para cada uma das etapas acima.
Saída:
Onde o SAS é usado?
Abaixo estão alguns aplicativos SAS importantes:
Indústria | Uso |
---|---|
Farmacêutica | Análise Estatística, Relatórios |
Telecomunicações | ETL, relatórios, mineração de dados, previsão |
Financeiros: | ETL, relatórios, mineração de dados, pesquisa financeira |
Modelagem preditiva | DBMarketing, gerenciamento baseado em atividades |
Assistência médica | ETL, relatórios, mineração de dados |
SAS vs. R
SAS | R |
---|---|
SAS é um software comercial, portanto requer um investimento financeiro. | R é um software de código aberto. Portanto, qualquer pessoa pode usá-lo. |
SAS é uma ferramenta analítica mais fácil de aprender. Mesmo pessoas com conhecimento limitado de SQL podem aprender rapidamente. | R exige que você escreva códigos complicados e longos. |
SAS é uma escolha altamente preferida por grandes empresas e é bastante avançado tecnicamente e fácil de usar. | R é um software de desenvolvimento rápido; no entanto, você precisa continuar atualizando-o. |
O SAS possui um bom suporte gráfico, mas não oferece nenhuma customização. | O suporte gráfico da ferramenta R é muito pobre. |
Vantagens do SAS
- SAS possui uma sintaxe fácil que pode ser aprendida sem qualquer tipo de conhecimento de programação
- Capacidade de lidar com um grande banco de dados com facilidade
- SAS é uma linguagem muito compreensível que pode ser facilmente depurada
- Sua janela “log” indica claramente o erro que ajuda você a depurar seu código facilmente
- SAS ajuda você a testar e analisar minuciosamente o algoritmo
- O SAS é totalmente seguro, então você não pode extrair sem licença no escritório
- Torna a computação estatística mais fácil para usuários que não programam
- Lida com bancos de dados de grande porte de maneira eficaz.
Desvantagens do SAS
- O custo é alto porque o indivíduo ou a organização não pode usar todos os aplicativos sem uma licença adequada
- O SAS não é de código aberto, portanto, os algoritmos usados no SAS não estão disponíveis para uso comum
- A mineração de texto é um processo muito problemático e difícil no SAS.
Resumo
- Software SAS, que significa software de análise estatística usado para análise de dados
- R e Python são duas ferramentas alternativas de SAS amplamente utilizadas.
- SAS foi desenvolvido por Jim Goodnight e John Shall em 1970 na NC University
- SAS permite que você acesse arquivos e dados de dados brutos em um banco de dados externo de qualquer tipo
- A arquitetura SAS é dividida principalmente em três partes: 1) Camada de cliente 2) Camada intermediária 3) Camada posterior
- Para usar o software SAS você precisa seguir quatro etapas que são: 1)Acessar dados, 2)Gerenciamento 3) Analisar dados, 4) Apresentação
- O programa SAS consiste em três etapas básicas: Etapa de Dados, Etapa Proc e Etapa de Saída
- SAS ferramenta analítica de dados é amplamente utilizado em setores como farmacêutico, telecomunicações, financeiro, modelagem preditiva e saúde
- SAS é um software comercial enquanto R é um software de código aberto
- O maior benefício da ferramenta de programação SAS é que ela possui uma sintaxe fácil que pode ser aprendida sem qualquer tipo de conhecimento de programação.
- Uma das desvantagens do modelo SAS é que ele não é uma ferramenta de código aberto. Portanto, os algoritmos utilizados nos procedimentos SAS não estão disponíveis para uso comum.