Tutorial SAS para iniciantes: o que é e exemplo de programação

O que é SAS?

SAS é um conjunto de software estatístico orientado por comando amplamente utilizado para análise e visualização de dados estatísticos. O formulário completo do SAS é um software de análise estatística. Ele permite que você use técnicas e processos qualitativos que ajudam a aumentar a produtividade dos funcionários e os lucros do negócio. O SAS também é usado para análises avançadas, como inteligência de negócios, investigação criminal e análise preditiva. SAS é pronunciado como “SaaS”.

No SAS, os dados são extraídos e categorizados, o que ajuda a identificar e analisar padrões de dados. É um conjunto de software que permite realizar análises avançadas, Business Intelligence, Análise Preditiva e gerenciamento de dados para operar de forma eficaz em condições de negócios competitivas e em constante mudança. Além disso, o SAS é independente de plataforma, o que significa que você pode executar o SAS em qualquer sistema operacional, seja Linux ou Windows.

Comparado com outros Ferramentas de BI, o SAS fornece amplo suporte para transformar e analisar dados de forma programática, além de usar a interface de arrastar e soltar. Isso fornece um controle muito granular sobre a manipulação e análise de dados, que é o seu USP.

Por que precisamos do SAS?

Vamos entender a necessidade do SAS com um exemplo simples:

Considere uma empresa de comércio eletrônico que deseja conhecer os padrões de compra de seus clientes com base em dados históricos. A empresa terá que considerar milhares de registros de vários clientes para obter uma visão generalizada.

A empresa pode não ter todos esses dados necessários para a análise. Por exemplo, se um cliente não comprou uma jaqueta, quais são os fatores que o impediram de comprar a jaqueta? Esses dados ausentes podem criar erros em sua análise. Como podemos nos livrar desses problemas? Como podemos lidar com esse tipo de dados?

Se for feita manualmente, esta tarefa exigirá centenas de analistas e milhares de horas de trabalho. Ao usar a ferramenta analítica SAS, você pode fazer a mesma análise em questão de horas com um único analista. A ferramenta SAS permite eliminar dados desnecessários e otimizar as informações relevantes. Isso permitirá que você preveja um resultado mesmo com dados ausentes. O SAS permite que você tome melhores decisões.

Ferramentas SAS alternativas

Ferramentas SAS alternativas

R: É um software de código aberto. É fácil aprender R porque está bem documentado. Ele oferece fortes recursos estatísticos.

Python é outra linguagem de script de código aberto popular. Suporta bibliotecas como Numpy, Scipy e MatPlotLib. Você pode realizar qualquer operação estatística ou construir qualquer modelo usando essas bibliotecas.

SAS: É a ferramenta analítica amplamente utilizada no mercado de análise comercial. Com uma infinidade de funções estatísticas e boa GUI.

Neste tutorial de programação SAS, discutiremos sobre Sistemas Analíticos Estatísticos e como eles podem ser usados ​​para resolver nossos problemas.

história SAS

  • SAS foi desenvolvido por Jim Goodnight e John Shall em 1970 na NC University
  • Inicialmente foi desenvolvido para Pesquisa Agropecuária.
  • Later, expandiu-se para uma gama de ferramentas que inclui análise preditiva, gerenciamento de dados, BI, entre outras.
  • Hoje, 98 das principais empresas do mundo na Fortune 400 usam a ferramenta analítica de dados SAS para Análise de dados.

A seguir neste tutorial da linguagem SAS, aprenderemos sobre os recursos do SAS.

Recursos SAS

Os principais recursos do SAS são:

  • Acesse facilmente arquivos e dados de dados brutos de um banco de dados externo. Leia e escreva quase qualquer formato de dados!
  • Gerencie dados usando ferramentas para entrada de dados, edição, recuperação, formatação e conversão
  • Analise dados usando técnicas descritivas, estatísticas, multivariadas, previsão, modelagem, programação linear
  • A análise avançada ajuda você a fazer mudanças e melhorias nas práticas de negócios.
  • Formação de relatórios com gráficos perfeitos
  • Operapesquisa de ações e gerenciamento de projetos
  • Atualização e modificação de dados
  • Linguagem poderosa de manipulação de dados
  • Excelentes funções de limpeza de dados
  • Interaja com vários sistemas host

A seguir neste tutorial SAS para iniciantes, aprenderemos sobre o conjunto de produtos SAS.

Conjunto de produtos SAS

Existem muitos produtos SAS disponíveis no mercado. A seguir está uma lista dos mais populares.

Nome Descrições Detalhadas
Base SAS O software Base SAS oferece agilidade de hardware e integra-se a todos os tipos de ambiente de computação.
SAS/GRÁFICO Esta ferramenta ajuda você a representar dados estruturados em gráficos.
SAS/STAT Esta ferramenta ajuda você a realizar diferentes tipos de regressão, análise estatística de variância, regressão e análise psicométrica.
SAS/ETS É usado para previsões. Ajuda você a realizar a análise de série temporal.
SAS/IML A linguagem Matric Interativa é conhecida como IML. Esta ferramenta ajuda você a traduzir fórmulas matemáticas em um programa inovador.
SAS EBI Uma ferramenta para aplicações de Business Intelligence
Gerenciador de grade SAS É um componente central que oferece facilidade de gerenciamento de dados e uma linguagem de programação para análise de dados
SAS/OU Ferramenta para Operapesquisa de ção
SAS/CQ Use para controle de qualidade
Minerador SAS/Enterprise Mineração de dados
SAS/PH Análise de ensaios clínicos
SAS/AF Oferece facilidade de aplicação
Guia Empresarial É um editor de código e gerenciador de projetos baseado em GUI

A seguir neste guia de tutoriais SAS, aprenderemos sobre a arquitetura SAS.

SAS Archiarquitetura

SAS Archiarquitetura
Archiarquitetura do SAS

A arquitetura SAS é dividida principalmente em três partes:

  • Camada do cliente
  • Camada intermediária
  • Camada posterior

Camada de cliente

A camada do cliente é onde o aplicativo é instalado em uma máquina, onde o usuário está sentado. Consiste nos componentes que são utilizados para visualizar o portal e seu conteúdo. Ele também inclui um navegador da web padrão que é usado para interagir com o portal por meio do protocolo HTTP ou HTTPS padrão. Também ajuda você a tornar o firewall do aplicativo da web SAS amigável.

Camada intermediária

A camada intermediária oferece um ponto de acesso centralizado para informações empresariais. Todo o acesso ao conteúdo é processado por componentes que operam nesta camada. A separação da lógica de negócios com a lógica de exibição ajuda você a aproveitar a lógica da camada intermediária. Além disso, os pontos de acesso centralizados facilitam a aplicação de regras de segurança, a administração do portal e o gerenciamento de alterações de código.

A camada intermediária hospeda as seguintes funções:

Aplicativo da Web do Portal de Entrega de Informações SAS: É a coleção de JSP, Java servlets, JavaBeans e outras classes e recursos. Esses componentes ajudam você a acessar informações armazenadas no diretório corporativo para criar uma interface personalizável para o usuário.

Motor servlet: O mecanismo de servlet também é chamado de contêiner de servlet. É responsável por gerenciar o aplicativo Web SAS Information Delivery Portal. O mecanismo de servlet oferece um ambiente de tempo de execução. Ele fornece simultaneidade, implantação, gerenciamento de ciclo de vida, etc.

Servidor web: O servidor Web oferece serviço para o mecanismo de servlet que pode ser usado para hospedar sites. Isso deve ser acessado através do portal.

Camada posterior

A camada posterior é uma área onde são executados os servidores de dados e computação, que podem conter objetos de negócios. É um servidor de diretório corporativo. O servidor de diretório corporativo mantém metadados sobre o conteúdo localizado em toda a empresa.

Como baixar e instalar o SAS

Download local em sua máquina

Etapa 1) Baixe o SAS do link fornecido

Vá para este link https://www.sas.com/en_in/software/university-edition.html e clique em Obter software grátis.

Baixe e instale o SAS

Etapa 2) Selecione seu OperaSistema de Ting

Selecione o sistema operacional de acordo com o seu sistema.

Baixe e instale o SAS

Etapa 3) Baixe e instale o software de virtualização

SAS requer software de virtualização como VirtualBox a ser instalado antes de poder ser instalado. Aqui estão as etapas detalhadas

Baixe e instale o SAS

Siga as etapas mencionadas na tela para instalar o SAS. Tendo VirtualBox e a instalação local às vezes pode ser complicada. Recomendamos a instalação da AWS-

Instalação AWS

Você pode implantar SAS na AWS. É elegível para nível gratuito.

Passo 1) Acesse https://aws.amazon.com/marketplace/pp/B00WH10IKW. Clique em “Continuar para se inscrever”

Baixe e instale o SAS

Passo 2) Na próxima tela, Aceite os Termos.

Baixe e instale o SAS

Passo 3) A assinatura está pendente leva até 10 minutos para ser aprovada. Você verá a seguinte tela.

Baixe e instale o SAS

Passo 4) Atualize a página e sua assinatura será confirmada. Clique em Continuar para configuração

Baixe e instale o SAS

Passo 5) Mantenha as configurações padrão e clique em Continuar para iniciar.

Baixe e instale o SAS

Passo 6) Revveja a página de configuração. Insira um par de valores-chave. As configurações de descanso devem ser o padrão. Clique em Iniciar

Baixe e instale o SAS

Passo 7) Acesse https://aws.amazon.com/marketplace/library/ e clique em Exibir instâncias.

Baixe e instale o SAS

Passo 8) No pop-up

  1. Observe o ID da instância. Esta é a sua senha
  2. Clique em Acessar software

Baixe e instale o SAS

Passo 9) No pop-up que aparece depois de clicar na etapa 8

  1. Insira as credenciais do usuário. Id: senha sasdemo: id da instância anotado na etapa 8
  2. Clique em Entrar

Baixe e instale o SAS

Passo 10) Você verá a tela de boas-vindas.

Baixe e instale o SAS

guia de solução de problemas

Se você não conseguir se conectar, vá para https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId e regras de entrada/saída para todos

Como usar o SAS?

Para usar o software SAS de maneira eficaz, você precisa seguir quatro etapas: Acessar dados, Gerenciar dados, Analisar, Apresentar

Como usar o SAS
Como usar o SAS

Dados de acesso:

O SAS permite que você acesse dados em qualquer formato desejado.

Você pode acessar dados armazenados em qualquer lugar, seja em um arquivo em seu sistema ou em dados armazenados em outro sistema de banco de dados. Pode ser um arquivo Oracle, um arquivo de banco de dados SAS, um arquivo de banco de dados Raw ou um arquivo XLS/CSV simples. Isso o ajudará a acessar esses dados com facilidade.

Gerenciar dados:

SAS oferece excelentes recursos de gerenciamento de dados. Você pode subconjunto/dividir dados com base em determinadas condições, criar variáveis, limpar e validar dados. Existem outras ferramentas que permitem realizar a mesma tarefa. No entanto, o SAS ajuda você a realizar esse trabalho com facilidade.

SAS possui bibliotecas e processos bem definidos que facilitam o processo de programação. Além disso, a criação de dados variáveis ​​ou subconjuntos é um processo de apenas uma etapa. Isso evita que você escreva algoritmos complexos com apenas uma linha de código.

Analisar:

Você pode fazer vários tipos de análise usando SAS:

  • Ele verifica o cálculo da frequência da média
  • Regressão e Previsão
  • Árvore de decisão

Todas essas análises podem ser facilmente tratadas pelo SAS. É a melhor ferramenta para previsões precisas.

Presente:

Se você visualizar os dados corretamente, será fácil para o público se identificar com eles. É fundamental que sua ferramenta apresente os dados de forma adequada. É isso que o SAS faz por você. Possui excelentes capacidades de apresentação.

Você pode:

1. Listar relatórios

2. Relatórios resumidos

3. Relatórios gráficos

4. Imprimir relatórios

Exemplo de programa SAS

O Programa SAS consiste em três etapas necessárias:

  • Etapa de dados
  • Etapa do procedimento
  • Etapa de saída

Etapa DADOS

A etapa de dados carrega o conjunto de dados necessário na memória SAS e encontra as variáveis ​​corretas do conjunto de dados. Ele também captura os registros. Podemos usar etapas de dados para:

  • Insira dados em conjuntos de dados SAS
  • Calcular valores
  • Verifique ou corrija os dados
  • Produza novos conjuntos de dados

A sintaxe da instrução DATA é:

Sintaxe

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Exemplo:

O exemplo a seguir mostra como definir uma variável, nomeando o conjunto de dados, criando novas variáveis ​​e inserindo os dados. Neste exemplo, você pode ver que a variável string tem um $ no final e os valores numéricos não o têm.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Nota: Para executar a instrução SAS é necessário especificar o comando RUN.

Etapa PROC

Realiza análises ou funções específicas para produzir resultados e relatórios.

Sintaxe

PROC procedure_name options; #The name of the proc.
RUN;

Exemplo

O exemplo dado usa o MEIOS procedimento para imprimir os valores médios das variáveis ​​numéricas no conjunto de dados.

PROC MEANS;
RUN;

A etapa de SAÍDA

Você pode exibir os dados dos dados com instruções de saída condicionais.

Sintaxe

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Todo programa SAS deve seguir todas as etapas mencionadas acima para ler os dados de entrada, analisar os dados e fornecer o resultado da análise. O CORRE instrução no final de cada etapa finaliza a execução dessa etapa.

O Programa SAS completo

Abaixo está o código completo para cada uma das etapas acima.

O Programa SAS Completo

Saída:

O Programa SAS Completo

O Programa SAS Completo

O Programa SAS Completo

Onde o SAS é usado?

Abaixo estão alguns aplicativos SAS importantes:

Indústria Uso
Farmacêutica Análise Estatística, Relatórios
Telecomunicações ETL, relatórios, mineração de dados, previsão
Financeiros: ETL, relatórios, mineração de dados, pesquisa financeira
Modelagem preditiva DBMarketing, gerenciamento baseado em atividades
Assistência médica ETL, relatórios, mineração de dados

SAS vs. R

SAS R
SAS é um software comercial, portanto requer um investimento financeiro. R é um software de código aberto. Portanto, qualquer pessoa pode usá-lo.
SAS é uma ferramenta analítica mais fácil de aprender. Mesmo pessoas com conhecimento limitado de SQL podem aprender rapidamente. R exige que você escreva códigos complicados e longos.
SAS é uma escolha altamente preferida por grandes empresas e é bastante avançado tecnicamente e fácil de usar. R é um software de desenvolvimento rápido; no entanto, você precisa continuar atualizando-o.
O SAS possui um bom suporte gráfico, mas não oferece nenhuma customização. O suporte gráfico da ferramenta R é muito pobre.

Vantagens do SAS

  • SAS possui uma sintaxe fácil que pode ser aprendida sem qualquer tipo de conhecimento de programação
  • Capacidade de lidar com um grande banco de dados com facilidade
  • SAS é uma linguagem muito compreensível que pode ser facilmente depurada
  • Sua janela “log” indica claramente o erro que ajuda você a depurar seu código facilmente
  • SAS ajuda você a testar e analisar minuciosamente o algoritmo
  • O SAS é totalmente seguro, então você não pode extrair sem licença no escritório
  • Torna a computação estatística mais fácil para usuários que não programam
  • Lida com bancos de dados de grande porte de maneira eficaz.

Desvantagens do SAS

  • O custo é alto porque o indivíduo ou a organização não pode usar todos os aplicativos sem uma licença adequada
  • O SAS não é de código aberto, portanto, os algoritmos usados ​​no SAS não estão disponíveis para uso comum
  • A mineração de texto é um processo muito problemático e difícil no SAS.

Resumo

  • Software SAS, que significa software de análise estatística usado para análise de dados
  • R e Python são duas ferramentas alternativas de SAS amplamente utilizadas.
  • SAS foi desenvolvido por Jim Goodnight e John Shall em 1970 na NC University
  • SAS permite que você acesse arquivos e dados de dados brutos em um banco de dados externo de qualquer tipo
  • A arquitetura SAS é dividida principalmente em três partes: 1) Camada de cliente 2) Camada intermediária 3) Camada posterior
  • Para usar o software SAS você precisa seguir quatro etapas que são: 1)Acessar dados, 2)Gerenciamento 3) Analisar dados, 4) Apresentação
  • O programa SAS consiste em três etapas básicas: Etapa de Dados, Etapa Proc e Etapa de Saída
  • SAS ferramenta analítica de dados é amplamente utilizado em setores como farmacêutico, telecomunicações, financeiro, modelagem preditiva e saúde
  • SAS é um software comercial enquanto R é um software de código aberto
  • O maior benefício da ferramenta de programação SAS é que ela possui uma sintaxe fácil que pode ser aprendida sem qualquer tipo de conhecimento de programação.
  • Uma das desvantagens do modelo SAS é que ele não é uma ferramenta de código aberto. Portanto, os algoritmos utilizados nos procedimentos SAS não estão disponíveis para uso comum.