Tutorial de SAS para principiantes: qué es y ejemplo de programación

¿Qué es SAS?

SAS es un paquete de software estadístico basado en comandos ampliamente utilizado para el análisis y visualización de datos estadísticos. La forma completa de SAS es un software de análisis estadístico. Le permite utilizar técnicas y procesos cualitativos que le ayudarán a mejorar la productividad de los empleados y los beneficios empresariales. SAS también se utiliza para análisis avanzados como inteligencia empresarial, investigación de delitos y análisis predictivo. SAS se pronuncia como "SaaS".

En SAS, los datos se extraen y categorizan, lo que le ayuda a identificar y analizar patrones de datos. Es un paquete de software que le permite realizar análisis avanzados, inteligencia empresarial, análisis predictivo y gestión de datos para operar de manera eficaz en condiciones comerciales competitivas y cambiantes. Además, SAS es independiente de la plataforma, lo que significa que puede ejecutar SAS en cualquier sistema operativo, ya sea Linux o Linux. Windows.

Comparado con otros Herramientas de BI, SAS proporciona un amplio soporte para transformar y analizar datos mediante programación, además de utilizar la interfaz de arrastrar y soltar. Esto proporciona un control muy granular sobre la manipulación y el análisis de datos, que es su PVU.

¿Por qué necesitamos SAS?

Entendamos la necesidad de SAS con un ejemplo sencillo:

Considere una empresa de comercio electrónico que quiere conocer los patrones de compra de sus clientes basándose en datos históricos. La empresa tendrá que considerar miles de registros de múltiples clientes para obtener una visión generalizada.

Es posible que la empresa no tenga todos estos datos necesarios para el análisis. Por ejemplo, si un cliente no compró una chaqueta, ¿cuáles son los factores que le impidieron comprarla? Estos datos faltantes podrían crear errores en su análisis. ¿Cómo podemos deshacernos de estos problemas? ¿Cómo podemos manejar este tipo de datos?

Si se realiza de forma manual, esta tarea requerirá cientos de analistas y miles de horas de trabajo. Si utiliza la herramienta de análisis SAS, puede realizar el mismo análisis en cuestión de horas con un solo analista. La herramienta SAS le permite eliminar datos innecesarios y optimizar la información relevante. Le permitirá predecir un resultado incluso con datos faltantes. SAS le permite tomar mejores decisiones.

Herramientas SAS alternativas

Herramientas SAS alternativas

R: Es un software de código abierto. Es fácil aprender R porque está bien documentado. Ofrece sólidas capacidades estadísticas.

Python es otro lenguaje de programación de código abierto muy popular. Admite bibliotecas como Numpy, Scipy y MatPlotLib. Puede realizar cualquier operación estadística o crear cualquier modelo utilizando estas bibliotecas.

SAS: Es la herramienta analítica ampliamente utilizada en el mercado de análisis comercial. Con una gran cantidad de funciones estadísticas y una buena GUI.

En este tutorial de programación SAS, discutiremos sobre los sistemas analíticos estadísticos y cómo se pueden utilizar para resolver nuestros problemas.

Historia de SAS

  • SAS fue desarrollado por Jim Goodnight y John Shall en 1970 en la Universidad de Carolina del Norte.
  • Inicialmente, fue desarrollado para la Investigación Agrícola.
  • Later, se amplió a una gama de herramientas para incluir análisis predictivo, gestión de datos y BI, entre otras.
  • Hoy en día, 98 de las principales empresas del mundo incluidas en Fortune 400 utilizan la herramienta analítica de datos de SAS para Análisis de los datos.

A continuación, en este tutorial de lenguaje SAS, aprenderemos sobre las características de SAS.

Funciones SAS

Las características clave de SAS son:

  • Acceda fácilmente a archivos y datos de datos sin procesar desde una base de datos externa. ¡Lea y escriba casi cualquier formato de datos!
  • Administre datos utilizando herramientas para ingresar datos, editarlos, recuperarlos, formatearlos y convertirlos.
  • Analizar datos mediante técnicas descriptivas, estadísticas, multivariadas, previsión, modelado, programación lineal.
  • El análisis avanzado le ayuda a realizar cambios y mejoras en las prácticas comerciales.
  • Formación de informes con gráficos perfectos.
  • Operaciones investigación y gestión de proyectos
  • Actualización y modificación de datos.
  • Potente lenguaje de manejo de datos
  • Excelentes funciones de limpieza de datos
  • Interactuar con múltiples sistemas host

A continuación, en este tutorial de SAS para principiantes, aprenderemos sobre el conjunto de productos SAS.

Paquete de productos SAS

Hay muchos productos SAS disponibles en el mercado. A continuación, se incluye una lista de los más populares.

Nombre Descripción
Base SAS El software Base SAS ofrece agilidad de hardware y se integra en todo tipo de entorno informático.
SAS/GRÁFICO Esta herramienta le ayuda a representar datos estructurados en gráficos.
SAS/STAT Esta herramienta le ayuda a realizar diferentes tipos de regresión, análisis de varianza estadístico, regresión y análisis psicométrico.
SAS/ETS Se utiliza para hacer pronósticos. Le ayuda a realizar el análisis de series de tiempo.
SAS/IML El lenguaje Interactive Matric se conoce como IML. Esta herramienta te ayuda a traducir fórmulas matemáticas en un programa innovador.
SAS EBI Una herramienta para aplicaciones de Business Intelligence
Administrador de red SAS Es un componente central que ofrece funciones de gestión de datos y un lenguaje de programación para el análisis de datos.
SAS/O Herramienta para Operainvestigación de ción
SAS/QC Uso para control de calidad
SAS/minero empresarial Data mining
SAS/PH Análisis de ensayos clínicos
SAS / AF Ofrece facilidad de aplicaciones.
Guía empresarial Es un editor de código y administrador de proyectos basado en GUI.

A continuación, en esta guía de tutoriales de SAS, aprenderemos sobre la arquitectura de SAS.

SAS Architectura

SAS Architectura
Architectura de SAS

La arquitectura SAS se divide principalmente en tres partes:

  • Nivel de cliente
  • Nivel medio
  • Nivel trasero

Nivel de cliente

El nivel de cliente es donde se instala la aplicación en una máquina, donde se encuentra el usuario. Consta de los componentes que se utilizan para ver el portal y su contenido. También incluye un navegador web estándar que se utiliza para interactuar con el portal a través del protocolo HTTP o HTTPS estándar. También le ayuda a hacer que el firewall de la aplicación web SAS sea compatible.

Nivel medio

El nivel intermedio ofrece un punto de acceso centralizado para la información empresarial. Todo el acceso al contenido es procesado por los componentes que operan en este nivel. La separación de la lógica empresarial con la lógica de visualización le ayuda a aprovechar la lógica del nivel intermedio. Además, los puntos de acceso centralizados facilitan la aplicación de las reglas de seguridad, la administración del portal y la gestión de los cambios de código.

El nivel intermedio alberga las siguientes funciones:

Aplicación web del portal de entrega de información SAS: Es la colección de JSP, Java servlets, JavaBeans y otras clases y recursos. Estos componentes le ayudan a acceder a la información almacenada en el directorio empresarial para crear una interfaz personalizable para el usuario.

Motor de servlet: El motor de servlet también se denomina contenedor de servlet. Es responsable de gestionar la Aplicación Web del Portal de Entrega de Información de SAS. El motor de servlet ofrece un entorno de tiempo de ejecución. Proporciona concurrencia, implementación, gestión del ciclo de vida, etc.

Servidor web: El servidor web ofrece un servicio para el motor servlet que se puede utilizar para alojar un sitio web. Se debe acceder a él mediante el portal.

Nivel posterior

El nivel posterior es un área donde se ejecutan los servidores de datos y computación que pueden contener objetos comerciales. Es un servidor de directorio empresarial. El servidor de directorio empresarial mantiene metadatos sobre el contenido que se encuentra en toda la empresa.

Cómo descargar e instalar SAS

Descarga local en su máquina

Paso 1) Descargue SAS desde el enlace proporcionado

Ve a este enlace https://www.sas.com/en_in/software/university-edition.html y haga clic en Obtener software gratuito.

Descargar e instalar SAS

Paso 2) Selecciona tu Operating sistema

Seleccione el sistema operativo según su sistema.

Descargar e instalar SAS

Paso 3) Descargue e instale el software de virtualización

SAS requiere software de virtualización como VirtualBox debe instalarse antes de poder instalarse. Aquí están los pasos detallados.

Descargar e instalar SAS

Siga los pasos mencionados en pantalla para instalar SAS. Teniendo VirtualBox y la instalación local en algún momento puede resultar complicada. Recomendamos la instalación de AWS.

Instalación de AWS

Puede implementar SAS en AWS. Es elegible para el nivel gratuito.

Paso 1) Ve a https://aws.amazon.com/marketplace/pp/B00WH10IKW. Haga clic en "Continuar para suscribirse"

Descargar e instalar SAS

Paso 2) En la siguiente pantalla, Aceptar términos.

Descargar e instalar SAS

Paso 3) La suscripción está pendiente y tardará hasta 10 minutos en aprobarse. Verá la siguiente pantalla.

Descargar e instalar SAS

Paso 4) Actualice la página y se confirmará la suscripción. Haga clic en Continuar a la configuración

Descargar e instalar SAS

Paso 5) Mantenga la configuración predeterminada y haga clic en Continuar para iniciar.

Descargar e instalar SAS

Paso 6) Revista la página de configuración. Introduzca un par clave-valor. La configuración de descanso debe ser la predeterminada. Haga clic en Iniciar

Descargar e instalar SAS

Paso 7) Ve a https://aws.amazon.com/marketplace/library/ y haga clic en Ver instancias.

Descargar e instalar SAS

Paso 8) En la ventana emergente

  1. Tenga en cuenta la identificación de la instancia. Esta es tu contraseña
  2. Haga clic en Acceder al software

Descargar e instalar SAS

Paso 9) En la ventana emergente que aparece después de hacer clic en el paso 8

  1. Ingrese las credenciales de usuario. ID: contraseña de sasdemo: ID de instancia anotada en el paso 8
  2. Haga clic en Iniciar sesión

Descargar e instalar SAS

Paso 10) Verá la pantalla de bienvenida.

Descargar e instalar SAS

Diagnóstico

Si no puede conectarse, vaya a https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId y reglas de entrada/salida para todos

¿Cómo utilizar SAS?

Para utilizar eficazmente el software SAS, debe seguir cuatro pasos que son: acceder a los datos, gestionar los datos, analizar y presentar.

Cómo utilizar SAS
Cómo utilizar SAS

Datos de acceso:

SAS le permite acceder a los datos en cualquier formato que desee.

Puede acceder a los datos almacenados en cualquier lugar, ya sea en un archivo de su sistema o en otro sistema de base de datos. Puede ser un archivo de Oracle, un archivo de base de datos SAS, un archivo de base de datos sin procesar o un simple archivo XLS/CSV. Esto le ayudará a acceder a estos datos con facilidad.

Administrar datos:

SAS ofrece excelentes capacidades de gestión de datos. Puede subconjuntos/dividir datos según ciertas condiciones, crear variables, limpiar y validar datos. Existen otras herramientas que le permiten realizar la misma tarea. Sin embargo, SAS le ayuda a realizar este trabajo con facilidad.

SAS cuenta con bibliotecas y procesos bien definidos que facilitan el proceso de programación. Además, la creación de datos de variables o subconjuntos es un proceso de un solo paso. Esto le ahorra la necesidad de escribir algoritmos complejos con solo una línea de código.

Analizar:

Puede realizar varios tipos de análisis utilizando SAS:

  • Comprueba el cálculo de la frecuencia de la media.
  • Regresión y pronóstico
  • Árbol de decisión

Todos estos análisis los puede realizar fácilmente SAS. Es la mejor herramienta para realizar pronósticos precisos.

Presente:

Si visualiza los datos correctamente, a la audiencia le resultará fácil identificarse con ellos. Es esencial que su herramienta presente los datos de manera adecuada. Eso es lo que SAS hace por usted. Tiene excelentes capacidades de presentación.

Usted puede:

1. Listar informes

2. Informes resumidos

3. Informes gráficos

4. Imprimir informes

Ejemplo de programa SAS

El Programa SAS consta de tres pasos necesarios:

  • Paso de datos
  • Paso de proceso
  • Paso de salida

Paso de DATOS

El paso de datos carga el conjunto de datos necesario en la memoria SAS y encuentra las variables correctas del conjunto de datos. También captura los registros. Podemos utilizar pasos de datos para:

  • Ingrese datos en conjuntos de datos SAS
  • Calcular valores
  • Verificar o corregir datos
  • Producir nuevos conjuntos de datos

La sintaxis de la declaración DATOS es:

Sintaxis

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Ejemplo:

El siguiente ejemplo muestra cómo definir una variable, nombrar el conjunto de datos, crear nuevas variables e ingresar los datos. En este ejemplo, puede ver que la variable de cadena tiene un $ al final y los valores numéricos no lo tienen.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Nota: Para ejecutar la declaración SAS es necesario especificar el comando RUN.

Paso PROC

Realiza análisis o funciones específicas para producir resultados e informes.

Sintaxis

PROC procedure_name options; #The name of the proc.
RUN;

Ejemplo

El ejemplo dado utiliza el MEDIO Procedimiento para imprimir los valores medios de las variables numéricas en el conjunto de datos.

PROC MEANS;
RUN;

El paso de SALIDA

Puede mostrar los datos de los datos con declaraciones de salida condicionales.

Sintaxis

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Cada programa SAS debe seguir todos los pasos mencionados anteriormente para leer los datos de entrada, analizar los datos y dar el resultado del análisis. El CORRE La declaración al final de cada paso finaliza la ejecución de ese paso.

El programa SAS completo

A continuación se muestra el código completo para cada uno de los pasos anteriores.

El programa SAS completo

Salida:

El programa SAS completo

El programa SAS completo

El programa SAS completo

¿Dónde se utiliza SAS?

A continuación se detallan algunas aplicaciones SAS importantes:

Industria Uso
Farmacéutica Análisis estadístico, informes
Operadores ETL, informes, minería de datos, previsión
Finanzas ETL, Informes, Minería de datos, Investigación financiera
Modelado predictivo DBMarketing, Gestión Basada en Actividades
Asequible ETL, informes, minería de datos

SAS vs. R

SAS R
SAS es un software comercial, por lo que requiere una inversión financiera. R es software de código abierto. Por tanto, cualquiera puede utilizarlo.
SAS es una herramienta analítica más fácil de aprender. Incluso las personas con conocimientos limitados de SQL pueden aprenderlo rápidamente. R requiere que escribas códigos largos y complicados.
SAS es una opción muy preferida por las grandes empresas y es bastante avanzado técnicamente y fácil de usar. R es un software de rápido desarrollo; sin embargo, debes seguir actualizándolo.
SAS tiene un buen soporte gráfico pero no ofrece ninguna personalización. El soporte gráfico de la herramienta R es muy pobre.

Ventajas de SAS

  • SAS tiene una sintaxis sencilla que se puede aprender sin ningún tipo de conocimiento de programación.
  • Capacidad para manejar una gran base de datos con facilidad.
  • SAS es un lenguaje muy comprensible que se puede depurar fácilmente.
  • Su ventana de "registro" indica claramente el error, lo que le ayuda a depurar su código fácilmente
  • SAS le ayuda a probar y analizar exhaustivamente el algoritmo
  • SAS es completamente seguro, por lo que no puede extraerlo sin una licencia en la oficina.
  • Facilita la computación estadística a los usuarios que no programan
  • Maneja bases de datos de gran tamaño de manera efectiva.

Desventajas de SAS

  • El costo es alto porque un individuo u organización no puede usar todas las aplicaciones sin una licencia adecuada.
  • SAS no es de código abierto, por lo que los algoritmos utilizados en SAS no están disponibles para uso común.
  • La minería de texto es un proceso muy problemático y difícil en SAS.

Resumen

  • Software SAS que significa software de análisis estadístico que se utiliza para análisis de datos
  • R y Python son dos herramientas alternativas de SAS ampliamente utilizadas.
  • SAS fue desarrollado por Jim Goodnight y John Shall en 1970 en la Universidad de Carolina del Norte.
  • SAS le permite acceder a archivos y datos sin procesar en una base de datos externa de cualquier tipo
  • La arquitectura de SAS se divide principalmente en tres partes: 1) Nivel de cliente 2) Nivel intermedio 3) Nivel posterior
  • Para utilizar el software SAS es necesario seguir cuatro pasos que son: 1) Acceso a datos, 2) Gestión, 3) Análisis de datos, 4) Presentación
  • El programa SAS consta de tres pasos básicos: paso de datos, paso de proceso y paso de salida.
  • SAS herramienta de análisis de datos Se utiliza ampliamente en sectores como el farmacéutico, las telecomunicaciones, el financiero, el modelado predictivo y el sanitario.
  • SAS es software comercial mientras que R es software de código abierto
  • El mayor beneficio de la herramienta de programación SAS es que tiene una sintaxis sencilla que se puede aprender sin ningún tipo de conocimiento de programación.
  • Una de las desventajas del modelo SAS es que no es una herramienta de código abierto, por lo que los algoritmos utilizados en los procedimientos SAS no están disponibles para uso común.