Tutoriel SAS pour les débutants : qu'est-ce que c'est et exemple de programmation

Qu'est-ce que SAS ?

SAS est une suite logicielle statistique pilotée par commandes largement utilisée pour l'analyse et la visualisation de données statistiques. La forme complète SAS est un logiciel d'analyse statistique. Il vous permet d'utiliser des techniques et des processus qualitatifs qui vous aident à améliorer la productivité des employés et les bénéfices de l'entreprise. SAS est également utilisé pour des analyses avancées telles que la veille économique, les enquêtes criminelles et l'analyse prédictive. SAS se prononce « SaaS ».

Dans SAS, les données sont extraites et catégorisées, ce qui vous aide à identifier et analyser les modèles de données. Il s'agit d'une suite logicielle qui vous permet d'effectuer des analyses avancées, de la Business Intelligence, de l'analyse prédictive et de la gestion des données pour fonctionner efficacement dans des conditions commerciales concurrentielles et changeantes. De plus, SAS est indépendant de la plate-forme, ce qui signifie que vous pouvez exécuter SAS sur n'importe quel système d'exploitation, Linux ou Linux. Windows.

Par rapport à d'autres Outils BI, SAS fournit une prise en charge étendue pour transformer et analyser les données par programme, en plus de l'utilisation de l'interface glisser-déposer. Cela fournit un contrôle très granulaire sur la manipulation et les analyses des données, ce qui constitue son USP.

Pourquoi avons-nous besoin de SAS ?

Comprenons la nécessité de SAS avec un exemple simple :

Prenons l’exemple d’une entreprise de commerce électronique qui souhaite connaître les habitudes d’achat de ses clients sur la base de données historiques. L’entreprise devra prendre en compte des milliers d’enregistrements de plusieurs clients pour obtenir une vision générale.

L'entreprise peut ne pas disposer de toutes ces données nécessaires à l'analyse. Par exemple, si un client n’a pas acheté de veste, quels sont les facteurs qui l’ont empêché de ne pas acheter la veste ? Ces données manquantes pourraient créer des erreurs dans votre analyse. Comment pouvons-nous nous débarrasser de ces problèmes ? Comment gérer ce type de données ?

Si elle est effectuée manuellement, cette tâche nécessitera des centaines d'analystes et des milliers d'heures de travail. En utilisant l'outil d'analyse SAS, vous pouvez effectuer la même analyse en quelques heures avec un seul analyste. L'outil SAS vous permet d'éliminer les données inutiles et d'optimiser les informations pertinentes. Cela vous permettra de prédire un résultat même avec des données manquantes. SAS vous permet de prendre de meilleures décisions.

Outils SAS alternatifs

Outils SAS alternatifs

R: C'est un logiciel open source. Il est facile d’apprendre R car il est bien documenté. Il offre de fortes capacités statistiques.

Python est un autre langage de script open source populaire. Il prend en charge des bibliothèques telles que Numpy, Scipy et MatPlotLib. Vous pouvez effectuer n’importe quelle opération statistique ou créer n’importe quel modèle à l’aide de ces bibliothèques.

SAS: Il s'agit de l'outil d'analyse largement utilisé sur le marché de l'analyse commerciale. Avec une pléthore de fonctions statistiques et une bonne interface graphique.

Dans ce didacticiel de programmation SAS, nous discuterons des systèmes d'analyse statistique et de la manière dont ils peuvent être utilisés pour résoudre nos problèmes.

Histoire SAS

  • SAS a été développé par Jim Goodnight et John Shall en 1970 à la NC University.
  • Initialement, il a été développé pour la recherche agricole.
  • Later, il s'est étendu à une gamme d'outils pour inclure l'analyse prédictive, la gestion des données et la BI, entre autres.
  • Aujourd'hui, 98 des plus grandes entreprises mondiales du Fortune 400 utilisent l'outil d'analyse de données SAS pour L'analyse des données.

Ensuite, dans ce didacticiel sur le langage SAS, nous découvrirons les fonctionnalités de SAS.

Fonctionnalités SAS

Les principales fonctionnalités de SAS sont :

  • Accédez facilement aux fichiers de données brutes et aux données provenant d'une base de données externe. Lisez et écrivez presque tous les formats de données !
  • Gérer les données à l'aide d'outils de saisie, d'édition, de récupération, de formatage et de conversion
  • Analyser les données à l'aide de techniques descriptives, statistiques, multivariées, de prévision, de modélisation et de programmation linéaire.
  • L'analyse avancée vous aide à apporter des modifications et des améliorations aux pratiques commerciales.
  • Formation de rapports avec des graphiques parfaits
  • Operarecherche et gestion de projets
  • Mise à jour et modification des données
  • Langage de traitement de données puissant
  • Excellentes fonctions de nettoyage des données
  • Interagissez avec plusieurs systèmes hôtes

Ensuite, dans ce didacticiel SAS pour débutants, nous découvrirons la suite de produits SAS.

Suite de produits SAS

De nombreux produits SAS sont disponibles sur le marché. Voici une liste des plus populaires.

Nom Description
Base SAS Le logiciel Base SAS offre une agilité matérielle et s’intègre à tout type d’environnement informatique.
SAS/GRAPHIQUE Cet outil vous aide à représenter des données structurées sous forme de graphiques.
SAS/STAT Cet outil vous aide à effectuer différents types de régression, d'analyse statistique de variance, de régression et d'analyse psychométrique.
SAS/ETS Il est utilisé pour la prévision. Vous aide à effectuer l’analyse des séries chronologiques.
SAS/IML Le langage Interactive Matric est connu sous le nom d’IML. Cet outil vous aide à traduire des formules mathématiques en un programme innovant.
SAS EBI Un outil pour les applications de Business Intelligence
Gestionnaire de grille SAS Il s'agit d'un composant central qui offre une fonction de gestion des données et un langage de programmation pour l'analyse des données.
SAS/OR Outil pour Operarecherche sur la recherche
SAS/QC Utilisation pour le contrôle qualité
SAS/Entreprise Mineur L'exploration de données
SAS/PH Analyse des essais cliniques
SAS/AF Il offre une facilité d'application
Guide d'entreprise Il s'agit d'un éditeur de code et d'un gestionnaire de projet basés sur une interface graphique.

Ensuite, dans ce guide de didacticiels SAS, nous découvrirons l'architecture SAS.

SAS Architecture

SAS Architecture
Archistructure de SAS

L'architecture SAS est divisée principalement en trois parties :

  • Niveau client
  • Niveau intermédiaire
  • Niveau arrière

Niveau client

Le niveau client est l'endroit où l'application est installée sur une machine, là où se trouve l'utilisateur. Il se compose des composants utilisés pour visualiser le portail et son contenu. Il comprend également un navigateur Web standard utilisé pour interagir avec le portail via le protocole HTTP ou HTTPS standard. Il vous aide également à rendre le pare-feu d'application Web SAS convivial.

Niveau intermédiaire

Le niveau intermédiaire offre un point d'accès centralisé aux informations de l'entreprise. Tout accès au contenu est traité par les composants fonctionnant à ce niveau. La séparation de la logique métier et de la logique d'affichage vous aide à tirer parti de la logique du niveau intermédiaire. De plus, des points d'accès centralisés facilitent l'application des règles de sécurité, l'administration du portail et la gestion des modifications de code.

Le niveau intermédiaire héberge les fonctions suivantes :

Application Web du portail de diffusion d'informations SAS : C'est la collection de JSP, Java servlets, JavaHaricots et autres classes et ressources. Ces composants vous aident à accéder aux informations stockées dans l'annuaire d'entreprise pour créer une interface personnalisable pour l'utilisateur.

Moteur de servlets : Le moteur de servlet est également appelé conteneur de servlet. Il est responsable de la gestion de l’application Web SAS Information Delivery Portal. Le moteur de servlet offre un environnement d'exécution. Il assure la concurrence, le déploiement, la gestion du cycle de vie, etc.

Serveur Web: Le serveur Web offre un service pour le moteur de servlet qui peut être utilisé pour héberger un site Web. Celui-ci doit être accessible via le portail.

Niveau arrière

Le niveau arrière est une zone où s'exécutent les serveurs de données et de calcul qui peuvent contenir des objets métier. Il s'agit d'un serveur d'annuaire d'entreprise. Le serveur d'annuaire d'entreprise conserve des métadonnées sur le contenu situé dans toute l'entreprise.

Comment télécharger et installer SAS

Téléchargement local sur votre machine

Étape 1) Téléchargez SAS à partir du lien donné

Aller à ce lien https://www.sas.com/en_in/software/university-edition.html et cliquez sur Obtenir un logiciel gratuit.

Téléchargez et installez SAS

Étape 2) Sélectionnez votre Operating système

Sélectionnez le système d'exploitation en fonction de votre système.

Téléchargez et installez SAS

Étape 3) Téléchargez et installez le logiciel de virtualisation

SAS nécessite un logiciel de virtualisation comme VirtualBox à installer avant de pouvoir être installé. Voici les étapes détaillées

Téléchargez et installez SAS

Suivez les étapes mentionnées à l'écran pour installer SAS. Ayant VirtualBox et l'installation locale peut parfois être délicate. Nous recommandons l'installation d'AWS.

Installation d'AWS

Vous pouvez déployer SAS dans AWS. Il est éligible au niveau gratuit.

Étape 1) Cliquez sur https://aws.amazon.com/marketplace/pp/B00WH10IKW. Cliquez sur « Continuer à vous abonner »

Téléchargez et installez SAS

Étape 2) Dans cet écran suivant, acceptez les conditions.

Téléchargez et installez SAS

Étape 3) L'approbation de l'abonnement est en attente prend jusqu'à 10 minutes. Vous verrez l'écran suivant.

Téléchargez et installez SAS

Étape 4) Actualisez la page et votre abonnement sera confirmé. Cliquez sur Continuer vers la configuration

Téléchargez et installez SAS

Étape 5) Conservez les paramètres par défaut et cliquez sur Continuer pour lancer.

Téléchargez et installez SAS

Étape 6) RevVoir la page de configuration. Entrez une paire clé-valeur. Les paramètres de repos doivent être ceux par défaut. Cliquez sur Lancer

Téléchargez et installez SAS

Étape 7) Cliquez sur https://aws.amazon.com/marketplace/library/ et cliquez sur Afficher les instances.

Téléchargez et installez SAS

Étape 8) Dans le popup

  1. Notez l'identifiant de l'instance. Ceci est votre mot de passe
  2. Cliquez sur Logiciel d'accès

Téléchargez et installez SAS

Étape 9) Dans la fenêtre contextuelle qui apparaît après avoir cliqué à l'étape 8

  1. Entrez les informations d'identification de l'utilisateur. Id : mot de passe sasdemo : identifiant d'instance noté à l'étape 8
  2. Cliquez sur Se connecter

Téléchargez et installez SAS

Étape 10) Vous verrez l’écran de bienvenue.

Téléchargez et installez SAS

Dépannage

Si vous ne parvenez pas à vous connecter, accédez à https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId et des règles entrantes/sortantes pour tous

Comment utiliser SAS ?

Pour utiliser efficacement le logiciel SAS, vous devez suivre quatre étapes : accéder aux données, gérer les données, analyser, présenter.

Comment utiliser SAS
Comment utiliser SAS

Données d'accès:

SAS vous permet d'accéder aux données dans n'importe quel format souhaité.

Vous pouvez accéder aux données stockées n'importe où, qu'il s'agisse d'un fichier sur votre système ou de données stockées dans un autre système de base de données. Il peut s'agir d'un fichier Oracle, d'un fichier de base de données SAS, d'un fichier de base de données Raw ou d'un simple fichier XLS/CSV. Cela vous aidera à accéder facilement à ces données.

Gérer les données :

SAS offre d'excellentes capacités de gestion des données. Vous pouvez sous-ensembler/découper les données en fonction de certaines conditions, créer des variables, nettoyer et valider les données. Il existe d'autres outils qui vous permettent d'effectuer la même tâche. Cependant, SAS vous aide à effectuer ce travail en toute simplicité.

SAS dispose de bibliothèques et de processus bien définis qui facilitent le processus de programmation. De plus, la création de données variables ou de sous-ensembles n'est qu'un processus en une seule étape. Cela vous évite d’écrire des algorithmes complexes avec une seule ligne de code.

Analyser:

Vous pouvez effectuer différents types d'analyses à l'aide de SAS :

  • Il vérifie la fréquence du calcul de la moyenne
  • Régression et prévision
  • Arbre de décision

Toutes ces analyses peuvent être facilement traitées par SAS. C'est le meilleur outil pour des prévisions précises.

Présents:

Si vous visualisez correctement les données, il est facile pour le public de s'y identifier. Il est essentiel que votre outil présente les données de manière adaptée. C'est ce que SAS fait pour vous. Il possède d’excellentes capacités de présentation.

Vous pouvez:

1. Répertorier les rapports

2. Rapports de synthèse

3. Rapports graphiques

4. Imprimer des rapports

Exemple de programme SAS

Le programme SAS comprend trois étapes nécessaires :

  • Étape de données
  • Étape de procédure
  • Étape de sortie

Étape DONNÉES

L'étape de données charge l'ensemble de données nécessaire dans la mémoire SAS et trouve les variables correctes de l'ensemble de données. Il capture également les enregistrements. Nous pouvons utiliser les étapes de données pour :

  • Saisir des données dans des ensembles de données SAS
  • Calculer les valeurs
  • Vérifier ou corriger les données
  • Produire de nouveaux ensembles de données

La syntaxe de l'instruction DATA est la suivante :

Syntaxe

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Mise en situation :

L'exemple suivant montre comment définir une variable, nommer l'ensemble de données, créer de nouvelles variables et saisir les données. Dans cet exemple, vous pouvez voir que la variable chaîne a un $ à la fin et que les valeurs numériques en sont dépourvues.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Remarque : Pour exécuter l'instruction SAS, vous devez spécifier la commande RUN.

Étape PROC

Il effectue des analyses ou des fonctions spécifiques pour produire des résultats et des rapports.

Syntaxe

PROC procedure_name options; #The name of the proc.
RUN;

Exemple

L'exemple donné utilise le VEUT DIRE procédure pour imprimer les valeurs moyennes des variables numériques dans l’ensemble de données.

PROC MEANS;
RUN;

L'étape de SORTIE

Vous pouvez afficher les données à partir des données avec des instructions de sortie conditionnelles.

Syntaxe

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Chaque programme SAS doit suivre toutes les étapes mentionnées ci-dessus pour lire les données d'entrée, analyser les données et donner le résultat de l'analyse. Le COURT L'instruction à la fin de chaque étape termine l'exécution de cette étape.

Le programme SAS complet

Vous trouverez ci-dessous le code complet pour chacune des étapes ci-dessus.

Le programme SAS complet

Sortie :

Le programme SAS complet

Le programme SAS complet

Le programme SAS complet

Où SAS est-il utilisé ?

Vous trouverez ci-dessous quelques applications SAS importantes :

Industrie Utilisation
Pharmaceutique Analyse statistique, reporting
Télécom ETL, Reporting, Data Mining, Prévisions
Financiers : ETL, Reporting, Data Mining, Recherche financière
Modélisation prédictive DBMarketing, Gestion par Activités
Mobilier Médical ETL, reporting, fouille de données

SAS contre. R.

SAS R
SAS est un logiciel commercial, il nécessite donc un investissement financier. R est un logiciel open source. Tout le monde peut donc l’utiliser.
SAS est l'outil analytique le plus simple à apprendre. Même les personnes ayant une connaissance limitée de SQL peuvent l'apprendre rapidement. R vous oblige à écrire des codes compliqués et longs.
SAS est un choix hautement préféré par les grandes entreprises et est assez avancé techniquement et convivial. R est un logiciel qui se développe rapidement ; cependant, vous devez continuer à le mettre à niveau.
SAS dispose d'un bon support graphique mais n'offre aucune personnalisation. Le support graphique de l'outil R est très médiocre.

Avantages du SAS

  • SAS a une syntaxe simple qui peut être apprise sans aucune connaissance en programmation
  • Capacité à gérer facilement une grande base de données
  • SAS est un langage très compréhensible qui peut facilement être débogué
  • Sa fenêtre « journal » indique clairement l'erreur, ce qui vous aide à déboguer facilement votre code.
  • SAS vous aide à tester et analyser en profondeur l'algorithme
  • SAS est entièrement sécurisé, vous ne pouvez donc pas extraire sans licence au bureau
  • Facilite le calcul statistique pour les utilisateurs non-programmateurs
  • Gère efficacement une base de données de grande taille.

Inconvénients du SAS

  • Le coût est élevé car un individu ou une organisation ne peut pas utiliser toutes les applications sans une licence appropriée.
  • SAS n'est pas open source, les algorithmes utilisés dans SAS ne sont donc pas disponibles pour un usage courant
  • L'exploration de texte est un processus très gênant et difficile dans SAS.

Résumé

  • Logiciel SAS, c'est-à-dire logiciel d'analyse statistique utilisé pour l'analyse des données.
  • R et Python sont deux outils alternatifs largement utilisés de SAS.
  • SAS a été développé par Jim Goodnight et John Shall en 1970 à la NC University.
  • SAS vous permet d'accéder à des fichiers de données brutes et à des données dans une base de données externe de toute nature
  • L'architecture SAS est divisée principalement en trois parties 1) Niveau client 2) Niveau intermédiaire 3) Niveau arrière
  • Pour utiliser le logiciel SAS, vous devez suivre quatre étapes qui sont : 1) Accéder aux données, 2) Gestion 3) Analyser les données, 4) Présentation
  • Le programme SAS se compose de trois étapes de base : l'étape des données, l'étape de procédure et l'étape de sortie.
  • SAS outil d'analyse de données est largement utilisé dans des secteurs tels que la pharmacie, les télécommunications, la finance, la modélisation prédictive et la santé.
  • SAS est un logiciel commercial tandis que R est un logiciel open source
  • Le plus grand avantage de l’outil de programmation SAS est qu’il possède une syntaxe simple qui peut être apprise sans aucune connaissance en programmation.
  • L'un des inconvénients du modèle SAS est qu'il ne s'agit pas d'un outil open source. Ainsi, les algorithmes utilisés dans les procédures SAS ne sont pas disponibles pour un usage courant.

Newsletter quotidienne de Guru99

Commencez votre journée avec les dernières et plus importantes actualités sur l'IA diffusées dès maintenant.