Tutorial SAS pentru începători: Ce este și exemplu de programare
Ce este SAS?
SAS este o suită de software statistică bazată pe comandă utilizată pe scară largă pentru analiza și vizualizarea datelor statistice. Forma completă a SAS este Software de analiză statistică. Vă permite să utilizați tehnici și procese calitative care vă ajută să creșteți productivitatea angajaților și profiturile afacerii. SAS este, de asemenea, utilizat pentru analize avansate, cum ar fi business intelligence, investigarea criminalității și analiza predictivă. SAS se pronunță ca „SaaS”.
În SAS, datele sunt extrase și clasificate, ceea ce vă ajută să identificați și să analizați modelele de date. Este o suită de software care vă permite să efectuați analize avansate, Business Intelligence, Analiză predictivă, gestionarea datelor pentru a opera eficient în condițiile de afaceri competitive și în schimbare. În plus, SAS este independent de platformă, ceea ce înseamnă că puteți rula SAS pe orice sistem de operare, fie Linux, fie Windows.
Comparativ cu altele Instrumente BI, SAS oferă suport extins pentru transformarea și analizarea datelor în mod programatic, în afară de utilizarea interfeței drag and drop. Acest lucru oferă un control foarte granular asupra manipulării și analizelor datelor, care este USP-ul său.
De ce avem nevoie de SAS?
Să înțelegem necesitatea SAS cu un exemplu simplu:
Luați în considerare o companie de comerț electronic care dorește să cunoască modelele de cumpărare ale clienților săi pe baza datelor istorice. Compania va trebui să ia în considerare mii de înregistrări ale mai multor clienți, pentru a obține o perspectivă generalizată.
Este posibil ca societatea să nu aibă toate aceste date necesare pentru analiză. De exemplu, dacă un client nu a cumpărat o jachetă, atunci care sunt factorii care l-au împiedicat să nu cumpere jacheta? Aceste date lipsă ar putea crea erori în analiza dvs. Cum putem scăpa de aceste probleme? Cum putem gestiona acest tip de date?
Dacă este făcută manual, această sarcină va necesita sute de analiști și mii de ore de lucru. Folosind instrumentul de analiză SAS, puteți face aceeași analiză în câteva ore cu un singur analist. Instrumentul SAS vă permite să eliminați datele inutile și să optimizați informațiile relevante. Vă va permite să preziceți un rezultat chiar și cu datele lipsă. SAS vă permite să luați decizii mai bune.
Instrumente SAS alternative
R: Este un software open-source. Este ușor să înveți R, deoarece este bine documentat. Oferă capacități statistice puternice.
Python este un alt limbaj de scripting open-source popular. Acesta acceptă biblioteci precum Numpy, Scipy și MatPlotLib. Puteți efectua orice operație statistică sau puteți construi orice model folosind aceste biblioteci.
SAS: Este instrumentul analitic utilizat pe scară largă pe piața de analiză comercială. Cu o multitudine de funcții statistice și interfață grafică bună.
În acest tutorial de programare SAS, vom discuta despre sistemele analitice statistice și despre cum poate fi folosit pentru a ne rezolva problemele.
Istoria SAS
- SAS a fost dezvoltat de Jim Goodnight și John Shall în 1970 la Universitatea NC
- Inițial, a fost dezvoltat pentru Cercetare Agricolă.
- Later, s-a extins la o gamă largă de instrumente pentru a include, printre altele, Predictive Analytics, Data Management, BI.
- Astăzi, 98 dintre companiile de top din lume din Fortune 400 utilizează instrumentul de analiză a datelor SAS pentru Analiza datelor.
În continuare, în acest tutorial de limbaj SAS, vom afla despre caracteristicile SAS.
Caracteristici SAS
Caracteristicile cheie ale SAS sunt:
- Accesați cu ușurință fișierele de date brute și datele dintr-o bază de date externă. Citiți și scrieți aproape orice format de date!
- Gestionați datele folosind instrumente pentru introducerea datelor, editarea, preluarea, formatarea și conversia
- Analizați datele folosind tehnici descriptive, statistice, multivariate, prognoză, modelare, programare liniară
- Analiza avansată vă ajută să faceți schimbări și îmbunătățiri în practicile de afaceri.
- Formarea rapoartelor cu grafice perfecte
- Operacercetare și management de proiect
- Actualizarea și modificarea datelor
- Limbaj puternic de manipulare a datelor
- Funcții excelente de curățare a datelor
- Interacționează cu mai multe sisteme gazdă
În continuare, în acest tutorial SAS pentru începători, vom afla despre suita de produse SAS.
Suita de produse SAS
Există multe produse SAS disponibile pe piață. Mai jos este o listă cu cele mai populare.
Nume | Descriere |
---|---|
Baza SAS | Software-ul Base SAS oferă agilitate hardware și se integrează în toate tipurile de medii de calcul. |
SAS/GRAF | Acest instrument vă ajută să reprezentați datele structurate în grafice. |
SAS/STAT | Acest instrument vă ajută să efectuați diferite tipuri de regresie, varianță de analiză statistică, regresie și analiză psihometrice. |
SAS/ETS | Este folosit pentru prognoză. Vă ajută să efectuați analiza seriilor temporale. |
SAS/IML | Limbajul Matric Interactiv este cunoscut sub numele de IML. Acest instrument vă ajută să traduceți formule matematice într-un program inovator. |
SAS EBI | Un instrument pentru aplicații de Business Intelligence |
SAS Grid Manager | Este o componentă de bază care oferă facilitatea de gestionare a datelor și un limbaj de programare pentru analiza datelor |
SAS/OR | Instrument pentru Operacercetare țiune |
SAS/QC | Utilizați pentru controlul calității |
SAS/Enterprise Miner | exploatare a datelor |
SAS/PH | Analiza studiilor clinice |
SAS/AF | Oferă facilitate de aplicații |
Ghidul pentru întreprinderi | Este un editor de cod și un manager de proiect bazat pe GUI |
În continuare, în acest ghid de tutoriale SAS, vom afla despre arhitectura SAS.
SAS Architectură
Arhitectura SAS este împărțită în principal din trei părți:
- Nivelul de client
- Nivelul mijlociu
- Nivelul din spate
Nivelul de client
Nivelul client este locul în care aplicația este instalată pe o mașină, unde se află utilizatorul. Constă din componentele care sunt utilizate pentru a vizualiza portalul și conținutul acestuia. Include, de asemenea, un browser web standard care este utilizat pentru a interacționa cu portalul prin protocolul standard HTTP sau HTTPS. De asemenea, vă ajută să faceți firewall-ul aplicației web SAS prietenos.
Nivelul mediu
Nivelul mediu oferă un punct de acces centralizat pentru informațiile companiei. Tot accesul la conținut este procesat de componentele care operează din acest nivel. Separarea logicii de afaceri cu logica de afișare vă ajută să utilizați logica nivelului de mijloc. În plus, punctele de acces centralizate facilitează aplicarea regulilor de securitate, administrarea portalului și gestionarea modificărilor codului.
Nivelul de mijloc găzduiește următoarele funcții:
Aplicația web a portalului de livrare a informațiilor SAS: Este colecția JSP, Java servlet-uri, JavaFasole și alte clase și resurse. Aceste componente vă ajută să accesați informațiile stocate în directorul companiei pentru a crea o interfață personalizabilă pentru utilizator.
Motor Servlet: Motorul servlet este numit și container servlet. Acesta este responsabil pentru gestionarea aplicației web a portalului de livrare a informațiilor SAS. Motorul servlet oferă un mediu de rulare. Oferă concurență, implementare, management al ciclului de viață etc.
Server web: Serverul web oferă servicii pentru motorul servlet care poate fi folosit pentru a găzdui site-ul web. Acesta ar trebui să fie accesat folosind portalul.
Nivelul din spate
Nivelul din spate este o zonă în care rulează serverele de date și de calcul, care poate conține obiecte de afaceri. Este un server de directoare pentru întreprinderi. Serverul de director al întreprinderii păstrează metadatele despre conținutul care se află în întreaga întreprindere.
Cum să descărcați și să instalați SAS
Descărcare locală în aparatul dvs
Pasul 1) Descărcați SAS de pe linkul dat
Accesați acest link https://www.sas.com/en_in/software/university-edition.html și faceți clic pe Obțineți software gratuit.
Pasul 2) Selectați dvs Operating System
Selectați sistemul de operare conform sistemului dvs.
Pasul 3) Descărcați și instalați software-ul de virtualizare
SAS necesită software de virtualizare, cum ar fi VirtualBox să fie instalat înainte de a putea fi instalat. Iată pașii detaliați
Urmați pașii menționați pe ecran pentru a instala SAS. Având VirtualBox iar instalarea locală ar putea fi uneori dificilă. Vă recomandăm instalarea AWS-
Instalare AWS
Puteți implementa SAS în AWS. Este eligibil pentru nivelul gratuit.
Pas 1) Mergi la pagina https://aws.amazon.com/marketplace/pp/B00WH10IKW. Faceți clic pe „Continuați să vă abonați”
Pas 2) În acest ecran următor, Acceptați termenii.
Pas 3) Abonamentul este în așteptare durează până la 10 minute pentru aprobare. Veți vedea următorul ecran.
Pas 4) Actualizează pagina și vei confirma abonamentul. Faceți clic pe Continuați la configurare
Pas 5) Păstrați setările implicite și faceți clic pe Continuați la lansare.
Pas 6) Revvezi pagina de configurare. Introduceți o pereche cheie-valoare. Setările de odihnă ar trebui să fie implicite. Faceți clic pe Lansare
Pas 7) Mergi la pagina https://aws.amazon.com/marketplace/library/ și faceți clic pe Vizualizare instanțe.
Pas 8) În fereastra pop-up
- Notați id-ul instanței. Aceasta este parola ta
- Faceți clic pe Acces software
Pas 9) În fereastra pop-up, care apare după ce faceți clic la pasul 8
- Introduceți acreditările utilizatorului. Id: parola sasdemo: id-ul instanței notat la pasul 8
- Faceți clic pe Conectare
Pas 10) Veți vedea ecranul de bun venit.
Depanare
Dacă nu vă puteți conecta, accesați https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId și reguli de intrare/ieșire pentru toți
Cum se utilizează SAS?
Pentru a utiliza eficient software-ul SAS, trebuie să urmați patru pași care sunt: Accesarea datelor, Datele de management, Analiza, Prezentarea
Date de acces:
SAS vă permite să accesați datele în orice format dorit.
Puteți accesa datele care sunt stocate oriunde, fie că sunt într-un fișier de pe sistemul dvs. sau date care sunt stocate într-un alt sistem de baze de date. Poate fi un fișier oracle, un fișier de bază de date SAS, un fișier de bază de date brută sau un simplu fișier XLS /CSV. Vă va ajuta să accesați aceste date cu ușurință.
Gestionați datele:
SAS oferă capabilități excelente de gestionare a datelor. Puteți să subsetați/secționați date în funcție de anumite condiții, să creați variabile, să curățați și să validați date. Există și alte instrumente care vă permit să efectuați aceeași sarcină. Cu toate acestea, SAS vă ajută să efectuați această lucrare cu ușurință.
SAS are biblioteci și procese bine definite, ceea ce face procesul de programare ușor. Mai mult, crearea de date variabile sau subseturi este doar un proces într-un pas. Acest lucru vă scutește de a scrie algoritmi complexi doar cu o singură linie de cod.
A analiza:
Puteți face diferite tipuri de analize folosind SAS:
- Verifică calculul Frecvența mediei
- Regresia și prognoza
- Arborele de Decizii
Toate aceste analize pot fi gestionate cu ușurință de către SAS. Este cel mai bun instrument pentru prognoza precisă.
Prezent:
Dacă vizualizați corect datele, publicul este ușor să se raporteze la ele. Este esențial ca instrumentul dvs. să prezinte datele într-un mod adecvat. Asta face SAS pentru tine. Are capacitati excelente de prezentare.
Poti:
1. Listează rapoarte
2. Rapoarte de sinteză
3. Rapoarte grafice
4. Imprimați rapoarte
Exemplu de program SAS
Programul SAS constă din trei pași necesari:
- Pasul de date
- Pasul de procedură
- Pasul de ieșire
DATE Pasul
Pasul de date încarcă setul de date necesar în memoria SAS și găsește variabilele corecte ale setului de date. De asemenea, captează înregistrările. Putem folosi pașii de date pentru:
- Introduceți datele în seturile de date SAS
- Calculați valorile
- Verificați sau corectați datele
- Produceți seturi de date noi
Sintaxa pentru instrucțiunea DATA este:
Sintaxă
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Exemplu:
Următorul exemplu arată cum se definește o variabilă, se denumește setul de date, se creează noi variabile și se introduce datele. În acest exemplu, puteți vedea că variabila șir are un $ la sfârșit, iar valorile numerice sunt fără acesta.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Notă: Pentru a executa instrucțiunea SAS, trebuie să specificați comanda RUN.
Pasul PROC
Ea efectuează analize sau funcții specifice pentru a produce rezultate și rapoarte.
Sintaxă
PROC procedure_name options; #The name of the proc. RUN;
Exemplu
Exemplul dat folosește MIJLOACE procedura de imprimare a valorilor medii ale variabilelor numerice din setul de date.
PROC MEANS; RUN;
Pasul IEȘIRE
Puteți afișa datele din date cu instrucțiuni de ieșire condiționată.
Sintaxă
PROC PRINT DATA = data_set; OPTIONS; RUN;
Fiecare program SAS trebuie să urmeze toți pașii menționați mai sus pentru a citi datele de intrare, a analiza datele și a oferi rezultatul analizei. The ALERGA instrucțiunea de la sfârșitul fiecărui pas încheie execuția pasului respectiv.
Programul SAS complet
Mai jos este dat codul complet pentru fiecare dintre pașii de mai sus.
ieșire:
Unde se folosește SAS?
Mai jos sunt prezentate câteva aplicații SAS importante:
Industrie | Folosire |
---|---|
Farmaceutic | Analiză statistică, raportare |
Telecom | ETL, Raportare, Data Mining, Prognoză |
Financiari | ETL, Raportare, Mining de date, Cercetare financiară |
Modelarea predictivă | DBMarketing, Management bazat pe activitate |
Farmaceutice | ETL, raportare, Data Mining |
SAS vs. R
SAS | R |
---|---|
SAS este un software comercial, deci necesită o investiție financiară. | R este un software open source. Prin urmare, oricine îl poate folosi. |
SAS este cel mai ușor instrument analitic de învățat. Chiar și oamenii cu cunoștințe limitate de SQL îl pot învăța rapid. | R cere să scrieți coduri complicate și lungi. |
SAS este o alegere foarte preferată de marile companii și este destul de avansată din punct de vedere tehnic și ușor de utilizat. | R este un software care dezvoltă rapid; cu toate acestea, trebuie să continuați să-l actualizați. |
SAS are suport grafic bun, dar nu oferă nicio personalizare. | Suportul grafic al instrumentului R este foarte slab. |
Avantajele SAS
- SAS are o sintaxă ușoară care poate fi învățată fără niciun fel de cunoștințe de programare
- Abilitatea de a gestiona cu ușurință o bază de date mare
- SAS este un limbaj foarte ușor de înțeles, care poate fi ușor depanat
- Fereastra sa „jurnal” indică clar eroarea, care vă ajută să vă depanați codul cu ușurință
- SAS vă ajută să testați și să analizați în detaliu algoritmul
- SAS este complet securizat, astfel încât nu puteți extrage fără licență în birou
- Ușurează calculul statistic pentru utilizatorii care nu sunt programatori
- Se ocupă eficient de bazele de date mari.
Dezavantajele SAS
- Costul este mare, deoarece persoana sau organizația nu le poate folosi toate aplicațiile fără o licență adecvată
- SAS nu este open source, așa că algoritmii utilizați în SAS nu sunt disponibili pentru uz comun
- Text mining este un proces foarte supărător și dificil în SAS.
Rezumat
- Software SAS care înseamnă Software de analiză statistică care este utilizat pentru analiza datelor
- R și Python sunt două instrumente alternative ale SAS utilizate pe scară largă.
- SAS a fost dezvoltat de Jim Goodnight și John Shall în 1970 la Universitatea NC
- SAS vă permite să accesați fișiere de date brute și date dintr-o bază de date externă de orice fel
- Arhitectura SAS este împărțită în principal din trei părți 1) Nivelul client 2) Nivelul mediu 3) Nivelul din spate
- Pentru a utiliza software-ul SAS trebuie să urmați patru pași care sunt: 1) Acces la date, 2) Management 3) Analizați datele, 4) Prezentare
- Programul SAS constă din trei pași de bază: pas de date, pas de proces și pas de ieșire
- SAS instrument de analiză a datelor este utilizat pe scară largă în sectoare precum farmaceutică, telecomunicații, financiar, modelare predictivă și asistență medicală.
- SAS este software comercial, în timp ce R este software open source
- Cel mai mare beneficiu al instrumentului de programare SAS este că are o sintaxă ușoară care poate fi învățată fără niciun fel de cunoștințe de programare.
- Unul dintre dezavantajele modelului SAS este că nu este un instrument open source. Deci, algoritmii utilizați în procedurile SAS nu sunt disponibili pentru uz comun.