SAS-i õpetus algajatele: mis on ja programmeerimise näide

Mis on SAS?

SAS on käsupõhine statistikatarkvarakomplekt, mida kasutatakse laialdaselt statistiliste andmete analüüsiks ja visualiseerimiseks. SAS-i täisvorm on statistilise analüüsi tarkvara. See võimaldab teil kasutada kvalitatiivseid tehnikaid ja protsesse, mis aitavad teil tõsta töötajate tootlikkust ja ärikasumit. SAS-i kasutatakse ka täiustatud analüütika jaoks, nagu äriteave, kuritegevuse uurimine ja ennustav analüüs. SAS-i hääldatakse kui "SaaS".

SAS-is ekstraheeritakse ja kategoriseeritakse andmed, mis aitab teil andmemustreid tuvastada ja analüüsida. See on tarkvarakomplekt, mis võimaldab teil teostada täiustatud analüüsi, ärianalüüsi, ennustavat analüüsi ja andmehaldust, et tõhusalt tegutseda konkurentsis ja muutuvates äritingimustes. Lisaks on SAS platvormist sõltumatu, mis tähendab, et saate SAS-i käitada mis tahes operatsioonisüsteemis, kas Linuxis või Windows.

Võrreldes teiste andmetega BI tööriistad, pakub SAS lisaks pukseerimisliidese kasutamisele ulatuslikku tuge andmete programmiliseks teisendamiseks ja analüüsimiseks. See annab väga üksikasjaliku kontrolli andmete manipuleerimise ja analüüside üle, mis on selle USP.

Miks me vajame SAS-i?

Mõistame SAS-i vajadust lihtsa näitega:

Mõelge e-kaubandusega tegelevale ettevõttele, kes soovib ajalooliste andmete põhjal teada oma klientide ostumustreid. Üldise ülevaate saamiseks peab ettevõte arvestama tuhandete kirjetega mitme kliendi kohta.

Ettevõttel ei pruugi olla kõiki neid analüüsiks vajalikke andmeid. Näiteks kui klient ei ostnud jopet, siis millised on tegurid, mis takistasid tal jopet ostmata jätta? Need puuduvad andmed võivad teie analüüsis vigu tekitada. Kuidas saaksime neist probleemidest lahti saada? Kuidas me saame seda tüüpi andmeid käsitleda?

Kui seda tehakse käsitsi, nõuab see ülesanne sadu analüütikuid ja tuhandeid töötunde. SAS-i analüüsitööriista kasutades saate ühe analüütikuga sama analüüsi teha mõne tunniga. SAS-i tööriist võimaldab teil eemaldada mittevajalikud andmed ja optimeerida asjakohast teavet. See võimaldab teil tulemust ennustada isegi puuduvate andmete korral. SAS võimaldab teil teha paremaid otsuseid.

Alternatiivsed SAS-i tööriistad

Alternatiivsed SAS-i tööriistad

R: See on avatud lähtekoodiga tarkvara. R-i on lihtne õppida, kuna see on hästi dokumenteeritud. See pakub tugevaid statistilisi võimalusi.

Python on teine ​​populaarne avatud lähtekoodiga skriptikeel. See toetab selliseid teeke nagu Numpy, Scipy ja MatPlotLib. Saate teha mis tahes statistilisi toiminguid või luua nende teekide abil mis tahes mudeli.

SAS: See on kommertsanalüüsi turul laialdaselt kasutatav analüütiline tööriist. Paljude statistiliste funktsioonide ja hea GUI-ga.

Selles SAS-i programmeerimisõpetuses käsitleme statistilisi analüütilisi süsteeme ja seda, kuidas seda meie probleemide lahendamiseks kasutada.

SAS-i ajalugu

  • SAS-i töötasid välja Jim Goodnight ja John Shall 1970. aastal NC ülikoolis
  • Algselt töötati see välja põllumajandusuuringute jaoks.
  • Later, laienes see paljudele tööriistadele, hõlmates muu hulgas ennustavat analüüsi, andmehaldust ja BI.
  • Tänapäeval kasutavad 98 maailma suurimat ettevõtet grupis Fortune 400 SASi andmeanalüüsi tööriista Andmete analüüs.

Järgmisena selles SAS-i keeleõpetuses tutvume SAS-i funktsioonidega.

SAS-i funktsioonid

SAS-i põhifunktsioonid on järgmised:

  • Juurdepääs välisest andmebaasist toorandmete failidele ja andmetele hõlpsasti juurde. Lugege ja kirjutage peaaegu igas andmevormingus!
  • Hallake andmeid andmete sisestamise, redigeerimise, vormindamise ja teisendamise tööriistade abil
  • Andmete analüüsimine kirjeldavate, statistika, mitme muutujaga tehnikate, prognoosimise, modelleerimise, lineaarse programmeerimise abil
  • Täiustatud analüütika aitab teil äritavas muuta ja täiustada.
  • Aruande koostamine täiuslike graafikutega
  • Operateadusuuringud ja projektijuhtimine
  • Andmete uuendamine ja muutmine
  • Võimas andmetöötluskeel
  • Suurepärased andmete puhastamise funktsioonid
  • Suhelge mitme hostisüsteemiga

Järgmisena selles SAS-i algajatele õpetuses tutvustame SAS-i tootekomplekti.

SAS tootekomplekt

Turul on saadaval palju SAS-i tooteid. Allpool on nimekiri populaarsematest.

Nimi Kirjeldus
Base SAS Base SAS tarkvara pakub riistvaralist paindlikkust ja integreerub igasugustesse arvutuskeskkondadesse.
SAS/GRAAFIK See tööriist aitab teil esitada struktureeritud andmeid graafikutena.
SAS/STAT See tööriist aitab teil teha erinevat tüüpi regressiooni, statistilise analüüsi dispersioon, regressioon ja psühhomeetriline analüüs.
SAS/ETS Seda kasutatakse prognoosimiseks. Aitab teil aegridade analüüsi teha.
SAS/IML Interaktiivne maatriksi keel on tuntud kui IML. See tööriist aitab teil tõlkida matemaatilisi valemeid uuenduslikuks programmiks.
SAS EBI Tööriist äriteabe rakenduste jaoks
SASi võrguhaldur See on põhikomponent, mis pakub andmehaldusvõimalust ja programmeerimiskeelt andmete analüüsimiseks
SAS/VÕI Tööriist Operateadusuuringud
SAS/QC Kasutage kvaliteedikontrolliks
SAS/Enterprise Miner Andmete kaevandamine
SAS/PH Kliinilise uuringu analüüs
SAS/AF See pakub rakendusvõimalusi
Ettevõtlusjuhend See on GUI-põhine koodiredaktor ja projektijuht

Järgmisena selles SAS-i õpetuste juhendis tutvume SAS-i arhitektuuriga.

SAS Architektuur

SAS Architektuur
ArchiSASi struktuur

SAS-i arhitektuur jaguneb peamiselt kolmeks osaks:

  • Klienditasand
  • Keskastme
  • Tagumine aste

Klienditasand

Klienditasand on koht, kus rakendus installitakse masinasse, kus kasutaja istub. See koosneb komponentidest, mida kasutatakse portaali ja selle sisu vaatamiseks. See sisaldab ka standardset veebibrauserit, mida kasutatakse portaaliga suhtlemiseks standardse HTTP- või HTTPS-protokolli kaudu. Samuti aitab see teil muuta SAS-i veebirakenduse tulemüürisõbralikuks.

Keskmine tasand

Keskmine tasand pakub ettevõtte teabe jaoks tsentraliseeritud pääsupunkti. Kogu juurdepääsu sisule töötlevad sellel tasemel töötavad komponendid. Äriloogika eraldamine kuvaloogikast aitab teil kasutada keskmise tasandi loogikat. Lisaks hõlbustavad tsentraliseeritud juurdepääsupunktid turvareeglite jõustamist, portaali haldamist ja koodimuudatuste haldamist.

Keskmine tasand sisaldab järgmisi funktsioone:

SAS-i teabeedastusportaali veebirakendus: See on JSP kogu, Java servletid, JavaOad ja muud klassid ja ressursid. Need komponendid aitavad teil pääseda juurde ettevõtte kataloogi salvestatud teabele, et luua kasutajale kohandatav liides.

Servleti mootor: Servleti mootorit nimetatakse ka servleti konteineriks. See vastutab SAS-i teabeedastusportaali veebirakenduse haldamise eest. Servleti mootor pakub tööaja keskkonda. See pakub samaaegsust, juurutamist, elutsükli haldamist jne.

Veebiserver: Veebiserver pakub teenust servletimootori jaoks, mida saab kasutada veebisaidi majutamiseks. Sellele tuleks juurde pääseda portaali kaudu.

Tagumine tase

Tagumine tase on ala, kus töötavad andme- ja arvutusserverid, mis võivad sisaldada äriobjekte. See on ettevõtte kataloogiserver. Ettevõtte kataloogiserver säilitab metaandmeid sisu kohta, mis asub kogu ettevõttes.

Kuidas SAS-i alla laadida ja installida

Kohalik allalaadimine teie masinasse

Samm 1) Laadige SAS alla antud lingilt

Minge sellele lingile https://www.sas.com/en_in/software/university-edition.html ja klõpsake nuppu Hangi tasuta tarkvara.

Laadige alla ja installige SAS

Samm 2) Valige oma Operating System

Valige oma süsteemile vastav operatsioonisüsteem.

Laadige alla ja installige SAS

Samm 3) Laadige alla ja installige virtualiseerimistarkvara

SAS nõuab virtualiseerimistarkvara nagu VirtualBox tuleb paigaldada enne selle paigaldamist. Siin on üksikasjalikud sammud

Laadige alla ja installige SAS

Järgige SAS-i installimiseks ekraanil mainitud samme. Võttes VirtualBox ja kohalik installimine võib mõnikord olla keeruline. Soovitame AWS-i installida

AWS-i installimine

Saate SAS-i juurutada AWS-is. See on sobilik tasuta tasemele.

Step 1) Minna https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klõpsake nuppu "Jätka tellimist"

Laadige alla ja installige SAS

Step 2) Järgmisel kuval Nõustu tingimustega.

Laadige alla ja installige SAS

Step 3) Tellimuse kinnitamiseks kulub kuni 10 minutit. Näete järgmist ekraani.

Laadige alla ja installige SAS

Step 4) Värskendage lehte ja tellimus kinnitatakse. Klõpsake nuppu Jätka konfiguratsiooni

Laadige alla ja installige SAS

Step 5) Jätke sätted vaikeseadeteks ja klõpsake nuppu Jätka käivitamiseks.

Laadige alla ja installige SAS

Step 6) Revvaata konfiguratsioonilehte. Sisestage võtme-väärtuse paar. Puhkeseaded peaksid olema vaikeseaded. Klõpsake nuppu Käivita

Laadige alla ja installige SAS

Step 7) Minna https://aws.amazon.com/marketplace/library/ ja klõpsake nuppu Vaata eksemplare.

Laadige alla ja installige SAS

Step 8) Hüpikaknas

  1. Pange tähele eksemplari ID-d. See on teie parool
  2. Klõpsake valikul Juurdepääs tarkvarale

Laadige alla ja installige SAS

Step 9) Hüpikaknas, mis kuvatakse pärast 8. sammus klõpsamist

  1. Sisestage kasutaja mandaadid. Id: sasdemo parool: 8. sammus märgitud eksemplari ID
  2. Klõpsake nuppu Logi sisse

Laadige alla ja installige SAS

Step 10) Näete tervituskuva.

Laadige alla ja installige SAS

Probleemid

Kui te ei saa ühendust luua, minge aadressile https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ja sissetuleva/väljamineva reeglid kõigile

Kuidas SAS-i kasutada?

SAS-i tarkvara tõhusaks kasutamiseks peate järgima nelja sammu, mis on: juurdepääsuandmetele, haldusandmetele, analüüsimisele, esitamisele.

Kuidas SAS-i kasutada
Kuidas SAS-i kasutada

Juurdepääsuandmed:

SAS võimaldab juurdepääsu andmetele mis tahes soovitud vormingus.

Saate juurdepääsu andmetele, mis on salvestatud kõikjal, olgu need siis teie süsteemi failis või mõnes teises andmebaasisüsteemis salvestatud andmetel. See võib olla oracle'i fail, SAS-i andmebaasifail, töötlemata andmebaasi fail või lihtne XLS / CSV-fail. See aitab teil nendele andmetele hõlpsasti juurde pääseda.

Andmete haldamine:

SAS pakub suurepäraseid andmehaldusvõimalusi. Saate andmeid teatud tingimustel alamhulgaks jagada/tükeldada, luua muutujaid, andmeid puhastada ja kinnitada. On ka teisi tööriistu, mis võimaldavad teil sama ülesannet täita. Kuid SAS aitab teil seda tööd hõlpsalt täita.

SAS-il on täpselt määratletud teegid ja protsessid, mis muudavad programmeerimisprotsessi lihtsaks. Lisaks on muutuja- või alamhulgaandmete loomine vaid üks samm. See säästab teid keerukate algoritmide kirjutamisest vaid ühe koodireaga.

Analüüsige:

SAS-i abil saate teha erinevat tüüpi analüüse:

  • See kontrollib keskmise arvutamise sagedust
  • Regressioon ja prognoosimine
  • Otsustuspuu

SAS saab kõiki neid analüüse hõlpsasti hallata. See on parim vahend täpseks prognoosimiseks.

Kohal:

Kui visualiseerite andmeid õigesti, on vaatajaskonnal lihtne nendega seostada. On oluline, et teie tööriist esitaks andmed sobival viisil. Seda SAS teie heaks teeb. Sellel on suurepärased esitlusvõimalused.

Te saate:

1. Loetle aruanded

2. Kokkuvõtvad aruanded

3. Graafiku aruanded

4. Printige aruanded

SAS-i programmi näide

SAS-i programm koosneb kolmest vajalikust etapist:

  • Andmete samm
  • Protsessi samm
  • Väljundi samm

ANDMED Samm

Andmete samm laadib vajaliku andmestiku SAS-i mällu ja leiab andmekogumi õiged muutujad. See jäädvustab ka rekordeid. Saame kasutada andmesamme selleks, et:

  • Sisestage andmed SAS-i andmekogumitesse
  • Väärtuste arvutamine
  • Kontrollige või parandage andmeid
  • Looge uusi andmekogumeid

DATA avalduse süntaks on:

Süntaks

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Näide:

Järgmises näites on näidatud, kuidas defineerida muutujat, nimetada andmekogum, luua uusi muutujaid ja sisestada andmeid. Selles näites näete, et stringimuutuja lõpus on $ ja arvväärtused on ilma selleta.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Märkus. SAS-i avalduse käivitamiseks tuleb määrata käsk RUN.

PROC-etapp

See teostab tulemuste ja aruannete koostamiseks spetsiifilisi analüüse või funktsioone.

Süntaks

PROC procedure_name options; #The name of the proc.
RUN;

Näide

Toodud näites kasutatakse TÄHENDAB protseduur andmekogus olevate arvmuutujate keskmiste väärtuste printimiseks.

PROC MEANS;
RUN;

VÄLJUNDI samm

Saate kuvada andmetest andmeid tingimuslike väljundlausetega.

Süntaks

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Iga SAS-i programm peab sisendandmete lugemiseks, andmete analüüsimiseks ja analüüsi väljundi andmiseks järgima kõiki ülaltoodud samme. The RUN avaldus iga sammu lõpus lõpetab selle sammu täitmise.

Täielik SAS-i programm

Allpool on toodud iga ülaltoodud sammu täielik kood.

Täielik SAS-i programm

Väljund:

Täielik SAS-i programm

Täielik SAS-i programm

Täielik SAS-i programm

Kus SAS-i kasutatakse?

Allpool on toodud mõned olulised SAS-i rakendused:

Tööstus Kasutus
Pharmaceutical Statistiline analüüs, aruandlus
Telecom ETL, aruandlus, andmekaeve, prognoosimine
Financials ETL, aruandlus, andmekaeve, finantsuuringud
Ennustav modelleerimine DBMarketing, tegevuspõhine juhtimine
Tervishoid ETL, aruandlus, andmekaeve

SAS vs. R

SAS R
SAS on kommertstarkvara, seega nõuab see rahalist investeeringut. R on avatud lähtekoodiga tarkvara. Seetõttu saab seda kasutada igaüks.
SAS on lihtsaim analüütiline tööriist, mida õppida. Isegi piiratud SQL-i teadmistega inimesed saavad selle kiiresti selgeks. R nõuab keeruliste ja pikkade koodide kirjutamist.
SAS on suurettevõtete eelistatud valik ning tehniliselt üsna arenenud ja kasutajasõbralik. R on kiiresti arenev tarkvara; aga peate seda pidevalt täiendama.
SAS-il on hea graafiline tugi, kuid see ei paku kohandamist. R-tööriista graafiline tugi on väga halb.

SAS-i eelised

  • SAS-il on lihtne süntaks, mida saab õppida ilma igasuguste programmeerimisalaste teadmisteta
  • Võimalus hõlpsalt hallata suurt andmebaasi
  • SAS on väga arusaadav keel, mida saab hõlpsasti siluda
  • Selle "logi" aknas on selgelt kirjas viga, mis aitab teil koodi hõlpsalt siluda
  • SAS aitab teil algoritmi põhjalikult testida ja analüüsida
  • SAS on täielikult kaitstud, nii et te ei saa kontoris litsentsi välja võtta
  • Muudab statistilise andmetöötluse mitteprogrammeerivate kasutajate jaoks lihtsamaks
  • Käsitseb tõhusalt suurt andmebaasi.

SAS-i miinused

  • Kulud on suured, kuna üksikisik või organisatsioon ei saa ilma nõuetekohase litsentsita kõiki rakendusi kasutada
  • SAS ei ole avatud lähtekoodiga, seega pole SAS-is kasutatavad algoritmid tavaliseks kasutamiseks saadaval
  • Teksti kaevandamine on SAS-is väga tülikas ja keeruline protsess.

kokkuvõte

  • SAS-tarkvara, mis tähendab statistilise analüüsi tarkvara, mida kasutatakse andmeanalüütika jaoks
  • R ja Python on kaks laialdaselt kasutatavat SAS-i alternatiivset tööriista.
  • SAS-i töötasid välja Jim Goodnight ja John Shall 1970. aastal NC ülikoolis
  • SAS võimaldab teil pääseda juurde töötlemata andmefailidele ja andmetele mis tahes tüüpi välises andmebaasis
  • SAS-i arhitektuur jaguneb peamiselt kolmeks osaks: 1) Klienditasand 2) Keskmine tasand 3) Tagumine tasand
  • SAS-i tarkvara kasutamiseks peate järgima nelja sammu, mis on: 1) juurdepääs andmetele, 2) haldamine 3) andmete analüüsimine, 4) esitlus
  • SAS-i programm koosneb kolmest põhietapist: Data Step, Proc Step ja Output Step
  • SAS andmeanalüüsi tööriist kasutatakse laialdaselt sellistes sektorites nagu farmaatsia, telekommunikatsioon, finantssektor, ennustav modelleerimine ja tervishoid
  • SAS on kommertstarkvara, samas kui R on avatud lähtekoodiga tarkvara
  • SAS-i programmeerija tööriista suurim eelis on see, et sellel on lihtne süntaks, mida saab õppida ilma igasuguste programmeerimisalaste teadmisteta.
  • SAS-i mudeli üks puudusi on see, et see ei ole avatud lähtekoodiga tööriist. Seega pole SAS-i protseduurides kasutatavad algoritmid tavaliseks kasutamiseks saadaval.