SAS-i õpetus algajatele: mis on ja programmeerimise näide
Mis on SAS?
SAS on käsupõhine statistikatarkvarakomplekt, mida kasutatakse laialdaselt statistiliste andmete analüüsiks ja visualiseerimiseks. SAS-i täisvorm on statistilise analüüsi tarkvara. See võimaldab teil kasutada kvalitatiivseid tehnikaid ja protsesse, mis aitavad teil tõsta töötajate tootlikkust ja ärikasumit. SAS-i kasutatakse ka täiustatud analüütika jaoks, nagu äriteave, kuritegevuse uurimine ja ennustav analüüs. SAS-i hääldatakse kui "SaaS".
SAS-is ekstraheeritakse ja kategoriseeritakse andmed, mis aitab teil andmemustreid tuvastada ja analüüsida. See on tarkvarakomplekt, mis võimaldab teil teostada täiustatud analüüsi, ärianalüüsi, ennustavat analüüsi ja andmehaldust, et tõhusalt tegutseda konkurentsis ja muutuvates äritingimustes. Lisaks on SAS platvormist sõltumatu, mis tähendab, et saate SAS-i käitada mis tahes operatsioonisüsteemis, kas Linuxis või Windows.
Võrreldes teiste andmetega BI tööriistad, pakub SAS lisaks pukseerimisliidese kasutamisele ulatuslikku tuge andmete programmiliseks teisendamiseks ja analüüsimiseks. See annab väga üksikasjaliku kontrolli andmete manipuleerimise ja analüüside üle, mis on selle USP.
Miks me vajame SAS-i?
Mõistame SAS-i vajadust lihtsa näitega:
Mõelge e-kaubandusega tegelevale ettevõttele, kes soovib ajalooliste andmete põhjal teada oma klientide ostumustreid. Üldise ülevaate saamiseks peab ettevõte arvestama tuhandete kirjetega mitme kliendi kohta.
Ettevõttel ei pruugi olla kõiki neid analüüsiks vajalikke andmeid. Näiteks kui klient ei ostnud jopet, siis millised on tegurid, mis takistasid tal jopet ostmata jätta? Need puuduvad andmed võivad teie analüüsis vigu tekitada. Kuidas saaksime neist probleemidest lahti saada? Kuidas me saame seda tüüpi andmeid käsitleda?
Kui seda tehakse käsitsi, nõuab see ülesanne sadu analüütikuid ja tuhandeid töötunde. SAS-i analüüsitööriista kasutades saate ühe analüütikuga sama analüüsi teha mõne tunniga. SAS-i tööriist võimaldab teil eemaldada mittevajalikud andmed ja optimeerida asjakohast teavet. See võimaldab teil tulemust ennustada isegi puuduvate andmete korral. SAS võimaldab teil teha paremaid otsuseid.
Alternatiivsed SAS-i tööriistad
R: See on avatud lähtekoodiga tarkvara. R-i on lihtne õppida, kuna see on hästi dokumenteeritud. See pakub tugevaid statistilisi võimalusi.
Python on teine populaarne avatud lähtekoodiga skriptikeel. See toetab selliseid teeke nagu Numpy, Scipy ja MatPlotLib. Saate teha mis tahes statistilisi toiminguid või luua nende teekide abil mis tahes mudeli.
SAS: See on kommertsanalüüsi turul laialdaselt kasutatav analüütiline tööriist. Paljude statistiliste funktsioonide ja hea GUI-ga.
Selles SAS-i programmeerimisõpetuses käsitleme statistilisi analüütilisi süsteeme ja seda, kuidas seda meie probleemide lahendamiseks kasutada.
SAS-i ajalugu
- SAS-i töötasid välja Jim Goodnight ja John Shall 1970. aastal NC ülikoolis
- Algselt töötati see välja põllumajandusuuringute jaoks.
- Later, laienes see paljudele tööriistadele, hõlmates muu hulgas ennustavat analüüsi, andmehaldust ja BI.
- Tänapäeval kasutavad 98 maailma suurimat ettevõtet grupis Fortune 400 SASi andmeanalüüsi tööriista Andmete analüüs.
Järgmisena selles SAS-i keeleõpetuses tutvume SAS-i funktsioonidega.
SAS-i funktsioonid
SAS-i põhifunktsioonid on järgmised:
- Juurdepääs välisest andmebaasist toorandmete failidele ja andmetele hõlpsasti juurde. Lugege ja kirjutage peaaegu igas andmevormingus!
- Hallake andmeid andmete sisestamise, redigeerimise, vormindamise ja teisendamise tööriistade abil
- Andmete analüüsimine kirjeldavate, statistika, mitme muutujaga tehnikate, prognoosimise, modelleerimise, lineaarse programmeerimise abil
- Täiustatud analüütika aitab teil äritavas muuta ja täiustada.
- Aruande koostamine täiuslike graafikutega
- Operateadusuuringud ja projektijuhtimine
- Andmete uuendamine ja muutmine
- Võimas andmetöötluskeel
- Suurepärased andmete puhastamise funktsioonid
- Suhelge mitme hostisüsteemiga
Järgmisena selles SAS-i algajatele õpetuses tutvustame SAS-i tootekomplekti.
SAS tootekomplekt
Turul on saadaval palju SAS-i tooteid. Allpool on nimekiri populaarsematest.
Nimi | Kirjeldus |
---|---|
Base SAS | Base SAS tarkvara pakub riistvaralist paindlikkust ja integreerub igasugustesse arvutuskeskkondadesse. |
SAS/GRAAFIK | See tööriist aitab teil esitada struktureeritud andmeid graafikutena. |
SAS/STAT | See tööriist aitab teil teha erinevat tüüpi regressiooni, statistilise analüüsi dispersioon, regressioon ja psühhomeetriline analüüs. |
SAS/ETS | Seda kasutatakse prognoosimiseks. Aitab teil aegridade analüüsi teha. |
SAS/IML | Interaktiivne maatriksi keel on tuntud kui IML. See tööriist aitab teil tõlkida matemaatilisi valemeid uuenduslikuks programmiks. |
SAS EBI | Tööriist äriteabe rakenduste jaoks |
SASi võrguhaldur | See on põhikomponent, mis pakub andmehaldusvõimalust ja programmeerimiskeelt andmete analüüsimiseks |
SAS/VÕI | Tööriist Operateadusuuringud |
SAS/QC | Kasutage kvaliteedikontrolliks |
SAS/Enterprise Miner | Andmete kaevandamine |
SAS/PH | Kliinilise uuringu analüüs |
SAS/AF | See pakub rakendusvõimalusi |
Ettevõtlusjuhend | See on GUI-põhine koodiredaktor ja projektijuht |
Järgmisena selles SAS-i õpetuste juhendis tutvume SAS-i arhitektuuriga.
SAS Architektuur
SAS-i arhitektuur jaguneb peamiselt kolmeks osaks:
- Klienditasand
- Keskastme
- Tagumine aste
Klienditasand
Klienditasand on koht, kus rakendus installitakse masinasse, kus kasutaja istub. See koosneb komponentidest, mida kasutatakse portaali ja selle sisu vaatamiseks. See sisaldab ka standardset veebibrauserit, mida kasutatakse portaaliga suhtlemiseks standardse HTTP- või HTTPS-protokolli kaudu. Samuti aitab see teil muuta SAS-i veebirakenduse tulemüürisõbralikuks.
Keskmine tasand
Keskmine tasand pakub ettevõtte teabe jaoks tsentraliseeritud pääsupunkti. Kogu juurdepääsu sisule töötlevad sellel tasemel töötavad komponendid. Äriloogika eraldamine kuvaloogikast aitab teil kasutada keskmise tasandi loogikat. Lisaks hõlbustavad tsentraliseeritud juurdepääsupunktid turvareeglite jõustamist, portaali haldamist ja koodimuudatuste haldamist.
Keskmine tasand sisaldab järgmisi funktsioone:
SAS-i teabeedastusportaali veebirakendus: See on JSP kogu, Java servletid, JavaOad ja muud klassid ja ressursid. Need komponendid aitavad teil pääseda juurde ettevõtte kataloogi salvestatud teabele, et luua kasutajale kohandatav liides.
Servleti mootor: Servleti mootorit nimetatakse ka servleti konteineriks. See vastutab SAS-i teabeedastusportaali veebirakenduse haldamise eest. Servleti mootor pakub tööaja keskkonda. See pakub samaaegsust, juurutamist, elutsükli haldamist jne.
Veebiserver: Veebiserver pakub teenust servletimootori jaoks, mida saab kasutada veebisaidi majutamiseks. Sellele tuleks juurde pääseda portaali kaudu.
Tagumine tase
Tagumine tase on ala, kus töötavad andme- ja arvutusserverid, mis võivad sisaldada äriobjekte. See on ettevõtte kataloogiserver. Ettevõtte kataloogiserver säilitab metaandmeid sisu kohta, mis asub kogu ettevõttes.
Kuidas SAS-i alla laadida ja installida
Kohalik allalaadimine teie masinasse
Samm 1) Laadige SAS alla antud lingilt
Minge sellele lingile https://www.sas.com/en_in/software/university-edition.html ja klõpsake nuppu Hangi tasuta tarkvara.
Samm 2) Valige oma Operating System
Valige oma süsteemile vastav operatsioonisüsteem.
Samm 3) Laadige alla ja installige virtualiseerimistarkvara
SAS nõuab virtualiseerimistarkvara nagu VirtualBox tuleb paigaldada enne selle paigaldamist. Siin on üksikasjalikud sammud
Järgige SAS-i installimiseks ekraanil mainitud samme. Võttes VirtualBox ja kohalik installimine võib mõnikord olla keeruline. Soovitame AWS-i installida
AWS-i installimine
Saate SAS-i juurutada AWS-is. See on sobilik tasuta tasemele.
Step 1) Minna https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klõpsake nuppu "Jätka tellimist"
Step 2) Järgmisel kuval Nõustu tingimustega.
Step 3) Tellimuse kinnitamiseks kulub kuni 10 minutit. Näete järgmist ekraani.
Step 4) Värskendage lehte ja tellimus kinnitatakse. Klõpsake nuppu Jätka konfiguratsiooni
Step 5) Jätke sätted vaikeseadeteks ja klõpsake nuppu Jätka käivitamiseks.
Step 6) Revvaata konfiguratsioonilehte. Sisestage võtme-väärtuse paar. Puhkeseaded peaksid olema vaikeseaded. Klõpsake nuppu Käivita
Step 7) Minna https://aws.amazon.com/marketplace/library/ ja klõpsake nuppu Vaata eksemplare.
Step 8) Hüpikaknas
- Pange tähele eksemplari ID-d. See on teie parool
- Klõpsake valikul Juurdepääs tarkvarale
Step 9) Hüpikaknas, mis kuvatakse pärast 8. sammus klõpsamist
- Sisestage kasutaja mandaadid. Id: sasdemo parool: 8. sammus märgitud eksemplari ID
- Klõpsake nuppu Logi sisse
Step 10) Näete tervituskuva.
Probleemid
Kui te ei saa ühendust luua, minge aadressile https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ja sissetuleva/väljamineva reeglid kõigile
Kuidas SAS-i kasutada?
SAS-i tarkvara tõhusaks kasutamiseks peate järgima nelja sammu, mis on: juurdepääsuandmetele, haldusandmetele, analüüsimisele, esitamisele.
Juurdepääsuandmed:
SAS võimaldab juurdepääsu andmetele mis tahes soovitud vormingus.
Saate juurdepääsu andmetele, mis on salvestatud kõikjal, olgu need siis teie süsteemi failis või mõnes teises andmebaasisüsteemis salvestatud andmetel. See võib olla oracle'i fail, SAS-i andmebaasifail, töötlemata andmebaasi fail või lihtne XLS / CSV-fail. See aitab teil nendele andmetele hõlpsasti juurde pääseda.
Andmete haldamine:
SAS pakub suurepäraseid andmehaldusvõimalusi. Saate andmeid teatud tingimustel alamhulgaks jagada/tükeldada, luua muutujaid, andmeid puhastada ja kinnitada. On ka teisi tööriistu, mis võimaldavad teil sama ülesannet täita. Kuid SAS aitab teil seda tööd hõlpsalt täita.
SAS-il on täpselt määratletud teegid ja protsessid, mis muudavad programmeerimisprotsessi lihtsaks. Lisaks on muutuja- või alamhulgaandmete loomine vaid üks samm. See säästab teid keerukate algoritmide kirjutamisest vaid ühe koodireaga.
Analüüsige:
SAS-i abil saate teha erinevat tüüpi analüüse:
- See kontrollib keskmise arvutamise sagedust
- Regressioon ja prognoosimine
- Otsustuspuu
SAS saab kõiki neid analüüse hõlpsasti hallata. See on parim vahend täpseks prognoosimiseks.
Kohal:
Kui visualiseerite andmeid õigesti, on vaatajaskonnal lihtne nendega seostada. On oluline, et teie tööriist esitaks andmed sobival viisil. Seda SAS teie heaks teeb. Sellel on suurepärased esitlusvõimalused.
Te saate:
1. Loetle aruanded
2. Kokkuvõtvad aruanded
3. Graafiku aruanded
4. Printige aruanded
SAS-i programmi näide
SAS-i programm koosneb kolmest vajalikust etapist:
- Andmete samm
- Protsessi samm
- Väljundi samm
ANDMED Samm
Andmete samm laadib vajaliku andmestiku SAS-i mällu ja leiab andmekogumi õiged muutujad. See jäädvustab ka rekordeid. Saame kasutada andmesamme selleks, et:
- Sisestage andmed SAS-i andmekogumitesse
- Väärtuste arvutamine
- Kontrollige või parandage andmeid
- Looge uusi andmekogumeid
DATA avalduse süntaks on:
Süntaks
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Näide:
Järgmises näites on näidatud, kuidas defineerida muutujat, nimetada andmekogum, luua uusi muutujaid ja sisestada andmeid. Selles näites näete, et stringimuutuja lõpus on $ ja arvväärtused on ilma selleta.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Märkus. SAS-i avalduse käivitamiseks tuleb määrata käsk RUN.
PROC-etapp
See teostab tulemuste ja aruannete koostamiseks spetsiifilisi analüüse või funktsioone.
Süntaks
PROC procedure_name options; #The name of the proc. RUN;
Näide
Toodud näites kasutatakse TÄHENDAB protseduur andmekogus olevate arvmuutujate keskmiste väärtuste printimiseks.
PROC MEANS; RUN;
VÄLJUNDI samm
Saate kuvada andmetest andmeid tingimuslike väljundlausetega.
Süntaks
PROC PRINT DATA = data_set; OPTIONS; RUN;
Iga SAS-i programm peab sisendandmete lugemiseks, andmete analüüsimiseks ja analüüsi väljundi andmiseks järgima kõiki ülaltoodud samme. The RUN avaldus iga sammu lõpus lõpetab selle sammu täitmise.
Täielik SAS-i programm
Allpool on toodud iga ülaltoodud sammu täielik kood.
Väljund:
Kus SAS-i kasutatakse?
Allpool on toodud mõned olulised SAS-i rakendused:
Tööstus | Kasutus |
---|---|
Pharmaceutical | Statistiline analüüs, aruandlus |
Telecom | ETL, aruandlus, andmekaeve, prognoosimine |
Financials | ETL, aruandlus, andmekaeve, finantsuuringud |
Ennustav modelleerimine | DBMarketing, tegevuspõhine juhtimine |
Tervishoid | ETL, aruandlus, andmekaeve |
SAS vs. R
SAS | R |
---|---|
SAS on kommertstarkvara, seega nõuab see rahalist investeeringut. | R on avatud lähtekoodiga tarkvara. Seetõttu saab seda kasutada igaüks. |
SAS on lihtsaim analüütiline tööriist, mida õppida. Isegi piiratud SQL-i teadmistega inimesed saavad selle kiiresti selgeks. | R nõuab keeruliste ja pikkade koodide kirjutamist. |
SAS on suurettevõtete eelistatud valik ning tehniliselt üsna arenenud ja kasutajasõbralik. | R on kiiresti arenev tarkvara; aga peate seda pidevalt täiendama. |
SAS-il on hea graafiline tugi, kuid see ei paku kohandamist. | R-tööriista graafiline tugi on väga halb. |
SAS-i eelised
- SAS-il on lihtne süntaks, mida saab õppida ilma igasuguste programmeerimisalaste teadmisteta
- Võimalus hõlpsalt hallata suurt andmebaasi
- SAS on väga arusaadav keel, mida saab hõlpsasti siluda
- Selle "logi" aknas on selgelt kirjas viga, mis aitab teil koodi hõlpsalt siluda
- SAS aitab teil algoritmi põhjalikult testida ja analüüsida
- SAS on täielikult kaitstud, nii et te ei saa kontoris litsentsi välja võtta
- Muudab statistilise andmetöötluse mitteprogrammeerivate kasutajate jaoks lihtsamaks
- Käsitseb tõhusalt suurt andmebaasi.
SAS-i miinused
- Kulud on suured, kuna üksikisik või organisatsioon ei saa ilma nõuetekohase litsentsita kõiki rakendusi kasutada
- SAS ei ole avatud lähtekoodiga, seega pole SAS-is kasutatavad algoritmid tavaliseks kasutamiseks saadaval
- Teksti kaevandamine on SAS-is väga tülikas ja keeruline protsess.
kokkuvõte
- SAS-tarkvara, mis tähendab statistilise analüüsi tarkvara, mida kasutatakse andmeanalüütika jaoks
- R ja Python on kaks laialdaselt kasutatavat SAS-i alternatiivset tööriista.
- SAS-i töötasid välja Jim Goodnight ja John Shall 1970. aastal NC ülikoolis
- SAS võimaldab teil pääseda juurde töötlemata andmefailidele ja andmetele mis tahes tüüpi välises andmebaasis
- SAS-i arhitektuur jaguneb peamiselt kolmeks osaks: 1) Klienditasand 2) Keskmine tasand 3) Tagumine tasand
- SAS-i tarkvara kasutamiseks peate järgima nelja sammu, mis on: 1) juurdepääs andmetele, 2) haldamine 3) andmete analüüsimine, 4) esitlus
- SAS-i programm koosneb kolmest põhietapist: Data Step, Proc Step ja Output Step
- SAS andmeanalüüsi tööriist kasutatakse laialdaselt sellistes sektorites nagu farmaatsia, telekommunikatsioon, finantssektor, ennustav modelleerimine ja tervishoid
- SAS on kommertstarkvara, samas kui R on avatud lähtekoodiga tarkvara
- SAS-i programmeerija tööriista suurim eelis on see, et sellel on lihtne süntaks, mida saab õppida ilma igasuguste programmeerimisalaste teadmisteta.
- SAS-i mudeli üks puudusi on see, et see ei ole avatud lähtekoodiga tööriist. Seega pole SAS-i protseduurides kasutatavad algoritmid tavaliseks kasutamiseks saadaval.