SAS oktatóanyag kezdőknek: Mi az és programozási példa
Mi az a SAS?
SAS egy parancsvezérelt statisztikai szoftvercsomag, amelyet széles körben használnak statisztikai adatok elemzésére és megjelenítésére. A SAS teljes formája a statisztikai elemző szoftver. Lehetővé teszi olyan kvalitatív technikák és folyamatok használatát, amelyek segítenek növelni az alkalmazottak termelékenységét és az üzleti nyereséget. A SAS-t olyan fejlett elemzésekhez is használják, mint az üzleti intelligencia, a bűnügyi nyomozás és a prediktív elemzés. A SAS-t "SaaS"-ként ejtik.
A SAS-ban az adatokat kivonják és kategorizálják, ami segít az adatminták azonosításában és elemzésében. Ez egy szoftvercsomag, amely lehetővé teszi fejlett elemzések, üzleti intelligencia, prediktív elemzések és adatkezelések végrehajtását, hogy hatékonyan működhessen a versenyképes és változó üzleti feltételek között. Ezenkívül a SAS platformfüggetlen, ami azt jelenti, hogy a SAS-t bármilyen operációs rendszeren futtathatja, akár Linuxon, akár Linuxon Windows.
Máshoz képest BI eszközökA SAS kiterjedt támogatást nyújt az adatok programozott átalakításához és elemzéséhez, a fogd és vidd felületen kívül. Ez nagyon részletes ellenőrzést biztosít az adatok manipulációja és elemzése felett, amely az USP.
Miért van szükségünk a SAS-ra?
Értsük meg a SAS szükségességét egy egyszerű példával:
Vegyünk egy e-kereskedelmi vállalatot, amely korábbi adatok alapján szeretné megismerni ügyfelei vásárlási szokásait. A vállalatnak több ezer ügyfél nyilvántartását kell figyelembe vennie, hogy általános betekintést nyerjen.
Előfordulhat, hogy a vállalat nem rendelkezik az elemzéshez szükséges összes adattal. Például, ha egy vásárló nem vett kabátot, akkor mik azok a tényezők, amelyek megakadályozták, hogy ne vegye meg a dzsekit? Ezek a hiányzó adatok hibákat okozhatnak az elemzésben. Hogyan lehet megszabadulni ezektől a problémáktól? Hogyan kezelhetjük az ilyen típusú adatokat?
Ha manuálisan hajtják végre, ez a feladat elemzők százait és több ezer munkaórát igényel. A SAS elemző eszköz használatával ugyanazt az elemzést néhány óra alatt elvégezheti egyetlen elemzővel. A SAS eszköz lehetővé teszi a felesleges adatok eltávolítását és a releváns információk optimalizálását. Lehetővé teszi az eredmény előrejelzését még hiányzó adatok esetén is. A SAS jobb döntések meghozatalát teszi lehetővé.
Alternatív SAS-eszközök
R: Ez egy nyílt forráskódú szoftver. Az R-t könnyű megtanulni, mivel jól dokumentált. Erős statisztikai képességeket kínál.
Python egy másik népszerű nyílt forráskódú szkriptnyelv. Támogatja az olyan könyvtárakat, mint a Numpy, Scipy és MatPlotLib. Bármilyen statisztikai műveletet végrehajthat, vagy bármilyen modellt készíthet ezeknek a függvénytáraknak a segítségével.
SAS: Ez a széles körben használt elemző eszköz a kereskedelmi elemzési piacon. Rengeteg statisztikai funkcióval és jó grafikus felhasználói felülettel.
Ebben a SAS programozási oktatóanyagban megvitatjuk a Statisztikai Analitikai Rendszereket, és azt, hogyan használhatók fel problémáink megoldására.
SAS története
- A SAS-t Jim Goodnight és John Shall fejlesztette ki 1970-ben az NC Egyetemen
- Kezdetben agrárkutatási célokra fejlesztették ki.
- Later, az eszközök skálájával bővült, beleértve többek között a prediktív elemzést, az adatkezelést és a BI-t.
- Napjainkban a világ 98-as legjelentősebb vállalatai közül 400 használ SAS adatelemző eszközt Adatelemzés.
Ebben a SAS nyelvi oktatóanyagban a következő lépésben a SAS szolgáltatásaival fogunk megismerkedni.
SAS funkciók
A SAS főbb jellemzői:
- Könnyen hozzáférhet nyers adatfájlokhoz és adatokhoz egy külső adatbázisból. Olvass és írj szinte bármilyen adatformátumot!
- Kezelje az adatokat adatbeviteli, szerkesztési, visszakeresési, formázási és átalakítási eszközökkel
- Adatok elemzése leíró, statisztikai, többváltozós technikák, előrejelzés, modellezés, lineáris programozás segítségével
- A fejlett analitika segít abban, hogy változtatásokat és fejlesztéseket hajtson végre az üzleti gyakorlatban.
- Jelentéskészítés tökéletes grafikonokkal
- Operakutatás és projektmenedzsment
- Adatok frissítése és módosítása
- Erőteljes adatkezelési nyelv
- Kiváló adattisztító funkciók
- Interakció több gazdagép rendszerrel
A következő SAS kezdőknek oktatóanyagban a SAS termékcsomagról fogunk tanulni.
SAS termékcsomag
Számos SAS termék kapható a piacon. Az alábbiakban felsoroljuk a legnépszerűbbeket.
Név | Leírás |
---|---|
Alap SAS | A Base SAS szoftver hardveres agilitást kínál, és mindenféle számítási környezetbe integrálható. |
SAS/GRAPH | Ez az eszköz segít a strukturált adatok grafikonokba történő megjelenítésében. |
SAS/STAT | Ez az eszköz segít különböző típusú regressziós, statisztikai variancia-, regressziós és pszichometriai elemzések végrehajtásában. |
SAS/ETS | Előrejelzésre használják. Segít az idősorelemzés végrehajtásában. |
SAS/IML | Az interaktív mátrix nyelv IML néven ismert. Ez az eszköz segít lefordítani a matematikai képleteket innovatív programmá. |
SAS EBI | Egy eszköz az üzleti intelligencia alkalmazásokhoz |
SAS Grid Manager | Ez egy alapvető összetevő, amely adatkezelési lehetőséget és programozási nyelvet kínál az adatok elemzéséhez |
SAS/OR | Szerszám Operaciós kutatás |
SAS/QC | Használja minőségellenőrzésre |
SAS/Enterprise Miner | Adatbányászat |
SAS/PH | Klinikai vizsgálat elemzése |
SAS/AF | Alkalmazási lehetőséget kínál |
Vállalati útmutató | Ez egy GUI alapú kódszerkesztő és projektmenedzser |
Ebben a SAS oktatóanyagban a következő lépésben a SAS architektúrával fogunk megismerkedni.
SAS Architectúra
A SAS architektúra alapvetően három részből áll:
- Ügyfélszint
- Középszint
- Hátsó szint
Ügyfélszint
A kliens réteg az, ahol az alkalmazás telepítve van egy gépre, ahol a felhasználó ül. A portál és annak tartalmának megtekintéséhez használt összetevőkből áll. Tartalmaz egy szabványos webböngészőt is, amely a portállal való interakcióra szolgál szabvány HTTP vagy HTTPS protokollon keresztül. Segít abban is, hogy a SAS webalkalmazást tűzfalbaráttá tegye.
középső szint
A középső szint központi hozzáférési pontot kínál a vállalati információkhoz. A tartalomhoz való minden hozzáférést az ezen a szinten működő összetevők dolgozzák fel. Az üzleti logika és a megjelenítési logika szétválasztása segít a középső szint logikájának kihasználásában. Ezenkívül a központosított hozzáférési pontok megkönnyítik a biztonsági szabályok betartatását, a portál adminisztrálását és a kódmódosítások kezelését.
A középső szint a következő funkciókat tartalmazza:
SAS információs portál webalkalmazása: Ez a JSP gyűjteménye, Java szervletek, JavaBab és más osztályok és források. Ezek az összetevők segítenek elérni a vállalati címtárban tárolt információkat, így személyre szabható felületet hozhat létre a felhasználó számára.
Servlet motor: A servlet motort servlet konténernek is nevezik. Felelős a SAS Information Delivery Portal webalkalmazásának kezeléséért. A szervlet motor futásidejű környezetet kínál. Biztosítja a párhuzamosságot, a telepítést, az életciklus-kezelést stb.
Web szerver: A webszerver szolgáltatást kínál a servlet motorhoz, amely webhely tárolására használható. Ezt a portálon keresztül kell elérni.
Hátsó szint
A hátsó réteg egy olyan terület, ahol az adat- és számítási szerverek futnak, és amely üzleti objektumokat tartalmazhat. Ez egy vállalati címtárszerver. A vállalati címtárszerver metaadatokat karbantart a vállalaton belüli tartalomról.
A SAS letöltése és telepítése
Helyi letöltés a gépeden
1. lépés) Töltse le a SAS-t a megadott linkről
Ugrás erre a linkre https://www.sas.com/en_in/software/university-edition.html és kattintson a Get Free Software lehetőségre.
2. lépés) Válassza ki Operating rendszer
Válassza ki az operációs rendszert a rendszerének megfelelően.
3. lépés) Töltse le és telepítse a virtualizációs szoftvert
A SAS-hoz hasonló virtualizációs szoftverre van szükség VirtualBox telepíteni kell, mielőtt telepíthető lenne. Itt vannak a részletes lépések
Kövesse a képernyőn említett lépéseket a SAS telepítéséhez. Miután VirtualBox és a helyi telepítés néha trükkös lehet. Az AWS telepítését javasoljuk
AWS telepítés
A SAS-t az AWS-ben telepítheti. Ingyenes szintre jogosult.
Step 1) Ugrás https://aws.amazon.com/marketplace/pp/B00WH10IKW. Kattintson a „Folytatás az előfizetésre” gombra
Step 2) Ezen a következő képernyőn válassza a Feltételek elfogadása lehetőséget.
Step 3) A függőben lévő előfizetés jóváhagyása legfeljebb 10 percet vesz igénybe. A következő képernyőt fogja látni.
Step 4) Frissítse az oldalt, és megerősíti a feliratkozást. Kattintson a Tovább a konfigurációhoz gombra
Step 5) Tartsa meg az alapértelmezett beállításokat, és kattintson a Folytatás az indításhoz gombra.
Step 6) Revnézze meg a konfigurációs oldalt. Adjon meg egy kulcs-érték párt. A pihenési beállításoknak az alapértelmezettnek kell lenniük. Kattintson az Indítás gombra
Step 7) Ugrás https://aws.amazon.com/marketplace/library/ és kattintson a Példányok megtekintése elemre.
Step 8) A felugró ablakban
- Jegyezze fel a példányazonosítót. Ez az ön jelszava
- Kattintson a Szoftver elérése elemre
Step 9) Az előugró ablakban, amely a 8. lépésben történő kattintás után jelenik meg
- Adja meg a felhasználói hitelesítő adatokat. Id: sasdemo jelszó: a 8. lépésben feljegyzett példányazonosító
- Kattintson a Bejelentkezés gombra
Step 10) Látni fogja az üdvözlő képernyőt.
Hibaelhárítás
Ha nem tud csatlakozni, lépjen a következőre: https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId és a bejövő/kimenő szabályokat mindenkinek
Hogyan használjuk a SAS-t?
A SAS-szoftver hatékony használatához négy lépést kell követnie, amelyek a következők: Adatok elérése, Kezelési adatok, Elemzés, Jelentés
Hozzáférési adatok:
A SAS lehetővé teszi, hogy bármilyen kívánt formátumban hozzáférjen az adatokhoz.
Bárhol hozzáférhet a tárolt adatokhoz, legyen az a rendszerén lévő fájlban, vagy egy másik adatbázisrendszerben tárolt adatok. Ez lehet oracle fájl, SAS adatbázis fájl, nyers adatbázis fájl vagy egyszerű XLS / CSV fájl. Segítségével könnyedén hozzáférhet ezekhez az adatokhoz.
Adatok kezelése:
A SAS nagyszerű adatkezelési lehetőségeket kínál. Bizonyos feltételek alapján részhalmazokat/szeleteket készíthet, változókat hozhat létre, adatokat tisztíthat és ellenőrizhet. Vannak más eszközök is, amelyek lehetővé teszik ugyanazt a feladatot. A SAS azonban segít ennek a feladatnak a könnyű elvégzésében.
A SAS jól meghatározott könyvtárakkal és folyamatokkal rendelkezik, amelyek megkönnyítik a programozási folyamatot. Ezenkívül a változó vagy részhalmaz adatok létrehozása csak egy lépés. Ezzel megkíméli Önt attól, hogy egyetlen kódsorral összetett algoritmusokat írjon.
Elemzés:
A SAS segítségével többféle elemzést végezhet:
- Ellenőrzi az átlagszámítás gyakoriságát
- Regresszió és előrejelzés
- Döntési fa
Mindezeket az elemzéseket könnyen kezelheti a SAS. Ez a legjobb eszköz a pontos előrejelzéshez.
Present:
Ha helyesen vizualizálja az adatokat, akkor a közönségnek könnyű kapcsolódnia hozzájuk. Elengedhetetlen, hogy az eszköz megfelelő módon jelenítse meg az adatokat. A SAS ezt teszi Önért. Kiváló prezentációs képességekkel rendelkezik.
Ezek az alábbiak:
1. Jelentések listázása
2. Összefoglaló jelentések
3. Grafikonos jelentések
4. Jelentések nyomtatása
SAS program példa
A SAS program három szükséges lépésből áll:
- Adatlépés
- Proc Step
- Kimeneti lépés
ADATOK Lépés
A Data step betölti a szükséges adatkészletet a SAS memóriájába, és megkeresi az adatkészlet megfelelő változóit. A rekordokat is rögzíti. Adatlépéseket használhatunk a következőkre:
- Adjon meg adatokat a SAS adatkészletekbe
- Értékek kiszámítása
- Ellenőrizze vagy javítsa ki az adatokat
- Hozzon létre új adatkészleteket
A DATA utasítás szintaxisa a következő:
Szintaxis
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Példa:
A következő példa bemutatja, hogyan kell változót definiálni, elnevezni az adathalmazt, létrehozni új változókat és bevinni az adatokat. Ebben a példában láthatja, hogy a karakterlánc-változó végén egy $, a numerikus értékek pedig anélkül szerepelnek.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Megjegyzés: A SAS utasítás végrehajtásához meg kell adni a RUN parancsot.
PROC lépés
Konkrét elemzéseket vagy funkciókat végez eredmények és jelentések elkészítése érdekében.
Szintaxis
PROC procedure_name options; #The name of the proc. RUN;
Példa
A megadott példa a ESZKÖZÖK eljárást az adatkészletben lévő numerikus változók átlagértékeinek kinyomtatására.
PROC MEANS; RUN;
Az OUTPUT lépés
Az adatokból feltételes kimeneti utasításokkal jelenítheti meg az adatokat.
Szintaxis
PROC PRINT DATA = data_set; OPTIONS; RUN;
Minden SAS programnak követnie kell a fent említett lépéseket a bemeneti adatok kiolvasásához, az adatok elemzéséhez és az elemzés kimenetének megadásához. A FUTÁS utasítás minden lépés végén befejezi az adott lépés végrehajtását.
A teljes SAS program
Az alábbiakban található a fenti lépések teljes kódja.
output:
Hol használják a SAS-t?
Az alábbiakban felsorolunk néhány fontos SAS-alkalmazást:
Ipar | Használat |
---|---|
Gyógyszeripari | Statisztikai elemzés, jelentéskészítés |
Telecom | ETL, jelentéskészítés, adatbányászat, előrejelzés |
Financials | ETL, Jelentéskészítés, Adatbányászat, Pénzügyi kutatás |
Prediktív modellezés | DBMarketing, tevékenységalapú menedzsment |
Egészségügy | ETL, jelentéskészítés, adatbányászat |
SAS vs. R
SAS | R |
---|---|
A SAS kereskedelmi szoftver, ezért pénzügyi befektetést igényel. | R nyílt forráskódú szoftver. Ezért bárki használhatja. |
A SAS a legkönnyebben megtanulható elemző eszköz. Még az SQL-ről korlátozott ismeretekkel rendelkező emberek is gyorsan megtanulhatják. | Az R bonyolult és hosszadalmas kódokat ír elő. |
A SAS-t nagyon kedvelik a nagyvállalatok, és technikailag meglehetősen fejlett és felhasználóbarát. | R egy gyorsan fejlődő szoftver; azonban folyamatosan frissítenie kell. |
A SAS jó grafikus támogatással rendelkezik, de nem kínál testreszabást. | Az R eszköz grafikus támogatása nagyon gyenge. |
A SAS előnyei
- A SAS egyszerű szintaxissal rendelkezik, amely mindenféle programozási tudás nélkül megtanulható
- Nagy adatbázisok egyszerű kezelése
- A SAS egy nagyon érthető nyelv, amely könnyen hibakereshető
- A „napló” ablak egyértelműen jelzi a hibát, amely segít a kód egyszerű hibakeresésében
- A SAS segít az algoritmus alapos tesztelésében és elemzésében
- A SAS teljesen védett, így az irodában engedély nélkül nem lehet kicsomagolni
- Megkönnyíti a statisztikai számításokat a nem programozó felhasználók számára
- Hatékonyan kezeli a nagyméretű adatbázisokat.
A SAS hátrányai
- A költségek magasak, mert egyén vagy szervezet nem tudja használni az összes alkalmazást megfelelő licenc nélkül
- A SAS nem nyílt forráskódú, így a SAS-ban használt algoritmusok nem állnak rendelkezésre általános használatra
- A szövegbányászat nagyon problémás és nehéz folyamat a SAS-ban.
Összegzésként
- A SAS-szoftver jelentése statisztikai elemző szoftver, amelyet adatelemzésre használnak
- R és Python a SAS két széles körben használt alternatív eszköze.
- A SAS-t Jim Goodnight és John Shall fejlesztette ki 1970-ben az NC Egyetemen
- A SAS lehetővé teszi a nyers adatfájlok és adatok elérését bármilyen külső adatbázisban
- A SAS architektúra főként három részre oszlik: 1) Ügyfélszint 2) Középső réteg 3) Hátsó szint
- A SAS szoftver használatához négy lépést kell követnie, amelyek a következők: 1) Hozzáférés az adatokhoz, 2) Kezelés 3) Adatok elemzése, 4) Prezentáció
- A SAS program három alapvető lépésből áll: Data Step, Proc Step és Output Step
- SAS adatelemző eszköz széles körben használják olyan ágazatokban, mint a gyógyszeripar, a távközlés, a pénzügyek, a prediktív modellezés és az egészségügy
- A SAS kereskedelmi szoftver, míg az R nyílt forráskódú szoftver
- A SAS programozói eszköz legnagyobb előnye, hogy egyszerű szintaxissal rendelkezik, amely bármilyen programozási tudás nélkül is megtanulható.
- A SAS modell egyik hátránya, hogy nem nyílt forráskódú eszköz. Tehát a SAS eljárásokban használt algoritmusok nem állnak rendelkezésre általános használatra.