SAS Vodič za početnike: Što je i primjer programiranja

Što je SAS?

SAS je statistički softverski paket vođen naredbama koji se naširoko koristi za analizu i vizualizaciju statističkih podataka. SAS puni obrazac je softver za statističku analizu. Omogućuje vam korištenje kvalitativnih tehnika i procesa koji vam pomažu povećati produktivnost zaposlenika i poslovni profit. SAS se također koristi za naprednu analitiku poput poslovne inteligencije, kriminalističke istrage i prediktivne analize. SAS se izgovara kao "SaaS".

U SAS-u se podaci izvlače i kategoriziraju što vam pomaže da identificirate i analizirate obrasce podataka. To je softverski paket koji vam omogućuje izvođenje napredne analize, poslovne inteligencije, prediktivne analize, upravljanja podacima kako biste učinkovito radili u konkurentnim i promjenjivim poslovnim uvjetima. Štoviše, SAS je neovisan o platformi što znači da možete pokrenuti SAS na bilo kojem operativnom sustavu, bilo Linux ili Windows.

U usporedbi s drugim BI alati, SAS pruža opsežnu podršku za programsku transformaciju i analizu podataka, osim korištenja sučelja povuci i ispusti. Ovo pruža vrlo detaljnu kontrolu nad manipulacijom podataka i analizama što je njegov USP.

Zašto nam treba SAS?

Shvatimo potrebu za SAS-om na jednostavnom primjeru:

Razmotrite tvrtku za e-trgovinu koja želi znati kupovne obrasce svojih kupaca na temelju povijesnih podataka. Tvrtka će morati uzeti u obzir tisuće zapisa više kupaca kako bi dobila generalizirani uvid.

Tvrtka možda nema sve te podatke potrebne za analizu. Na primjer, ako kupac nije kupio jaknu, koji su ga faktori spriječili da ne kupi jaknu? Podaci koji nedostaju mogu stvoriti pogreške u vašoj analizi. Kako se možemo riješiti ovih problema? Kako možemo postupati s ovom vrstom podataka?

Ako se radi ručno, ovaj će zadatak zahtijevati stotine analitičara i tisuće radnih sati. Korištenjem SAS analitičkog alata, možete napraviti istu analizu u nekoliko sati s jednim analitičarom. SAS alat omogućuje vam uklanjanje nepotrebnih podataka i optimizaciju relevantnih informacija. Omogućit će vam predviđanje ishoda čak i s podacima koji nedostaju. SAS vam omogućuje donošenje boljih odluka.

Alternativni SAS alati

Alternativni SAS alati

R: To je softver otvorenog koda. Lako je naučiti R jer je dobro dokumentiran. Nudi snažne statističke mogućnosti.

Python je još jedan popularan skriptni jezik otvorenog koda. Podržava biblioteke kao što su Numpy, Scipy i MatPlotLib. Možete izvesti bilo koju statističku operaciju ili možete izgraditi bilo koji model pomoću ovih biblioteka.

SAS: To je široko korišten analitički alat na tržištu komercijalne analitike. S mnoštvom statističkih funkcija i dobrim GUI-jem.

U ovom vodiču za programiranje SAS-a raspravljat ćemo o statističkim analitičkim sustavima i kako se oni mogu koristiti za rješavanje naših problema.

Povijest SAS-a

  • SAS su razvili Jim Goodnight i John Shall 1970. godine na Sveučilištu NC
  • U početku je razvijen za poljoprivredna istraživanja.
  • Later, proširio se na niz alata koji među ostalima uključuju Prediktivnu analitiku, Upravljanje podacima, BI.
  • Danas 98 vodećih svjetskih kompanija u Fortune 400 koristi SAS analitički alat za Analiza podataka.

Zatim ćemo u ovom vodiču za jezik SAS naučiti o značajkama SAS-a.

Značajke SAS-a

Ključne značajke SAS-a su:

  • Jednostavan pristup datotekama s neobrađenim podacima i podacima iz vanjske baze podataka. Čitajte i pišite gotovo sve formate podataka!
  • Upravljajte podacima pomoću alata za unos podataka, dohvaćanje uređivanja, oblikovanje i pretvorbu
  • Analizirajte podatke korištenjem deskriptivnih, statističkih, multivarijantnih tehnika, predviđanja, modeliranja, linearnog programiranja
  • Napredna analitika pomaže vam da napravite promjene i poboljšanja poslovne prakse.
  • Formiranje izvješća sa savršenim grafikonima
  • Operaistraživanja i upravljanje projektima
  • Ažuriranje i izmjena podataka
  • Snažan jezik za rukovanje podacima
  • Izvrsne funkcije čišćenja podataka
  • Interakcija s više host sustava

Zatim ćemo u ovom vodiču za SAS za početnike učiti o paketu proizvoda SAS.

SAS Product Suite

Na tržištu je dostupno mnogo SAS proizvoda. Slijedi popis popularnijih.

Ime i Prezime Description
Baza SAS Softver Base SAS nudi agilnost hardvera i integrira se u sve vrste računalnog okruženja.
SAS/GRAF Ovaj vam alat pomaže da strukturirane podatke predstavite u grafikone.
SAS/STAT Ovaj vam alat pomaže u izvođenju različitih vrsta regresije, varijance statističke analize, regresije i psihometrijske analize.
SAS/ETS Koristi se za predviđanje. Pomaže vam da izvršite analizu vremenskih serija.
SAS/IML Interaktivni matricni jezik poznat je kao IML. Ovaj vam alat pomaže prevesti matematičke formule u inovativan program.
SAS EBI Alat za aplikacije poslovne inteligencije
SAS Grid Manager To je ključna komponenta koja nudi mogućnost upravljanja podacima i programski jezik za analizu podataka
SAS/OR Alat za Operacija istraživanja
SAS/QC Koristite za kontrolu kvalitete
SAS/Enterprise Miner Data mining
SAS/PH Analiza kliničkih ispitivanja
SAS/AF Nudi mogućnost primjene
Enterprise Guide To je GUI uređivač koda i voditelj projekta

Zatim ćemo u ovom vodiču s uputama za SAS učiti o SAS arhitekturi.

SAS Architektura

SAS Architektura
Archistruktura SAS-a

SAS arhitektura podijeljena je uglavnom na tri dijela:

  • Razina klijenta
  • Srednji stup
  • Stražnji sloj

Razina klijenta

Klijentska razina je mjesto na kojem je aplikacija instalirana na stroju, gdje korisnik sjedi. Sastoji se od komponenti koje služe za pregled portala i njegovog sadržaja. Također uključuje standardni web preglednik koji se koristi za interakciju s portalom preko standardnog HTTP ili HTTPS protokola. Također vam pomaže da SAS web aplikaciju učinite prijateljskim vatrozidom.

Srednji sloj

Srednji sloj nudi centraliziranu pristupnu točku za poslovne informacije. Sav pristup sadržaju obrađuju komponente koje rade na ovoj razini. Odvajanje poslovne logike od logike prikaza pomaže vam da iskoristite logiku srednje razine. Štoviše, centralizirane točke pristupa olakšavaju provođenje sigurnosnih pravila, administriranje portala i upravljanje promjenama koda.

Srednji sloj sadrži sljedeće funkcije:

SAS Web aplikacija portala za dostavu informacija: To je zbirka JSP-a, Java servleti, JavaGrah i druge klase i resursi. Ove komponente vam pomažu da pristupite informacijama pohranjenim u imeniku poduzeća kako biste stvorili prilagodljivo sučelje za korisnika.

Servlet Engine: Servlet motor se također naziva servlet kontejner. Odgovoran je za upravljanje web aplikacijom SAS Information Delivery Portal. Servlet motor nudi okruženje za vrijeme izvođenja. Omogućuje istovremenost, implementaciju, upravljanje životnim ciklusom itd.

Web poslužitelj: Web poslužitelj nudi uslugu za servlet engine koji se može koristiti za host web stranice. Tome treba pristupiti putem portala.

Zadnji sloj

Zadnji sloj je područje u kojem se izvode podatkovni i računalni poslužitelji koji mogu sadržavati poslovne objekte. To je imenički poslužitelj poduzeća. Poslužitelj imenika poduzeća održava metapodatke o sadržaju koji se nalazi u cijelom poduzeću.

Kako preuzeti i instalirati SAS

Lokalno preuzimanje na vašem računalu

Korak 1) Preuzmite SAS s dane veze

Idite na ovaj link https://www.sas.com/en_in/software/university-edition.html i kliknite na Get Free Software.

Preuzmite i instalirajte SAS

Korak 2) Odaberite svoj Operating sustav

Odaberite operativni sustav prema vašem sustavu.

Preuzmite i instalirajte SAS

Korak 3) Preuzmite i instalirajte softver za virtualizaciju

SAS zahtijeva softver za virtualizaciju poput VirtualBox instalirati prije nego što se može instalirati. Evo detaljnih koraka

Preuzmite i instalirajte SAS

Slijedite korake navedene na zaslonu da biste instalirali SAS. imajući VirtualBox a lokalna instalacija bi ponekad mogla biti nezgodna. Preporučujemo instalaciju AWS-a

Instalacija AWS-a

SAS možete implementirati u AWS. Ispunjava uvjete za besplatnu razinu.

Korak 1) Idi na https://aws.amazon.com/marketplace/pp/B00WH10IKW. Kliknite "Nastavi na pretplatu"

Preuzmite i instalirajte SAS

Korak 2) Na sljedećem zaslonu prihvatite uvjete.

Preuzmite i instalirajte SAS

Korak 3) Za odobrenje pretplate na čekanju potrebno je do 10 minuta. Vidjet ćete sljedeći ekran.

Preuzmite i instalirajte SAS

Korak 4) Osvježite stranicu i pretplata će biti potvrđena. Kliknite Nastavi na konfiguraciju

Preuzmite i instalirajte SAS

Korak 5) Zadržite zadane postavke i kliknite Nastavi na pokretanje.

Preuzmite i instalirajte SAS

Korak 6) Revtj. pogledajte konfiguracijsku stranicu. Unesite par ključ-vrijednost. Postavke odmora trebale bi biti zadane. Pritisnite Pokreni

Preuzmite i instalirajte SAS

Korak 7) Idi na https://aws.amazon.com/marketplace/library/ i kliknite na Pregled instanci.

Preuzmite i instalirajte SAS

Korak 8) U skočnom prozoru

  1. Zabilježite ID instance. Ovo je vaša lozinka
  2. Pritisnite Pristup softveru

Preuzmite i instalirajte SAS

Korak 9) U skočnom prozoru koji se pojavljuje nakon što kliknete u koraku 8

  1. Unesite korisničke vjerodajnice. Id: lozinka sasdemo: ID instance zabilježen u koraku 8
  2. Pritisnite Prijava

Preuzmite i instalirajte SAS

Korak 10) Vidjet ćete ekran dobrodošlice.

Preuzmite i instalirajte SAS

Rješavanje problema

Ako se ne možete povezati, idite na https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId i ulazno/izlazna pravila za sve

Kako koristiti SAS?

Za učinkovito korištenje SAS softvera trebate slijediti četiri koraka koji su: Pristup podacima, Podaci o upravljanju, Analiza, Predstavljanje

Kako koristiti SAS
Kako koristiti SAS

Pristupni podaci:

SAS vam omogućuje pristup podacima u bilo kojem formatu koji želite.

Možete pristupiti podacima koji su pohranjeni bilo gdje, bilo da su u datoteci na vašem sustavu ili podacima koji su pohranjeni u drugom sustavu baze podataka. To može biti Oracle datoteka, SAS datoteka baze podataka, Raw datoteka baze podataka ili jednostavna XLS /CSV datoteka. Pomoći će vam da s lakoćom pristupite tim podacima.

Upravljanje podacima:

SAS nudi izvrsne mogućnosti upravljanja podacima. Možete podskupiti/iscijepiti podatke na temelju određenih uvjeta, stvoriti varijable, očistiti i potvrditi podatke. Postoje i drugi alati koji vam omogućuju obavljanje istog zadatka. Međutim, SAS vam pomaže da s lakoćom obavite ovaj posao.

SAS ima dobro definirane biblioteke i procese što olakšava proces programiranja. Štoviše, stvaranje varijabli ili podataka podskupa proces je samo u jednom koraku. To vas štedi pisanja složenih algoritama pomoću samo jednog retka koda.

Analizirati:

Pomoću SAS-a možete napraviti različite vrste analiza:

  • Provjerava učestalost izračuna srednje vrijednosti
  • Regresija i predviđanje
  • Stablo odlučivanja

Sve ove analize SAS može lako obraditi. To je najbolji alat za točnu prognozu.

Predstaviti:

Ako ispravno vizualizirate podatke, publici je lako povezati se s njima. Bitno je da vaš alat prikazuje podatke na prikladan način. To je ono što SAS radi za vas. Ima izvrsne prezentacijske mogućnosti.

Vi možete:

1. Popis izvješća

2. Zbirna izvješća

3. Grafička izvješća

4. Ispis izvješća

Primjer SAS programa

SAS program se sastoji od tri neophodna koraka:

  • Podatkovni korak
  • Korak postupka
  • Izlazni korak

PODACI korak

Podatkovni korak učitava potrebni skup podataka u SAS memoriju i pronalazi ispravne varijable skupa podataka. Također bilježi zapise. Podatkovne korake možemo koristiti za:

  • Unesite podatke u SAS skupove podataka
  • Izračunaj vrijednosti
  • Provjerite ili ispravite podatke
  • Izradite nove skupove podataka

Sintaksa za naredbu DATA je:

Sintaksa

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Primjer:

Sljedeći primjer pokazuje kako definirati varijablu, imenovanje skupa podataka, stvaranje novih varijabli i unos podataka. U ovom primjeru možete vidjeti da string varijabla ima $ na kraju, a numeričke vrijednosti su bez njega.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Napomena: Za izvođenje SAS naredbe potrebno je navesti naredbu RUN.

Korak PROC

Obavlja specifične analize ili funkcije za izradu rezultata i izvješća.

Sintaksa

PROC procedure_name options; #The name of the proc.
RUN;

Primjer

Navedeni primjer koristi SREDSTVA postupak za ispis srednjih vrijednosti numeričkih varijabli u skupu podataka.

PROC MEANS;
RUN;

Korak OUTPUT

Možete prikazati podatke iz podataka s uvjetnim izlaznim izjavama.

Sintaksa

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Svaki SAS program mora slijediti sve gore navedene korake za čitanje ulaznih podataka, analiziranje podataka i davanje rezultata analize. The TRČANJE naredba na kraju svakog koraka završava izvršenje tog koraka.

Kompletan SAS program

U nastavku se nalazi potpuni kod za svaki od gore navedenih koraka.

Kompletan SAS program

Izlaz:

Kompletan SAS program

Kompletan SAS program

Kompletan SAS program

Gdje se koristi SAS?

U nastavku su navedene neke važne SAS aplikacije:

Industrija Upotreba
Farmaceutski Statistička analiza, izvješćivanje
Telekom ETL, izvješćivanje, rudarenje podataka, predviđanje
Financije ETL, izvješćivanje, rudarenje podataka, financijsko istraživanje
Prediktivno modeliranje DBMarketing, upravljanje temeljeno na aktivnostima
Zdravstvo ETL, izvješćivanje, Data Mining

SAS vs. R

SAS R
SAS je komercijalni softver, stoga zahtijeva financijska ulaganja. R je softver otvorenog koda. Stoga ga svatko može koristiti.
SAS je najlakši analitički alat za naučiti. Čak i osobe s ograničenim znanjem o SQL-u mogu ga brzo naučiti. R zahtijeva pisanje kompliciranih i dugih kodova.
SAS je izbor koji preferiraju velike tvrtke i prilično je tehnički napredan i jednostavan za korištenje. R je softver koji se brzo razvija; međutim, morate ga nastaviti nadograđivati.
SAS ima dobru grafičku podršku, ali ne nudi nikakvu prilagodbu. Grafička podrška R alata je vrlo loša.

Prednosti SAS-a

  • SAS ima jednostavnu sintaksu koja se može naučiti bez ikakvog znanja programiranja
  • Sposobnost lakog rukovanja velikom bazom podataka
  • SAS je vrlo razumljiv jezik koji se lako može otkloniti
  • Njegov prozor "dnevnik" jasno navodi pogrešku što vam pomaže da lako otklonite pogreške koda
  • SAS vam pomaže da temeljito testirate i analizirate algoritam
  • SAS je potpuno zaštićen tako da ne možete ekstrahirati bez licence u uredu
  • Olakšava statističko računanje za korisnike koji ne programiraju
  • Učinkovito rukuje velikom bazom podataka.

Nedostaci SAS-a

  • Trošak je visok jer pojedinac ili organizacija ne mogu koristiti sve aplikacije bez odgovarajuće licence
  • SAS nije open source pa algoritmi koji se koriste u SAS-u nisu dostupni za uobičajenu upotrebu
  • Rudarenje teksta vrlo je problematičan i težak proces u SAS-u.

rezime

  • SAS softver znači softver za statističku analizu koji se koristi za analizu podataka
  • R i Python su dva široko korištena alternativna alata SAS-a.
  • SAS su razvili Jim Goodnight i John Shall 1970. godine na Sveučilištu NC
  • SAS vam omogućuje pristup datotekama s neobrađenim podacima i podacima u vanjskoj bazi podataka bilo koje vrste
  • SAS arhitektura podijeljena je uglavnom na tri dijela 1) Razina klijenta 2) Srednja razina 3) Stražnja razina
  • Za korištenje SAS softvera morate slijediti četiri koraka, a to su: 1) pristup podacima, 2) upravljanje 3) analiza podataka, 4) prezentacija
  • SAS program sastoji se od tri osnovna koraka: Data Step, Proc Step i Output Step
  • SAS alat za analizu podataka naširoko se koristi u sektorima kao što su farmacija, telekomunikacije, financije, prediktivno modeliranje i zdravstvo
  • SAS je komercijalni softver dok je R softver otvorenog koda
  • Najveća prednost alata za programiranje SAS je ta što ima jednostavnu sintaksu koja se može naučiti bez ikakvog znanja o programiranju.
  • Jedan od nedostataka SAS modela je to što nije alat otvorenog koda. Dakle, algoritmi koji se koriste u SAS procedurama nisu dostupni za uobičajenu upotrebu.