Výukový program SAS pro začátečníky: Co je to a příklad programování

Co je SAS?

SAS je příkazově řízená statistická softwarová sada široce používaná pro statistickou analýzu dat a vizualizaci. Plná forma SAS je Statistical Analysis Software. Umožňuje vám používat kvalitativní techniky a procesy, které vám pomohou zvýšit produktivitu zaměstnanců a obchodní zisky. SAS se také používá pro pokročilé analýzy, jako je business intelligence, vyšetřování zločinů a prediktivní analýza. SAS se vyslovuje jako „SaaS“.

V SAS jsou data extrahována a kategorizována, což vám pomáhá identifikovat a analyzovat datové vzory. Jedná se o softwarovou sadu, která vám umožňuje provádět pokročilé analýzy, Business Intelligence, Prediktivní analýzu a správu dat, abyste mohli efektivně fungovat v konkurenčních a měnících se obchodních podmínkách. Kromě toho je SAS nezávislý na platformě, což znamená, že můžete spustit SAS na jakémkoli operačním systému Linux nebo Windows.

Ve srovnání s ostatními BI nástroje, SAS poskytuje rozsáhlou podporu pro programovou transformaci a analýzu dat, kromě použití rozhraní drag and drop. To poskytuje velmi podrobnou kontrolu nad manipulací a analýzami dat, což je jeho USP.

Proč potřebujeme SAS?

Pojďme pochopit potřebu SAS na jednoduchém příkladu:

Vezměme si společnost elektronického obchodování, která chce znát nákupní vzorce svých zákazníků na základě historických dat. Společnost bude muset vzít v úvahu tisíce záznamů o více zákaznících, aby získala obecný přehled.

Společnost nemusí mít všechny tyto údaje potřebné pro analýzu. Pokud si například zákazník nekoupil bundu, jaké jsou faktory, které mu zabránily bundu si koupit? Tato chybějící data by mohla způsobit chyby ve vaší analýze. Jak se můžeme těchto problémů zbavit? Jak můžeme s tímto typem dat nakládat?

Pokud se tento úkol provede ručně, bude vyžadovat stovky analytiků a tisíce člověkohodin. Pomocí analytického nástroje SAS můžete provést stejnou analýzu během několika hodin s jediným analytikem. Nástroj SAS umožňuje eliminovat nepotřebná data a optimalizovat příslušné informace. Umožní vám předvídat výsledek i s chybějícími údaji. SAS vám umožňuje přijímat lepší rozhodnutí.

Alternativní nástroje SAS

Alternativní nástroje SAS

R: Jedná se o open-source software. Je snadné se naučit R, protože je dobře zdokumentováno. Nabízí silné statistické možnosti.

Python je další populární open-source skriptovací jazyk. Podporuje knihovny jako Numpy, Scipy a MatPlotLib. Můžete provádět libovolnou statistickou operaci nebo můžete pomocí těchto knihoven sestavit jakýkoli model.

SAS: Je to široce používaný analytický nástroj na trhu komerční analýzy. S množstvím statistických funkcí a dobrým GUI.

V tomto tutoriálu o programování SAS budeme diskutovat o statistických analytických systémech a o tom, jak je lze použít k řešení našich problémů.

historie SAS

  • SAS vyvinuli Jim Goodnight a John Shall v roce 1970 na NC University
  • Původně byl vyvinut pro zemědělský výzkum.
  • Later, rozšířila se na škálu nástrojů, které mimo jiné zahrnují Predictive Analytics, Data Management, BI.
  • Dnes 98 předních světových společností v žebříčku Fortune 400 používá analytický nástroj dat SAS Analýza dat.

Dále v tomto tutoriálu jazyka SAS se seznámíme s funkcemi SAS.

Vlastnosti SAS

Klíčové vlastnosti SAS jsou:

  • Snadný přístup k souborům nezpracovaných dat a datům z externí databáze. Čtěte a zapisujte téměř jakýkoli formát dat!
  • Spravujte data pomocí nástrojů pro zadávání dat, vyhledávání úprav, formátování a konverzi
  • Analyzujte data pomocí deskriptivních, statistických, vícerozměrných technik, prognózování, modelování, lineárního programování
  • Pokročilá analytika vám pomůže provádět změny a vylepšení v obchodních praktikách.
  • Tvorba sestav s dokonalými grafy
  • Operavýzkum a projektový management
  • Aktualizace a úprava dat
  • Výkonný jazyk pro práci s daty
  • Vynikající funkce čištění dat
  • Komunikujte s více hostitelskými systémy

Dále v tomto tutoriálu SAS pro začátečníky se seznámíme se sadou produktů SAS.

Produktová sada SAS

Na trhu je k dispozici mnoho produktů SAS. Následuje seznam těch populárnějších.

Jméno Description
Základna SAS Software Base SAS nabízí flexibilitu hardwaru a integruje se do všech druhů výpočetního prostředí.
SAS/GRAPH Tento nástroj vám pomůže znázornit strukturovaná data do grafů.
SAS/STAT Tento nástroj vám pomůže provádět různé typy regrese, statistické analýzy rozptylu, regrese a psychometrické analýzy.
SAS/ETS Používá se pro předpovědi. Pomáhá provádět analýzu časových řad.
SAS/IML Jazyk interaktivní matice je známý jako IML. Tento nástroj vám pomůže převést matematické vzorce do inovativního programu.
SAS EBI Nástroj pro aplikace Business Intelligence
Správce sítě SAS Jedná se o základní komponentu, která nabízí zařízení pro správu dat a programovací jazyk pro analýzu dat
SAS/OR Nástroj pro Operaní výzkum
SAS/QC Použijte pro kontrolu kvality
SAS/Enterprise Miner Dolování dat
SAS/PH Analýza klinického hodnocení
SAS/AF Nabízí možnost aplikace
Enterprise Guide Jedná se o editor kódu a projektový manažer založený na GUI

Dále v této příručce SAS tutoriály se dozvíme o architektuře SAS.

SAS Architecture

SAS Architecture
Architecture SAS

Architektura SAS se dělí především na tři části:

  • Klientská úroveň
  • Střední stupeň
  • Zadní vrstva

Klientská úroveň

Klientská vrstva je místo, kde je aplikace nainstalována na počítači, kde sedí uživatel. Skládá se z komponent, které slouží k prohlížení portálu a jeho obsahu. Obsahuje také standardní webový prohlížeč, který se používá k interakci s portálem přes standardní protokol HTTP nebo HTTPS. Pomůže vám také vytvořit přátelskou bránu firewall webové aplikace SAS.

Střední vrstva

Střední vrstva nabízí centralizovaný přístupový bod pro podnikové informace. Veškerý přístup k obsahu je zpracováván součástmi provozujícími tuto vrstvu. Oddělení obchodní logiky od logiky zobrazení vám pomůže využít logiku střední vrstvy. Centralizované přístupové body navíc usnadňují vynucování bezpečnostních pravidel, správu portálu a správu změn kódu.

Střední vrstva hostí následující funkce:

Webová aplikace portálu pro doručování informací SAS: Je to sbírka JSP, Java servlety, JavaFazole a další třídy a zdroje. Tyto komponenty vám pomohou získat přístup k informacím uloženým v podnikovém adresáři a vytvořit přizpůsobitelné rozhraní pro uživatele.

Servlet Engine: Modul servletů se také nazývá kontejner servletů. Je zodpovědný za správu webové aplikace SAS Information Delivery Portal. Motor servletu nabízí běhové prostředí. Poskytuje souběžnost, nasazení, správu životního cyklu atd.

Webový server: Webový server nabízí službu pro servletový engine, který lze použít k hostování webových stránek. To by mělo být přístupné pomocí portálu.

Zadní vrstva

Zadní vrstva je oblast, kde běží datové a výpočetní servery, které mohou obsahovat obchodní objekty. Jedná se o podnikový adresářový server. Podnikový adresářový server uchovává metadata o obsahu, který je umístěn v celém podniku.

Jak stáhnout a nainstalovat SAS

Místní stahování ve vašem počítači

Krok 1) Stáhněte si SAS z uvedeného odkazu

Přejděte na toto spojení https://www.sas.com/en_in/software/university-edition.html a klikněte na Získat bezplatný software.

Stáhněte a nainstalujte SAS

Krok 2) Vyberte svůj Operasystém

Vyberte operační systém podle vašeho systému.

Stáhněte a nainstalujte SAS

Krok 3) Stáhněte a nainstalujte virtualizační software

SAS vyžaduje virtualizační software jako VirtualBox k instalaci před instalací. Zde jsou podrobné kroky

Stáhněte a nainstalujte SAS

Při instalaci SAS postupujte podle kroků uvedených na obrazovce. Mít VirtualBox a místní instalace může být někdy ošemetná. Doporučujeme instalaci AWS-

Instalace AWS

SAS můžete nasadit v AWS. Má nárok na bezplatnou úroveň.

Krok 1) Přejít https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klikněte na „Pokračovat k odběru“

Stáhněte a nainstalujte SAS

Krok 2) Na této další obrazovce Přijměte podmínky.

Stáhněte a nainstalujte SAS

Krok 3) Předplatné čeká na schválení. Schválení trvá až 10 minut. Zobrazí se následující obrazovka.

Stáhněte a nainstalujte SAS

Krok 4) Obnovte stránku a vaše předplatné bude potvrzeno. Klikněte na Pokračovat ke konfiguraci

Stáhněte a nainstalujte SAS

Krok 5) Ponechte výchozí nastavení a klikněte na Pokračovat ke spuštění.

Stáhněte a nainstalujte SAS

Krok 6) Revzobrazit konfigurační stránku. Zadejte pár klíč–hodnota. Nastavení odpočinku by mělo být výchozí. Klepněte na tlačítko Spustit

Stáhněte a nainstalujte SAS

Krok 7) Přejít https://aws.amazon.com/marketplace/library/ a klikněte na Zobrazit instance.

Stáhněte a nainstalujte SAS

Krok 8) Ve vyskakovacím okně

  1. Poznamenejte si ID instance. Toto je vaše heslo
  2. Klepněte na Access software

Stáhněte a nainstalujte SAS

Krok 9) Ve vyskakovacím okně, které se zobrazí po kliknutí v kroku 8

  1. Zadejte přihlašovací údaje uživatele. Id: sasdemo password: ID instance uvedené v kroku 8
  2. Klikněte na Přihlásit se

Stáhněte a nainstalujte SAS

Krok 10) Zobrazí se uvítací obrazovka.

Stáhněte a nainstalujte SAS

Řešení problémů

Pokud se nemůžete připojit, přejděte na https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId a příchozí/odchozí pravidla pro všechny

Jak používat SAS?

Chcete-li efektivně používat software SAS, musíte provést čtyři kroky, kterými jsou: Přístup k datům, Data správy, Analýza, Prezentace

Jak používat SAS
Jak používat SAS

Přístupové údaje:

SAS umožňuje přístup k datům v libovolném požadovaném formátu.

Můžete přistupovat k datům, která jsou uložena kdekoli, ať už se jedná o soubor ve vašem systému nebo data uložená v jiném databázovém systému. Může to být soubor Oracle, databázový soubor SAS, soubor Raw Database nebo jednoduchý soubor XLS / CSV. Pomůže vám to snadno přistupovat k těmto datům.

Spravovat data:

SAS nabízí skvělé možnosti správy dat. Data můžete podmnožit/rozdělit na základě určitých podmínek, vytvářet proměnné, čistit a ověřovat data. Existují další nástroje, které vám umožní provést stejný úkol. SAS vám však pomůže tuto práci snadno provést.

SAS má dobře definované knihovny a procesy, které usnadňují proces programování. Kromě toho je vytváření proměnných nebo podmnožin dat pouze jedním krokem. To vám ušetří psaní složitých algoritmů pomocí jediného řádku kódu.

Analyzovat:

Pomocí SAS můžete provádět různé druhy analýz:

  • Kontroluje výpočet Frekvence střední hodnoty
  • Regrese a prognózování
  • Rozhodovací strom

Všechny tyto analýzy SAS snadno zvládne. Je to nejlepší nástroj pro přesné předpovědi.

Současnost:

Pokud data vizualizujete správně, je pro publikum snadné se s nimi spojit. Je nezbytné, aby váš nástroj prezentoval data vhodným způsobem. To je to, co SAS dělá pro vás. Má vynikající prezentační schopnosti.

You Can:

1. Seznam sestav

2. Souhrnné zprávy

3. Grafové sestavy

4. Tisk sestav

Příklad programu SAS

Program SAS se skládá ze tří nezbytných kroků:

  • Datový krok
  • Krok Proc
  • Výstupní krok

Krok DATA

Datový krok načte potřebnou datovou sadu do paměti SAS a najde správné proměnné datové sady. Zachycuje také záznamy. Datové kroky můžeme použít k:

  • Zadejte data do datových sad SAS
  • Vypočítat hodnoty
  • Zkontrolujte nebo opravte údaje
  • Vytvářejte nové datové sady

Syntaxe příkazu DATA je:

Syntax

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Příklad:

Následující příklad ukazuje, jak definovat proměnnou, pojmenovat datovou sadu, vytvořit nové proměnné a zadat data. V tomto příkladu můžete vidět, že řetězcová proměnná má na konci znak $ a číselné hodnoty jsou bez něj.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Poznámka: Chcete-li provést příkaz SAS, musíte zadat příkaz RUN.

Krok PROC

Provádí specifickou analýzu nebo funkce pro vytváření výsledků a zpráv.

Syntax

PROC procedure_name options; #The name of the proc.
RUN;

Příklad

Uvedený příklad používá PROSTŘEDEK postup pro tisk středních hodnot číselných proměnných v sadě dat.

PROC MEANS;
RUN;

Krok OUTPUT

Data z dat můžete zobrazit pomocí podmíněných výstupních příkazů.

Syntax

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Každý program SAS musí dodržovat všechny výše uvedené kroky, aby načetl vstupní data, analyzoval data a poskytl výstup z analýzy. The BĚH příkaz na konci každého kroku dokončí provádění tohoto kroku.

Kompletní program SAS

Níže je uveden úplný kód pro každý z výše uvedených kroků.

Kompletní program SAS

Výstup:

Kompletní program SAS

Kompletní program SAS

Kompletní program SAS

Kde se používá SAS?

Níže jsou uvedeny některé důležité aplikace SAS:

Průmysl Používání
Farmaceutické Statistická analýza, výkaznictví
Telekomunikace ETL, Reporting, Data Mining, Forecasting
Finance ETL, reporting, dolování dat, finanční výzkum
Prediktivní modelování DBMarketing, Activity-Based Management
Zdravotní péče ETL, reporting, Data Mining

SAS vs. R

SAS R
SAS je komerční software, takže vyžaduje finanční investice. R je software s otevřeným zdrojovým kódem. Proto jej může používat každý.
SAS je nejjednodušší analytický nástroj, který se lze naučit. I lidé s omezenými znalostmi SQL se ho mohou rychle naučit. R vyžaduje, abyste psali složité a dlouhé kódy.
SAS je vysoce preferovanou volbou velkými společnostmi a je poměrně technicky vyspělý a uživatelsky přívětivý. R je rychle se vyvíjející software; musíte jej však neustále upgradovat.
SAS má dobrou grafickou podporu, ale nenabízí žádné přizpůsobení. Grafická podpora nástroje R je velmi špatná.

Výhody SAS

  • SAS má snadnou syntaxi, kterou se lze naučit bez jakýchkoliv znalostí programování
  • Schopnost snadno manipulovat s velkou databází
  • SAS je velmi srozumitelný jazyk, který lze snadno odladit
  • Jeho okno „log“ jasně uvádí chybu, což vám pomůže snadno ladit váš kód
  • SAS vám pomůže důkladně otestovat a analyzovat algoritmus
  • SAS je kompletně zabezpečený, takže v kanceláři nemůžete extrahovat bez licence
  • Usnadňuje statistické výpočty pro neprogramující uživatele
  • Efektivně zpracovává velkou databázi.

Nevýhody SAS

  • Náklady jsou vysoké, protože jednotlivec nebo organizace nemohou používat všechny aplikace bez řádné licence
  • SAS není open source, takže algoritmy používané v SAS nejsou k dispozici pro běžné použití
  • Těžba textu je v SAS velmi problematický a obtížný proces.

Shrnutí

  • Software SAS znamená Statistical Analysis Software, který se používá pro analýzu dat
  • R a Python jsou dva široce používané alternativní nástroje SAS.
  • SAS vyvinuli Jim Goodnight a John Shall v roce 1970 na NC University
  • SAS umožňuje přístup k souborům nezpracovaných dat a datům v externí databázi jakéhokoli druhu
  • Architektura SAS je rozdělena převážně na tři části 1) Klientská vrstva 2) Střední vrstva 3) Zadní vrstva
  • Chcete-li používat software SAS, musíte provést čtyři kroky, které jsou: 1) Přístup k datům, 2) Správa, 3) Analýza dat, 4) Prezentace
  • Program SAS se skládá ze tří základních kroků: Data Step, Proc Step a Output Step
  • SAS nástroj pro analýzu dat je široce používán v odvětvích, jako je farmacie, telekomunikace, finance, prediktivní modelování a zdravotnictví
  • SAS je komerční software, zatímco R je software s otevřeným zdrojovým kódem
  • Největší výhodou SAS programátorského nástroje je, že má snadnou syntaxi, kterou se lze naučit bez jakýchkoliv znalostí programování.
  • Jednou z nevýhod modelu SAS je, že se nejedná o open source nástroj. Algoritmy používané v procedurách SAS tedy nejsou k dispozici pro běžné použití.

Denní zpravodaj Guru99

Začněte svůj den s nejnovějšími a nejdůležitějšími zprávami o umělé inteligenci, které vám přinášíme právě teď.