SAS Handledning för nybörjare: Vad är & programmeringsexempel
Vad är SAS?
SAS är en kommandodriven statistisk mjukvarusvit som ofta används för statistisk dataanalys och visualisering. SAS full form är programvara för statistisk analys. Det låter dig använda kvalitativa tekniker och processer som hjälper dig att förbättra de anställdas produktivitet och affärsvinster. SAS används också för avancerad analys som business intelligence, brottsutredning och prediktiv analys. SAS uttalas som "SaaS."
I SAS extraheras & kategoriseras data vilket hjälper dig att identifiera och analysera datamönster. Det är en mjukvarusvit som låter dig utföra avancerad analys, Business Intelligence, Predictive Analysis, datahantering för att fungera effektivt i konkurrenskraftiga och föränderliga affärsförhållanden. Dessutom är SAS plattformsoberoende vilket innebär att du kan köra SAS på vilket operativsystem som helst, antingen Linux eller Windows.
Jämfört med andra BI-verktyg, SAS tillhandahåller omfattande stöd för att programmatiskt transformera och analysera data, förutom att använda dra och släpp-gränssnittet. Detta ger mycket detaljerad kontroll över datamanipulation och analyser som är dess USP.
Varför behöver vi SAS?
Låt oss förstå behovet av SAS med ett enkelt exempel:
Tänk på ett e-handelsföretag som vill veta sina kunders köpmönster baserat på historiska data. Företaget kommer att behöva överväga tusentals register över flera kunder för att få en generaliserad insikt.
Företaget kanske inte har alla dessa data som krävs för analysen. Till exempel, om en kund inte köpte en jacka, vilka är då de faktorer som hindrade dem från att köpa jackan? Denna saknade data kan skapa fel i din analys. Hur kan du bli av med dessa problem? Hur kan vi hantera denna typ av data?
Om den görs manuellt kommer denna uppgift att kräva hundratals analytiker och tusentals mantimmar. Genom att använda SAS analysverktyg kan du göra samma analys på några timmar med en enda analytiker. SAS-verktyget låter dig eliminera onödig data och optimera relevant information. Det gör att du kan förutsäga ett resultat även om data saknas. SAS gör det möjligt för dig att fatta bättre beslut.
Alternativa SAS-verktyg
R: Det är programvara med öppen källkod. Det är lätt att lära sig R då det är väldokumenterat. Det erbjuder starka statistiska möjligheter.
Python är ett annat populärt skriptspråk med öppen källkod. Det stöder bibliotek som Numpy, Scipy och MatPlotLib. Du kan utföra vilken statistisk operation som helst, eller så kan du bygga vilken modell som helst med hjälp av dessa bibliotek.
SAS: Det är det mycket använda analysverktyget på den kommersiella analysmarknaden. Med en uppsjö av statistiska funktioner och bra GUI.
I denna SAS-programmeringshandledning kommer vi att diskutera statistiska analytiska system och hur det kan användas för att lösa våra problem.
SAS historia
- SAS utvecklades av Jim Goodnight och John Shall 1970 vid NC University
- Ursprungligen utvecklades den för jordbruksforskning.
- Later, utökades det till ett spektrum av verktyg för att inkludera Predictive Analytics, Data Management, BI bland annat.
- Idag använder 98 av världens främsta företag inom Fortune 400 SAS dataanalysverktyg för Dataanalys.
Nästa i denna SAS-språkhandledning kommer vi att lära oss om funktionerna i SAS.
SAS funktioner
Nyckelfunktioner hos SAS är:
- Få lätt tillgång till rådatafiler och data från en extern databas. Läs och skriv nästan alla dataformat!
- Hantera data med hjälp av verktyg för datainmatning, redigeringshämtning, formatering och konvertering
- Analysera data med hjälp av beskrivande, statistik, multivariat teknik, prognoser, modellering, linjär programmering
- Avancerad analys hjälper dig att göra förändringar och förbättringar i affärspraxis.
- Rapportbildning med perfekta grafer
- Operaforskning och projektledning
- Uppdatering och modifiering av data
- Kraftfullt språk för datahantering
- Utmärkta datarensningsfunktioner
- Interagera med flera värdsystem
Nästa i denna handledning för SAS för nybörjare kommer vi att lära oss om SAS Product Suite.
SAS Product Suite
Det finns många SAS-produkter tillgängliga på marknaden. Följande är en lista över de mer populära.
| Namn | BESKRIVNING |
|---|---|
| Bas SAS | Base SAS mjukvara erbjuder hårdvaruflexibilitet och integreras i alla typer av datormiljöer. |
| SAS/GRAPH | Det här verktyget hjälper dig att representera strukturerad data i grafer. |
| SAS/STAT | Det här verktyget hjälper dig att utföra olika typer av regression, statistisk analysvarians, regression och psykometrisk analys. |
| SAS/ETS | Det används för prognoser. Hjälper dig att utföra tidsserieanalysen. |
| SAS/IML | Interactive Matric-språk är känt som IML. Det här verktyget hjälper dig att översätta matematiska formler till ett innovativt program. |
| SAS EBI | Ett verktyg för Business Intelligence-applikationer |
| SAS Grid Manager | Det är en kärnkomponent som erbjuder datahanteringsfunktion och ett programmeringsspråk för dataanalys |
| SAS/OR | Verktyg för Operation forskning |
| SAS/QC | Används för kvalitetskontroll |
| SAS/Enterprise Miner | Data mining |
| SAS/PH | Analys av klinisk prövning |
| SAS/AF | Det erbjuder applikationsmöjligheter |
| Enterprise Guide | Det är en GUI-baserad kodredigerare och projektledare |
Härnäst i den här SAS-handledningsguiden kommer vi att lära oss om SAS-arkitektur.
SAS Architecture

SAS arkitektur är huvudsakligen uppdelad i tre delar:
- Klientnivå
- Mellannivå
- Bakre nivå
Kundnivå
Klientnivå är där applikationen är installerad på en maskin, där användaren sitter. Den består av komponenterna som används för att se portalen och dess innehåll. Den innehåller också en standardwebbläsare som används för att interagera med portalen över standard HTTP- eller HTTPS-protokoll. Det hjälper dig också att göra SAS webbapplikations brandväggsvänlig.
Mellannivå
Mellanskiktet erbjuder en centraliserad åtkomstpunkt för företagsinformation. All åtkomst till innehåll bearbetas av komponenter som fungerar på denna nivå. Separationen av affärslogik med displaylogik hjälper dig att utnyttja logiken i mellanskiktet. Dessutom gör centraliserade åtkomstpunkter det enklare att upprätthålla säkerhetsregler, administrera portalen och hantera kodändringar.
Mellanskiktet är värd för följande funktioner:
SAS Information Delivery Portal Web Application: Det är samlingen av JSP, Java servlets, JavaBönor och andra klasser och resurser. Dessa komponenter hjälper dig att komma åt information som lagras i företagskatalogen för att skapa ett anpassningsbart gränssnitt för användaren.
Servletmotor: Servletmotorn kallas också en servletbehållare. Den ansvarar för att hantera SAS Information Delivery Portal Web Application. Servletmotorn erbjuder en körtidsmiljö. Det ger samtidighet, distribution, livscykelhantering, etc.
Webbserver: Webbservern erbjuder tjänster för servletmotorn som kan användas för att vara värd för webbplatsen. Detta bör nås via portalen.
Bakre nivå
Den bakre nivån är ett område där data- och beräkningsservrarna körs som kan innehålla affärsobjekt. Det är en företagskatalogserver. Företagskatalogservern upprätthåller metadata om innehåll som finns i hela företaget.
Hur man laddar ner och installerar SAS
Lokal nedladdning i din maskin
Steg 1) Ladda ner SAS från angiven länk
Gå till denna länk https://www.sas.com/en_in/software/university-edition.html och klicka på Get Free Software.
Steg 2) Välj din Operating System
Välj operativsystem enligt ditt system.
Steg 3) Ladda ner och installera Virtualization Software
SAS kräver Virtualization Software som VirtualBox ska installeras innan den kan installeras. Här är de detaljerade stegen
Följ stegen som nämns på skärmen för att installera SAS. Har VirtualBox och lokal installation kan ibland vara knepigt. Vi rekommenderar AWS installation-
AWS installation
Du kan distribuera SAS i AWS. Det är kvalificerat för gratis nivå.
Steg 1) Gå till https://aws.amazon.com/marketplace/pp/B00WH10IKW. Klicka på "Fortsätt att prenumerera"
Steg 2) Acceptera villkoren på nästa skärm.
Steg 3) Det tar upp till 10 minuter att godkänna prenumerationen. Du kommer att se följande skärm.
Steg 4) Uppdatera sidan och du kommer att bekräfta prenumerationen. Klicka på Fortsätt till konfiguration
Steg 5) Behåll standardinställningarna och klicka på Fortsätt till start.
Steg 6) Revse konfigurationssidan. Ange ett nyckel-värdepar. Viloinställningar bör vara standard. Klicka på Starta
Steg 7) Gå till https://aws.amazon.com/marketplace/library/ och klicka på Visa instanser.
Steg 8) I popup-fönstret
- Notera instans-id. Detta är ditt lösenord
- Klicka på Åtkomst till programvara
Steg 9) I popup-fönstret som visas efter att du klickat i steg 8
- Ange användaruppgifter. Id: sasdemo-lösenord: instans-id noterat i steg 8
- Klicka på Logga in
Steg 10) Du kommer att se välkomstskärmen.
Felsökning
Om du inte kan ansluta, gå till https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId och inkommande/utgående regler för alla
Hur använder man SAS?
För att effektivt använda SAS-programvara måste du följa fyra steg som är: Access Data, Management Data, Analysera, Presentera

Åtkomstdata:
SAS låter dig komma åt data i vilket format du vill.
Du kan komma åt data som är lagrad var som helst, oavsett om det är i en fil på ditt system eller data som är lagrat i ett annat databassystem. Det kan vara oracle-fil, SAS-databasfil, Raw Database-fil eller en enkel XLS /CSV-fil. Det kommer att hjälpa dig att komma åt denna information med lätthet.
Hantera data:
SAS erbjuder fantastiska datahanteringsmöjligheter. Du kan subset/skiva data baserat på vissa villkor, skapa variabel, rensa och validera data. Det finns andra verktyg som låter dig utföra samma uppgift. Däremot hjälper SAS dig att utföra detta jobb med lätthet.
SAS har väldefinierade bibliotek och processer som gör programmeringsprocessen enkel. Dessutom är att skapa variabel- eller delmängdsdata bara ett steg. Detta sparar dig från att skriva komplexa algoritmer med bara en enda rad kod.
Analysera:
Du kan göra olika typer av analyser med SAS:
- Den kontrollerar frekvensen av medelvärdesberäkning
- Regression och prognoser
- Beslutsträd
Alla dessa analyser kan SAS enkelt hantera. Det är det bästa verktyget för korrekta prognoser.
Närvarande:
Om du visualiserar data korrekt är det enkelt för publiken att relatera till det. Det är viktigt att ditt verktyg presenterar data på ett lämpligt sätt. Det är vad SAS gör för dig. Den har utmärkta presentationsmöjligheter.
Du kan:
1. Lista rapporter
2. Sammanfattande rapporter
3. Grafrapporter
4. Skriv ut rapporter
Exempel på SAS-program
SAS-programmet består av tre nödvändiga steg:
- Datasteg
- Proc Steg
- Utgångssteg
DATA Steg
Datasteget laddar den nödvändiga datamängden till SAS-minnet och hittar de korrekta variablerna för datamängden. Den fångar också rekorden. Vi kan använda datasteg för att:
- Ange data i SAS-datauppsättningar
- Beräkna värden
- Kontrollera eller korrigera data
- Ta fram nya datamängder
Syntaxen för DATA-satsen är:
syntax
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Exempelvis:
Följande exempel visar hur man definierar en variabel, namnger datauppsättningen, skapar nya variabler och anger data. I det här exemplet kan du se att strängvariabeln har en $ i slutet och numeriska värden är utan den.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Obs: För att köra SAS Statement måste du specificera RUN-kommandot.
PROC Steg
Den utför specifika analyser eller funktioner för att producera resultat och rapporter.
syntax
PROC procedure_name options; #The name of the proc. RUN;
Exempelvis
Det givna exemplet använder INNEBÄR ATT procedur för att skriva ut medelvärdena för de numeriska variablerna i datamängden.
PROC MEANS; RUN;
OUTPUT-steget
Du kan visa data från data med villkorliga utdatasatser.
syntax
PROC PRINT DATA = data_set; OPTIONS; RUN;
Varje SAS-program måste följa alla ovanstående steg för att läsa indata, analysera data och ge resultatet av analysen. De SPRINGA uttalande i slutet av varje steg avslutar exekveringen av det steget.
Det kompletta SAS-programmet
Nedan ges den fullständiga koden för vart och ett av stegen ovan.
Produktion:
Var används SAS?
Nedan ges några viktiga SAS-applikationer:
| Industry | Användning |
|---|---|
| Läkemedel | Statistisk analys, rapportering |
| Telekom | ETL, rapportering, datautvinning, prognoser |
| Finans | ETL, Rapportering, Data Mining, Finansiell forskning |
| Förutsägande modellering | DBMarketing, aktivitetsbaserad hantering |
| Sjukvård | ETL, rapportering, Data Mining |
SAS vs. R
| SAS | R |
|---|---|
| SAS är kommersiell programvara, så det kräver en ekonomisk investering. | R är programvara med öppen källkod. Därför kan vem som helst använda den. |
| SAS är det enklaste analysverktyget att lära sig. Även personer med begränsad kunskap om SQL kan lära sig det snabbt. | R kräver att du skriver komplicerade och långa koder. |
| SAS är ett mycket föredraget val av stora företag och är ganska tekniskt avancerat och användarvänligt. | R är snabbutvecklande mjukvara; men du måste fortsätta att uppgradera den. |
| SAS har bra grafiskt stöd men erbjuder ingen anpassning. | Det grafiska stödet för R-verktyget är mycket dåligt. |
Fördelar med SAS
- SAS har en enkel syntax som kan läras utan någon form av programmeringskunskap
- Förmåga att hantera en stor databas med lätthet
- SAS är ett mycket begripligt språk som lätt kan felsökas
- Dess "logg"-fönster visar tydligt felet som hjälper dig att felsöka din kod enkelt
- SAS hjälper dig att noggrant testa och analysera algoritmen
- SAS är helt säkrat så du kan inte extrahera utan licens på kontoret
- Gör statistisk beräkning enklare för icke-programmerande användare
- Hanterar stor databas effektivt.
Nackdelar med SAS
- Kostnaden är hög eftersom individ eller organisation inte kan använda alla applikationer utan en lämplig licens
- SAS är inte öppen källkod, så algoritmer som används i SAS är inte tillgängliga för allmänt bruk
- Textmining är en mycket besvärlig och svår process i SAS.
Sammanfattning
- SAS-programvara som betyder statistisk analysmjukvara som används för dataanalys
- R och Python är två allmänt använda alternativa verktyg av SAS.
- SAS utvecklades av Jim Goodnight och John Shall 1970 vid NC University
- SAS låter dig komma åt rådatafiler & data i en extern databas av alla slag
- SAS-arkitekturen är huvudsakligen uppdelad i tre delar 1) Klientnivå 2) Mellannivå 3) Bakre nivå
- För att använda SAS-programvara måste du följa fyra steg som är: 1) Tillgång till data, 2) Hantering 3) Analysera data, 4) Presentation
- SAS-programmet består av tre grundläggande steg: Data Step, Proc Step och Output Step
- SAS dataanalysverktyg används ofta inom sektorer som läkemedel, telekom, finans, prediktiv modellering och hälsovård
- SAS är kommersiell programvara medan R är öppen källkod
- Den största fördelen med SAS programmeringsverktyg är att det har en enkel syntax som kan läras utan någon form av programmeringskunskap.
- En av nackdelarna med SAS-modellen är att det inte är ett verktyg med öppen källkod. Algoritmer som används i SAS-procedurer är alltså inte tillgängliga för vanlig användning.


















