SAS-opetusohjelma aloittelijoille: Mikä on ja ohjelmointiesimerkki

Mikä on SAS?

SAS on komentopohjainen tilastollinen ohjelmistopaketti, jota käytetään laajalti tilastotietojen analysointiin ja visualisointiin. SAS:n täydellinen lomake on Statistical Analysis Software. Sen avulla voit käyttää laadullisia tekniikoita ja prosesseja, jotka auttavat sinua parantamaan työntekijöiden tuottavuutta ja liiketoiminnan voittoja. SAS:ää käytetään myös edistyneeseen analytiikkaan, kuten business intelligence -tutkimukseen, rikosten tutkimiseen ja ennakoivaan analysointiin. SAS lausutaan nimellä "SaaS".

SAS:ssa tiedot poimitaan ja luokitellaan, mikä auttaa sinua tunnistamaan ja analysoimaan tietomalleja. Se on ohjelmistopaketti, jonka avulla voit suorittaa edistyneitä analyysejä, liiketoimintatiedonhallintaa, ennakoivaa analyysiä ja tiedonhallintaa toimiaksesi tehokkaasti kilpailutilanteessa ja muuttuvissa liiketoimintaolosuhteissa. Lisäksi SAS on alustariippumaton, mikä tarkoittaa, että voit käyttää SAS:ää missä tahansa käyttöjärjestelmässä, joko Linuxissa tai Windows.

Verrattuna muihin BI-työkalut, SAS tarjoaa laajan tuen tietojen ohjelmalliseen muuntamiseen ja analysointiin vedä ja pudota -käyttöliittymän käytön lisäksi. Tämä tarjoaa erittäin yksityiskohtaisen hallinnan tietojen käsittelyyn ja analysointiin, mikä on sen USP.

Miksi tarvitsemme SAS:n?

Ymmärretään SAS:n tarve yksinkertaisella esimerkillä:

Harkitse verkkokauppayritystä, joka haluaa tietää asiakkaidensa ostotottumukset historiallisten tietojen perusteella. Yrityksen on otettava huomioon tuhansia tietueita useista asiakkaista saadakseen yleiskuvan.

Yrityksellä ei välttämättä ole kaikkia näitä analyysiin tarvittavia tietoja. Esimerkiksi, jos asiakas ei ostanut takkia, mitkä tekijät estivät häntä ostamasta takkia? Nämä puuttuvat tiedot voivat aiheuttaa virheitä analyysiisi. Kuinka voimme päästä eroon näistä ongelmista? Kuinka voimme käsitellä tämäntyyppistä dataa?

Jos tämä tehtävä tehdään manuaalisesti, se vaatii satoja analyytikoita ja tuhansia työtunteja. Käyttämällä SAS-analyysityökalua voit tehdä saman analyysin muutamassa tunnissa yhden analyytikon kanssa. SAS-työkalun avulla voit poistaa tarpeettomat tiedot ja optimoida olennaiset tiedot. Sen avulla voit ennustaa lopputuloksen, vaikka tiedot puuttuvat. SAS:n avulla voit tehdä parempia päätöksiä.

Vaihtoehtoiset SAS-työkalut

Vaihtoehtoiset SAS-työkalut

R: Se on avoimen lähdekoodin ohjelmisto. R:n oppiminen on helppoa, koska se on hyvin dokumentoitu. Se tarjoaa vahvat tilastolliset ominaisuudet.

Python on toinen suosittu avoimen lähdekoodin komentosarjakieli. Se tukee kirjastoja, kuten Numpy, Scipy ja MatPlotLib. Voit suorittaa minkä tahansa tilastollisen toiminnon tai voit rakentaa minkä tahansa mallin näiden kirjastojen avulla.

SAS: Se on kaupallisen analytiikan markkinoilla laajalti käytetty analyyttinen työkalu. Lukuisat tilastolliset toiminnot ja hyvä graafinen käyttöliittymä.

Tässä SAS-ohjelmointiopetusohjelmassa keskustelemme Statistical Analytical Systemsistä ja siitä, kuinka sitä voidaan käyttää ongelmien ratkaisemiseen.

SAS:n historia

  • SAS:n kehittivät Jim Goodnight ja John Shall vuonna 1970 NC-yliopistossa
  • Alun perin se kehitettiin maataloustutkimusta varten.
  • Later, se laajeni työkaluvalikoimaan sisältäen muun muassa ennakoivan analytiikan, tiedonhallinnan ja BI:n.
  • Nykyään 98 maailman parhaista yrityksistä Fortune 400:ssa käyttää SAS:n data-analyysityökalua Tietojen analysointi.

Seuraavaksi tässä SAS-kielen opetusohjelmassa opimme SAS:n ominaisuuksista.

SAS:n ominaisuudet

SAS:n tärkeimmät ominaisuudet ovat:

  • Käytä helposti raakadatatiedostoja ja tietoja ulkoisesta tietokannasta. Lue ja kirjoita melkein missä tahansa tietomuodossa!
  • Hallitse tietoja tietojen syöttö-, muokkaus-, muotoilu- ja muunnostyökalujen avulla
  • Analysoi tietoja käyttämällä kuvaavia, tilastollisia, monimuuttujatekniikoita, ennustamista, mallintamista, lineaarista ohjelmointia
  • Kehittynyt analytiikka auttaa sinua tekemään muutoksia ja parannuksia liiketoimintakäytäntöihin.
  • Raportin muodostus täydellisillä kaavioilla
  • Operatutkimusta ja projektinhallintaa
  • Tietojen päivitys ja muokkaus
  • Tehokas tiedonkäsittelykieli
  • Erinomaiset tiedonpuhdistustoiminnot
  • Ole vuorovaikutuksessa useiden isäntäjärjestelmien kanssa

Seuraavaksi tässä SAS aloittelijoille -opetusohjelmassa opimme SAS-tuotepaketista.

SAS Product Suite

Markkinoilla on monia SAS-tuotteita. Seuraavassa on luettelo suosituimmista.

Nimi Tuotetiedot
Perus SAS Base SAS -ohjelmisto tarjoaa laitteiston ketteryyttä ja integroituu kaikenlaisiin laskentaympäristöihin.
SAS/GRAPH Tämän työkalun avulla voit esittää jäsennellyt tiedot kaavioiksi.
SAS/STAT Tämä työkalu auttaa sinua suorittamaan erilaisia ​​regressio-, tilastoanalyysin varianssi-, regressio- ja psykometrisiä analyysejä.
SAS/ETS Sitä käytetään ennustamiseen. Auttaa sinua suorittamaan aikasarjaanalyysin.
SAS/IML Interaktiivinen matriisikieli tunnetaan nimellä IML. Tämä työkalu auttaa sinua kääntämään matemaattiset kaavat innovatiiviseksi ohjelmaksi.
SAS EBI Työkalu Business Intelligence -sovelluksiin
SAS Grid Manager Se on ydinkomponentti, joka tarjoaa tiedonhallintamahdollisuuden ja ohjelmointikielen tietojen analysointiin
SAS/OR Työkalu Operatutkimusta
SAS/QC Käytä laadunvalvontaan
SAS/Enterprise Miner data mining
SAS/PH Kliinisen tutkimuksen analyysi
SAS/AF Se tarjoaa sovellusmahdollisuuden
Yritysopas Se on GUI-pohjainen koodieditori ja projektipäällikkö

Seuraavaksi tässä SAS-opetusoppaassa opimme SAS-arkkitehtuurista.

SAS Archirakenne

SAS Archirakenne
ArchiSAS:n rakenne

SAS-arkkitehtuuri jakautuu pääasiassa kolmeen osaan:

  • Asiakastaso
  • Keskitaso
  • Takataso

Asiakastaso

Asiakastaso on paikka, jossa sovellus asennetaan koneelle, jossa käyttäjä istuu. Se koostuu komponenteista, joita käytetään portaalin ja sen sisällön katseluun. Se sisältää myös tavallisen verkkoselaimen, jota käytetään vuorovaikutukseen portaalin kanssa tavallisen HTTP- tai HTTPS-protokollan kautta. Se auttaa myös tekemään SAS-verkkosovelluksesta palomuuriystävällisen.

Keskitaso

Keskitaso tarjoaa keskitetyn tukiaseman yritystiedoille. Kaiken pääsyn sisältöön käsittelevät tämän tason komponentit. Liiketoiminnan logiikan erottaminen näyttölogiikasta auttaa sinua hyödyntämään keskitason logiikkaa. Lisäksi keskitetyt yhteyspisteet helpottavat turvallisuussääntöjen noudattamista, portaalin hallintaa ja koodimuutosten hallintaa.

Keskimmäisellä tasolla on seuraavat toiminnot:

SAS-tiedonjakeluportaalin verkkosovellus: Se on JSP-kokoelma, Java servletit, JavaPavut ja muut luokat ja resurssit. Näiden komponenttien avulla pääset käsiksi yrityshakemistoon tallennettuihin tietoihin ja voit luoda mukautettavan käyttöliittymän käyttäjälle.

Servlet-moottori: Servlet-moottoria kutsutaan myös servlet-säiliöksi. Se vastaa SAS Information Delivery Portal -verkkosovelluksen hallinnasta. Servlet-moottori tarjoaa ajonaikaisen ympäristön. Se tarjoaa samanaikaisuuden, käyttöönoton, elinkaarihallinnan jne.

Verkkopalvelin: Web-palvelin tarjoaa palvelua servlet-moottorille, jota voidaan käyttää verkkosivuston isännöimiseen. Tähän pitäisi päästä portaalin kautta.

Takataso

Takataso on alue, jossa data- ja laskentapalvelimet toimivat ja jotka voivat sisältää liiketoimintaobjekteja. Se on yrityksen hakemistopalvelin. Yrityksen hakemistopalvelin ylläpitää metatietoja sisällöstä, joka sijaitsee kaikkialla yrityksessä.

Kuinka ladata ja asentaa SAS

Paikallinen lataus koneellesi

Vaihe 1) Lataa SAS annetusta linkistä

Siirry tähän linkkiin https://www.sas.com/en_in/software/university-edition.html ja napsauta Hanki ilmainen ohjelmisto.

Lataa ja asenna SAS

Vaihe 2) Valitse oma Operating System

Valitse käyttöjärjestelmä järjestelmäsi mukaan.

Lataa ja asenna SAS

Vaihe 3) Lataa ja asenna virtualisointiohjelmisto

SAS vaatii virtualisointiohjelmiston, kuten VirtualBox asennettava ennen kuin se voidaan asentaa. Tässä on yksityiskohtaiset vaiheet

Lataa ja asenna SAS

Asenna SAS noudattamalla näytöllä mainittuja ohjeita. ottaa VirtualBox ja paikallinen asennus voi joskus olla hankalaa. Suosittelemme AWS-asennusta

AWS-asennus

Voit ottaa SAS:n käyttöön AWS:ssä. Se on oikeutettu ilmaiseen tasoon.

Vaihe 1) Mene https://aws.amazon.com/marketplace/pp/B00WH10IKW. Napsauta "Jatka tilaamista"

Lataa ja asenna SAS

Vaihe 2) Tässä seuraavassa näytössä Hyväksy ehdot.

Lataa ja asenna SAS

Vaihe 3) Odottavan tilauksen hyväksyminen kestää jopa 10 minuuttia. Näet seuraavan näytön.

Lataa ja asenna SAS

Vaihe 4) Päivitä sivu, niin tilaus vahvistetaan. Napsauta Jatka konfigurointiin

Lataa ja asenna SAS

Vaihe 5) Säilytä oletusasetukset ja napsauta Jatka käynnistääksesi.

Lataa ja asenna SAS

Vaihe 6) Revkatso asetussivu. Syötä avain-arvo-pari. Lepoasetusten tulee olla oletusarvot. Napsauta Käynnistä

Lataa ja asenna SAS

Vaihe 7) Mene https://aws.amazon.com/marketplace/library/ ja napsauta Näytä esiintymät.

Lataa ja asenna SAS

Vaihe 8) Ponnahdusikkunassa

  1. Huomaa esiintymän tunnus. Tämä on salasanasi
  2. Napsauta Ohjelmiston käyttöoikeus

Lataa ja asenna SAS

Vaihe 9) Ponnahdusikkunaan, joka tulee näkyviin, kun napsautat vaiheessa 8

  1. Anna käyttäjän tunnistetiedot. Id: sasdemo-salasana: vaiheessa 8 merkitty esiintymän tunnus
  2. Napsauta Kirjaudu sisään

Lataa ja asenna SAS

Vaihe 10) Näet tervetulonäytön.

Lataa ja asenna SAS

Ongelmien karttoittaminen

Jos et saa yhteyttä, siirry osoitteeseen https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ja saapuvan ja lähtevän liikenteen säännöt kaikille

Kuinka käyttää SAS:ää?

Käyttääksesi SAS-ohjelmistoa tehokkaasti sinun on suoritettava neljä vaihetta, jotka ovat: Pääsytiedot, Hallintatiedot, Analysoi, Esitä

Kuinka käyttää SAS:ää
Kuinka käyttää SAS:ää

Pääsytiedot:

SAS antaa sinun käyttää tietoja missä tahansa haluamassasi muodossa.

Voit käyttää tietoja, jotka on tallennettu missä tahansa, olivatpa ne järjestelmässäsi tiedostossa tai tiedot, jotka on tallennettu toiseen tietokantajärjestelmään. Se voi olla oracle-tiedosto, SAS-tietokantatiedosto, raakatietokantatiedosto tai yksinkertainen XLS /CSV-tiedosto. Se auttaa sinua pääsemään näihin tietoihin helposti.

Hallinnoi tietoja:

SAS tarjoaa erinomaiset tiedonhallintaominaisuudet. Voit jakaa/viipaloida tietoja tiettyjen ehtojen perusteella, luoda muuttujia, puhdistaa ja vahvistaa tietoja. On olemassa muita työkaluja, joiden avulla voit suorittaa saman tehtävän. SAS kuitenkin auttaa sinua suorittamaan tämän työn helposti.

SAS:ssa on hyvin määritellyt kirjastot ja prosessit, mikä tekee ohjelmointiprosessista helppoa. Lisäksi muuttujan tai osajoukon tietojen luominen on vain yksivaiheinen prosessi. Tämä säästää sinua kirjoittamasta monimutkaisia ​​algoritmeja vain yhdellä koodirivillä.

Analysoida:

Voit tehdä erilaisia ​​analyyseja SAS:n avulla:

  • Se tarkistaa Frequency of Mean laskennan
  • Regressio ja ennustaminen
  • Päätöspuu

SAS pystyy käsittelemään kaikki nämä analyysit helposti. Se on paras työkalu tarkkaan ennustamiseen.

Present:

Jos visualisoit datan oikein, yleisön on vaivatonta samaistua siihen. On tärkeää, että työkalusi esittää tiedot sopivalla tavalla. Sitä SAS tekee puolestasi. Siinä on erinomaiset esitysominaisuudet.

You Can:

1. Listaa raportit

2. Yhteenvetoraportit

3. Graafiset raportit

4. Tulosta raportit

Esimerkki SAS-ohjelmasta

SAS-ohjelma koostuu kolmesta välttämättömästä vaiheesta:

  • Data Step
  • Proc Step
  • Lähtövaihe

DATA Vaihe

Data-askel lataa tarvittavan datajoukon SAS-muistiin ja etsii tietojoukon oikeat muuttujat. Se tallentaa myös ennätykset. Voimme käyttää datavaiheita:

  • Syötä tiedot SAS-tietosarjoihin
  • Laske arvot
  • Tarkista tai korjaa tiedot
  • Tuottaa uusia tietojoukkoja

DATA-lauseen syntaksi on:

Syntaksi

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Esimerkiksi:

Seuraava esimerkki näyttää kuinka määritellään muuttuja, nimetään tietojoukko, luodaan uusia muuttujia ja syötetään tiedot. Tässä esimerkissä voit nähdä, että merkkijonomuuttujan lopussa on $ ja numeeriset arvot ovat ilman sitä.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Huomautus: SAS-lausekkeen suorittamiseksi on määritettävä RUN-komento.

PROC-vaihe

Se suorittaa tiettyjä analyyseja tai toimintoja tuottaakseen tuloksia ja raportteja.

Syntaksi

PROC procedure_name options; #The name of the proc.
RUN;

esimerkki

Annetussa esimerkissä käytetään TAVARAT menettely, jolla tulostetaan tietojoukon numeeristen muuttujien keskiarvot.

PROC MEANS;
RUN;

OUTPUT-vaihe

Voit näyttää datan datasta ehdollisilla tuloslausekkeilla.

Syntaksi

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Jokaisen SAS-ohjelman on suoritettava kaikki edellä mainitut vaiheet lukeakseen syötetiedot, analysoidakseen tiedot ja antaakseen analyysin tulosteen. The JUOSTA lause kunkin vaiheen lopussa päättää kyseisen vaiheen suorittamisen.

Täydellinen SAS-ohjelma

Alla on täydellinen koodi jokaiselle yllä olevalle vaiheelle.

Täydellinen SAS-ohjelma

lähtö:

Täydellinen SAS-ohjelma

Täydellinen SAS-ohjelma

Täydellinen SAS-ohjelma

Missä SAS:ää käytetään?

Alla on joitain tärkeitä SAS-sovelluksia:

Teollisuus Käyttö
Lääkealan Tilastollinen analyysi, raportointi
Telecom ETL, raportointi, tiedonlouhinta, ennustaminen
Taloushallinto ETL, raportointi, tiedonlouhinta, taloustutkimus
Ennustava mallintaminen DBMarketing, toimintoperusteinen hallinta
Terveydenhuolto ETL, raportointi, tiedonlouhinta

SAS vs. R

SAS R
SAS on kaupallinen ohjelmisto, joten se vaatii taloudellista investointia. R on avoimen lähdekoodin ohjelmisto. Siksi kuka tahansa voi käyttää sitä.
SAS on helpoin analyyttinen työkalu oppia. Jopa ihmiset, joilla on vähän SQL-tietoa, voivat oppia sen nopeasti. R edellyttää monimutkaisten ja pitkien koodien kirjoittamista.
SAS on suurten yritysten suosima valinta, ja se on teknisesti varsin edistynyt ja käyttäjäystävällinen. R on nopeasti kehittyvä ohjelmisto; sinun on kuitenkin päivitettävä sitä jatkuvasti.
SAS:lla on hyvä graafinen tuki, mutta se ei tarjoa mukauttamista. R-työkalun graafinen tuki on erittäin huono.

SAS:n edut

  • SAS:ssa on helppo syntaksi, joka voidaan oppia ilman minkäänlaista ohjelmointiosaamista
  • Kyky käsitellä suurta tietokantaa helposti
  • SAS on erittäin ymmärrettävä kieli, joka voidaan helposti korjata
  • Sen "loki"-ikkuna ilmoittaa selvästi virheen, mikä auttaa sinua virheenkorjauksessa koodisi helposti
  • SAS auttaa sinua testaamaan ja analysoimaan algoritmin perusteellisesti
  • SAS on täysin suojattu, joten et voi purkaa sitä ilman lisenssiä toimistossa
  • Helpottaa tilastolaskentaa ei-ohjelmoiville käyttäjille
  • Käsittelee suurta tietokantaa tehokkaasti.

SAS:n haitat

  • Kustannukset ovat korkeat, koska henkilö tai organisaatio ei voi käyttää kaikkia sovelluksia ilman asianmukaista lisenssiä
  • SAS ei ole avoin lähdekoodi, joten SAS:ssa käytetyt algoritmit eivät ole saatavilla yleiseen käyttöön
  • Tekstin louhinta on erittäin hankala ja vaikea prosessi SAS:ssa.

Yhteenveto

  • SAS-ohjelmisto tarkoittaa tilastoanalyysiohjelmistoa, jota käytetään data-analyysiin
  • R ja Python ovat kaksi yleisesti käytettyä vaihtoehtoista SAS:n työkalua.
  • SAS:n kehittivät Jim Goodnight ja John Shall vuonna 1970 NC-yliopistossa
  • SAS antaa sinun käyttää raakadatatiedostoja ja tietoja minkä tahansa ulkoisen tietokannan kautta
  • SAS-arkkitehtuuri jakautuu pääasiassa kolmeen osaan 1) Asiakastaso 2) Keskitaso 3) Takataso
  • Käyttääksesi SAS-ohjelmistoa sinun on suoritettava neljä vaihetta, jotka ovat: 1) Pääsytiedot, 2) Hallinta 3) Analysoi tiedot, 4) Esittely
  • SAS-ohjelma koostuu kolmesta perusvaiheesta: Data Step, Proc Step ja Output Step
  • SAS tietojen analysointityökalu Sitä käytetään laajalti sellaisilla aloilla kuin lääketeollisuus, televiestintä, talous, ennakoiva mallinnus ja terveydenhuolto
  • SAS on kaupallinen ohjelmisto, kun taas R on avoimen lähdekoodin ohjelmisto
  • SAS-ohjelmointityökalun suurin etu on, että siinä on helppo syntaksi, joka voidaan oppia ilman minkäänlaista ohjelmointitietoa.
  • Yksi SAS-mallin haitoista on, että se ei ole avoimen lähdekoodin työkalu. Joten SAS-proseduureissa käytetyt algoritmit eivät ole saatavilla yleiseen käyttöön.