SAS-opetusohjelma aloittelijoille: Mikä on ja ohjelmointiesimerkki
Mikä on SAS?
SAS on komentopohjainen tilastollinen ohjelmistopaketti, jota käytetään laajalti tilastotietojen analysointiin ja visualisointiin. SAS:n täydellinen lomake on Statistical Analysis Software. Sen avulla voit käyttää laadullisia tekniikoita ja prosesseja, jotka auttavat sinua parantamaan työntekijöiden tuottavuutta ja liiketoiminnan voittoja. SAS:ää käytetään myös edistyneeseen analytiikkaan, kuten business intelligence -tutkimukseen, rikosten tutkimiseen ja ennakoivaan analysointiin. SAS lausutaan nimellä "SaaS".
SAS:ssa tiedot poimitaan ja luokitellaan, mikä auttaa sinua tunnistamaan ja analysoimaan tietomalleja. Se on ohjelmistopaketti, jonka avulla voit suorittaa edistyneitä analyysejä, liiketoimintatiedonhallintaa, ennakoivaa analyysiä ja tiedonhallintaa toimiaksesi tehokkaasti kilpailutilanteessa ja muuttuvissa liiketoimintaolosuhteissa. Lisäksi SAS on alustariippumaton, mikä tarkoittaa, että voit käyttää SAS:ää missä tahansa käyttöjärjestelmässä, joko Linuxissa tai Windows.
Verrattuna muihin BI-työkalut, SAS tarjoaa laajan tuen tietojen ohjelmalliseen muuntamiseen ja analysointiin vedä ja pudota -käyttöliittymän käytön lisäksi. Tämä tarjoaa erittäin yksityiskohtaisen hallinnan tietojen käsittelyyn ja analysointiin, mikä on sen USP.
Miksi tarvitsemme SAS:n?
Ymmärretään SAS:n tarve yksinkertaisella esimerkillä:
Harkitse verkkokauppayritystä, joka haluaa tietää asiakkaidensa ostotottumukset historiallisten tietojen perusteella. Yrityksen on otettava huomioon tuhansia tietueita useista asiakkaista saadakseen yleiskuvan.
Yrityksellä ei välttämättä ole kaikkia näitä analyysiin tarvittavia tietoja. Esimerkiksi, jos asiakas ei ostanut takkia, mitkä tekijät estivät häntä ostamasta takkia? Nämä puuttuvat tiedot voivat aiheuttaa virheitä analyysiisi. Kuinka voimme päästä eroon näistä ongelmista? Kuinka voimme käsitellä tämäntyyppistä dataa?
Jos tämä tehtävä tehdään manuaalisesti, se vaatii satoja analyytikoita ja tuhansia työtunteja. Käyttämällä SAS-analyysityökalua voit tehdä saman analyysin muutamassa tunnissa yhden analyytikon kanssa. SAS-työkalun avulla voit poistaa tarpeettomat tiedot ja optimoida olennaiset tiedot. Sen avulla voit ennustaa lopputuloksen, vaikka tiedot puuttuvat. SAS:n avulla voit tehdä parempia päätöksiä.
Vaihtoehtoiset SAS-työkalut
R: Se on avoimen lähdekoodin ohjelmisto. R:n oppiminen on helppoa, koska se on hyvin dokumentoitu. Se tarjoaa vahvat tilastolliset ominaisuudet.
Python on toinen suosittu avoimen lähdekoodin komentosarjakieli. Se tukee kirjastoja, kuten Numpy, Scipy ja MatPlotLib. Voit suorittaa minkä tahansa tilastollisen toiminnon tai voit rakentaa minkä tahansa mallin näiden kirjastojen avulla.
SAS: Se on kaupallisen analytiikan markkinoilla laajalti käytetty analyyttinen työkalu. Lukuisat tilastolliset toiminnot ja hyvä graafinen käyttöliittymä.
Tässä SAS-ohjelmointiopetusohjelmassa keskustelemme Statistical Analytical Systemsistä ja siitä, kuinka sitä voidaan käyttää ongelmien ratkaisemiseen.
SAS:n historia
- SAS:n kehittivät Jim Goodnight ja John Shall vuonna 1970 NC-yliopistossa
- Alun perin se kehitettiin maataloustutkimusta varten.
- Later, se laajeni työkaluvalikoimaan sisältäen muun muassa ennakoivan analytiikan, tiedonhallinnan ja BI:n.
- Nykyään 98 maailman parhaista yrityksistä Fortune 400:ssa käyttää SAS:n data-analyysityökalua Tietojen analysointi.
Seuraavaksi tässä SAS-kielen opetusohjelmassa opimme SAS:n ominaisuuksista.
SAS:n ominaisuudet
SAS:n tärkeimmät ominaisuudet ovat:
- Käytä helposti raakadatatiedostoja ja tietoja ulkoisesta tietokannasta. Lue ja kirjoita melkein missä tahansa tietomuodossa!
- Hallitse tietoja tietojen syöttö-, muokkaus-, muotoilu- ja muunnostyökalujen avulla
- Analysoi tietoja käyttämällä kuvaavia, tilastollisia, monimuuttujatekniikoita, ennustamista, mallintamista, lineaarista ohjelmointia
- Kehittynyt analytiikka auttaa sinua tekemään muutoksia ja parannuksia liiketoimintakäytäntöihin.
- Raportin muodostus täydellisillä kaavioilla
- Operatutkimusta ja projektinhallintaa
- Tietojen päivitys ja muokkaus
- Tehokas tiedonkäsittelykieli
- Erinomaiset tiedonpuhdistustoiminnot
- Ole vuorovaikutuksessa useiden isäntäjärjestelmien kanssa
Seuraavaksi tässä SAS aloittelijoille -opetusohjelmassa opimme SAS-tuotepaketista.
SAS Product Suite
Markkinoilla on monia SAS-tuotteita. Seuraavassa on luettelo suosituimmista.
Nimi | Tuotetiedot |
---|---|
Perus SAS | Base SAS -ohjelmisto tarjoaa laitteiston ketteryyttä ja integroituu kaikenlaisiin laskentaympäristöihin. |
SAS/GRAPH | Tämän työkalun avulla voit esittää jäsennellyt tiedot kaavioiksi. |
SAS/STAT | Tämä työkalu auttaa sinua suorittamaan erilaisia regressio-, tilastoanalyysin varianssi-, regressio- ja psykometrisiä analyysejä. |
SAS/ETS | Sitä käytetään ennustamiseen. Auttaa sinua suorittamaan aikasarjaanalyysin. |
SAS/IML | Interaktiivinen matriisikieli tunnetaan nimellä IML. Tämä työkalu auttaa sinua kääntämään matemaattiset kaavat innovatiiviseksi ohjelmaksi. |
SAS EBI | Työkalu Business Intelligence -sovelluksiin |
SAS Grid Manager | Se on ydinkomponentti, joka tarjoaa tiedonhallintamahdollisuuden ja ohjelmointikielen tietojen analysointiin |
SAS/OR | Työkalu Operatutkimusta |
SAS/QC | Käytä laadunvalvontaan |
SAS/Enterprise Miner | data mining |
SAS/PH | Kliinisen tutkimuksen analyysi |
SAS/AF | Se tarjoaa sovellusmahdollisuuden |
Yritysopas | Se on GUI-pohjainen koodieditori ja projektipäällikkö |
Seuraavaksi tässä SAS-opetusoppaassa opimme SAS-arkkitehtuurista.
SAS Archirakenne
SAS-arkkitehtuuri jakautuu pääasiassa kolmeen osaan:
- Asiakastaso
- Keskitaso
- Takataso
Asiakastaso
Asiakastaso on paikka, jossa sovellus asennetaan koneelle, jossa käyttäjä istuu. Se koostuu komponenteista, joita käytetään portaalin ja sen sisällön katseluun. Se sisältää myös tavallisen verkkoselaimen, jota käytetään vuorovaikutukseen portaalin kanssa tavallisen HTTP- tai HTTPS-protokollan kautta. Se auttaa myös tekemään SAS-verkkosovelluksesta palomuuriystävällisen.
Keskitaso
Keskitaso tarjoaa keskitetyn tukiaseman yritystiedoille. Kaiken pääsyn sisältöön käsittelevät tämän tason komponentit. Liiketoiminnan logiikan erottaminen näyttölogiikasta auttaa sinua hyödyntämään keskitason logiikkaa. Lisäksi keskitetyt yhteyspisteet helpottavat turvallisuussääntöjen noudattamista, portaalin hallintaa ja koodimuutosten hallintaa.
Keskimmäisellä tasolla on seuraavat toiminnot:
SAS-tiedonjakeluportaalin verkkosovellus: Se on JSP-kokoelma, Java servletit, JavaPavut ja muut luokat ja resurssit. Näiden komponenttien avulla pääset käsiksi yrityshakemistoon tallennettuihin tietoihin ja voit luoda mukautettavan käyttöliittymän käyttäjälle.
Servlet-moottori: Servlet-moottoria kutsutaan myös servlet-säiliöksi. Se vastaa SAS Information Delivery Portal -verkkosovelluksen hallinnasta. Servlet-moottori tarjoaa ajonaikaisen ympäristön. Se tarjoaa samanaikaisuuden, käyttöönoton, elinkaarihallinnan jne.
Verkkopalvelin: Web-palvelin tarjoaa palvelua servlet-moottorille, jota voidaan käyttää verkkosivuston isännöimiseen. Tähän pitäisi päästä portaalin kautta.
Takataso
Takataso on alue, jossa data- ja laskentapalvelimet toimivat ja jotka voivat sisältää liiketoimintaobjekteja. Se on yrityksen hakemistopalvelin. Yrityksen hakemistopalvelin ylläpitää metatietoja sisällöstä, joka sijaitsee kaikkialla yrityksessä.
Kuinka ladata ja asentaa SAS
Paikallinen lataus koneellesi
Vaihe 1) Lataa SAS annetusta linkistä
Siirry tähän linkkiin https://www.sas.com/en_in/software/university-edition.html ja napsauta Hanki ilmainen ohjelmisto.
Vaihe 2) Valitse oma Operating System
Valitse käyttöjärjestelmä järjestelmäsi mukaan.
Vaihe 3) Lataa ja asenna virtualisointiohjelmisto
SAS vaatii virtualisointiohjelmiston, kuten VirtualBox asennettava ennen kuin se voidaan asentaa. Tässä on yksityiskohtaiset vaiheet
Asenna SAS noudattamalla näytöllä mainittuja ohjeita. ottaa VirtualBox ja paikallinen asennus voi joskus olla hankalaa. Suosittelemme AWS-asennusta
AWS-asennus
Voit ottaa SAS:n käyttöön AWS:ssä. Se on oikeutettu ilmaiseen tasoon.
Vaihe 1) Mene https://aws.amazon.com/marketplace/pp/B00WH10IKW. Napsauta "Jatka tilaamista"
Vaihe 2) Tässä seuraavassa näytössä Hyväksy ehdot.
Vaihe 3) Odottavan tilauksen hyväksyminen kestää jopa 10 minuuttia. Näet seuraavan näytön.
Vaihe 4) Päivitä sivu, niin tilaus vahvistetaan. Napsauta Jatka konfigurointiin
Vaihe 5) Säilytä oletusasetukset ja napsauta Jatka käynnistääksesi.
Vaihe 6) Revkatso asetussivu. Syötä avain-arvo-pari. Lepoasetusten tulee olla oletusarvot. Napsauta Käynnistä
Vaihe 7) Mene https://aws.amazon.com/marketplace/library/ ja napsauta Näytä esiintymät.
Vaihe 8) Ponnahdusikkunassa
- Huomaa esiintymän tunnus. Tämä on salasanasi
- Napsauta Ohjelmiston käyttöoikeus
Vaihe 9) Ponnahdusikkunaan, joka tulee näkyviin, kun napsautat vaiheessa 8
- Anna käyttäjän tunnistetiedot. Id: sasdemo-salasana: vaiheessa 8 merkitty esiintymän tunnus
- Napsauta Kirjaudu sisään
Vaihe 10) Näet tervetulonäytön.
Ongelmien karttoittaminen
Jos et saa yhteyttä, siirry osoitteeseen https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ja saapuvan ja lähtevän liikenteen säännöt kaikille
Kuinka käyttää SAS:ää?
Käyttääksesi SAS-ohjelmistoa tehokkaasti sinun on suoritettava neljä vaihetta, jotka ovat: Pääsytiedot, Hallintatiedot, Analysoi, Esitä
Pääsytiedot:
SAS antaa sinun käyttää tietoja missä tahansa haluamassasi muodossa.
Voit käyttää tietoja, jotka on tallennettu missä tahansa, olivatpa ne järjestelmässäsi tiedostossa tai tiedot, jotka on tallennettu toiseen tietokantajärjestelmään. Se voi olla oracle-tiedosto, SAS-tietokantatiedosto, raakatietokantatiedosto tai yksinkertainen XLS /CSV-tiedosto. Se auttaa sinua pääsemään näihin tietoihin helposti.
Hallinnoi tietoja:
SAS tarjoaa erinomaiset tiedonhallintaominaisuudet. Voit jakaa/viipaloida tietoja tiettyjen ehtojen perusteella, luoda muuttujia, puhdistaa ja vahvistaa tietoja. On olemassa muita työkaluja, joiden avulla voit suorittaa saman tehtävän. SAS kuitenkin auttaa sinua suorittamaan tämän työn helposti.
SAS:ssa on hyvin määritellyt kirjastot ja prosessit, mikä tekee ohjelmointiprosessista helppoa. Lisäksi muuttujan tai osajoukon tietojen luominen on vain yksivaiheinen prosessi. Tämä säästää sinua kirjoittamasta monimutkaisia algoritmeja vain yhdellä koodirivillä.
Analysoida:
Voit tehdä erilaisia analyyseja SAS:n avulla:
- Se tarkistaa Frequency of Mean laskennan
- Regressio ja ennustaminen
- Päätöspuu
SAS pystyy käsittelemään kaikki nämä analyysit helposti. Se on paras työkalu tarkkaan ennustamiseen.
Present:
Jos visualisoit datan oikein, yleisön on vaivatonta samaistua siihen. On tärkeää, että työkalusi esittää tiedot sopivalla tavalla. Sitä SAS tekee puolestasi. Siinä on erinomaiset esitysominaisuudet.
You Can:
1. Listaa raportit
2. Yhteenvetoraportit
3. Graafiset raportit
4. Tulosta raportit
Esimerkki SAS-ohjelmasta
SAS-ohjelma koostuu kolmesta välttämättömästä vaiheesta:
- Data Step
- Proc Step
- Lähtövaihe
DATA Vaihe
Data-askel lataa tarvittavan datajoukon SAS-muistiin ja etsii tietojoukon oikeat muuttujat. Se tallentaa myös ennätykset. Voimme käyttää datavaiheita:
- Syötä tiedot SAS-tietosarjoihin
- Laske arvot
- Tarkista tai korjaa tiedot
- Tuottaa uusia tietojoukkoja
DATA-lauseen syntaksi on:
Syntaksi
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Esimerkiksi:
Seuraava esimerkki näyttää kuinka määritellään muuttuja, nimetään tietojoukko, luodaan uusia muuttujia ja syötetään tiedot. Tässä esimerkissä voit nähdä, että merkkijonomuuttujan lopussa on $ ja numeeriset arvot ovat ilman sitä.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Huomautus: SAS-lausekkeen suorittamiseksi on määritettävä RUN-komento.
PROC-vaihe
Se suorittaa tiettyjä analyyseja tai toimintoja tuottaakseen tuloksia ja raportteja.
Syntaksi
PROC procedure_name options; #The name of the proc. RUN;
esimerkki
Annetussa esimerkissä käytetään TAVARAT menettely, jolla tulostetaan tietojoukon numeeristen muuttujien keskiarvot.
PROC MEANS; RUN;
OUTPUT-vaihe
Voit näyttää datan datasta ehdollisilla tuloslausekkeilla.
Syntaksi
PROC PRINT DATA = data_set; OPTIONS; RUN;
Jokaisen SAS-ohjelman on suoritettava kaikki edellä mainitut vaiheet lukeakseen syötetiedot, analysoidakseen tiedot ja antaakseen analyysin tulosteen. The JUOSTA lause kunkin vaiheen lopussa päättää kyseisen vaiheen suorittamisen.
Täydellinen SAS-ohjelma
Alla on täydellinen koodi jokaiselle yllä olevalle vaiheelle.
lähtö:
Missä SAS:ää käytetään?
Alla on joitain tärkeitä SAS-sovelluksia:
Teollisuus | Käyttö |
---|---|
Lääkealan | Tilastollinen analyysi, raportointi |
Telecom | ETL, raportointi, tiedonlouhinta, ennustaminen |
Taloushallinto | ETL, raportointi, tiedonlouhinta, taloustutkimus |
Ennustava mallintaminen | DBMarketing, toimintoperusteinen hallinta |
Terveydenhuolto | ETL, raportointi, tiedonlouhinta |
SAS vs. R
SAS | R |
---|---|
SAS on kaupallinen ohjelmisto, joten se vaatii taloudellista investointia. | R on avoimen lähdekoodin ohjelmisto. Siksi kuka tahansa voi käyttää sitä. |
SAS on helpoin analyyttinen työkalu oppia. Jopa ihmiset, joilla on vähän SQL-tietoa, voivat oppia sen nopeasti. | R edellyttää monimutkaisten ja pitkien koodien kirjoittamista. |
SAS on suurten yritysten suosima valinta, ja se on teknisesti varsin edistynyt ja käyttäjäystävällinen. | R on nopeasti kehittyvä ohjelmisto; sinun on kuitenkin päivitettävä sitä jatkuvasti. |
SAS:lla on hyvä graafinen tuki, mutta se ei tarjoa mukauttamista. | R-työkalun graafinen tuki on erittäin huono. |
SAS:n edut
- SAS:ssa on helppo syntaksi, joka voidaan oppia ilman minkäänlaista ohjelmointiosaamista
- Kyky käsitellä suurta tietokantaa helposti
- SAS on erittäin ymmärrettävä kieli, joka voidaan helposti korjata
- Sen "loki"-ikkuna ilmoittaa selvästi virheen, mikä auttaa sinua virheenkorjauksessa koodisi helposti
- SAS auttaa sinua testaamaan ja analysoimaan algoritmin perusteellisesti
- SAS on täysin suojattu, joten et voi purkaa sitä ilman lisenssiä toimistossa
- Helpottaa tilastolaskentaa ei-ohjelmoiville käyttäjille
- Käsittelee suurta tietokantaa tehokkaasti.
SAS:n haitat
- Kustannukset ovat korkeat, koska henkilö tai organisaatio ei voi käyttää kaikkia sovelluksia ilman asianmukaista lisenssiä
- SAS ei ole avoin lähdekoodi, joten SAS:ssa käytetyt algoritmit eivät ole saatavilla yleiseen käyttöön
- Tekstin louhinta on erittäin hankala ja vaikea prosessi SAS:ssa.
Yhteenveto
- SAS-ohjelmisto tarkoittaa tilastoanalyysiohjelmistoa, jota käytetään data-analyysiin
- R ja Python ovat kaksi yleisesti käytettyä vaihtoehtoista SAS:n työkalua.
- SAS:n kehittivät Jim Goodnight ja John Shall vuonna 1970 NC-yliopistossa
- SAS antaa sinun käyttää raakadatatiedostoja ja tietoja minkä tahansa ulkoisen tietokannan kautta
- SAS-arkkitehtuuri jakautuu pääasiassa kolmeen osaan 1) Asiakastaso 2) Keskitaso 3) Takataso
- Käyttääksesi SAS-ohjelmistoa sinun on suoritettava neljä vaihetta, jotka ovat: 1) Pääsytiedot, 2) Hallinta 3) Analysoi tiedot, 4) Esittely
- SAS-ohjelma koostuu kolmesta perusvaiheesta: Data Step, Proc Step ja Output Step
- SAS tietojen analysointityökalu Sitä käytetään laajalti sellaisilla aloilla kuin lääketeollisuus, televiestintä, talous, ennakoiva mallinnus ja terveydenhuolto
- SAS on kaupallinen ohjelmisto, kun taas R on avoimen lähdekoodin ohjelmisto
- SAS-ohjelmointityökalun suurin etu on, että siinä on helppo syntaksi, joka voidaan oppia ilman minkäänlaista ohjelmointitietoa.
- Yksi SAS-mallin haitoista on, että se ei ole avoimen lähdekoodin työkalu. Joten SAS-proseduureissa käytetyt algoritmit eivät ole saatavilla yleiseen käyttöön.