Yeni Başlayanlar İçin SAS Eğitimi: Nedir ve Programlama Örneği

SAS nedir?

SAS istatistiksel veri analizi ve görselleştirme için yaygın olarak kullanılan, komut odaklı bir istatistiksel yazılım paketidir. SAS'ın tam formu İstatistiksel Analiz Yazılımıdır. Çalışan üretkenliğini ve iş karını artırmanıza yardımcı olan niteliksel teknikleri ve süreçleri kullanmanıza olanak tanır. SAS ayrıca iş zekası, suç soruşturması ve tahmine dayalı analiz gibi gelişmiş analitikler için de kullanılır. SAS, “SaaS” olarak telaffuz edilir.

SAS'ta veriler çıkarılır ve kategorilere ayrılır; bu, veri modellerini tanımlamanıza ve analiz etmenize yardımcı olur. Rekabetçi ve değişen iş koşullarında etkin bir şekilde çalışabilmeniz için ileri analiz, İş Zekası, Tahmine Dayalı Analiz, veri yönetimi yapmanızı sağlayan bir yazılım paketidir. Üstelik SAS platformdan bağımsızdır; bu, SAS'ı Linux veya herhangi bir işletim sisteminde çalıştırabileceğiniz anlamına gelir. Windows.

Diğer ile karşılaştırıldığında BI araçlarıSAS, sürükle ve bırak arayüzünü kullanmanın yanı sıra, verileri programlı bir şekilde dönüştürmek ve analiz etmek için kapsamlı destek sağlar. Bu, USP'si olan veri manipülasyonu ve analizleri üzerinde çok ayrıntılı bir kontrol sağlar.

Neden SAS'a ihtiyacımız var?

Basit bir örnekle SAS ihtiyacını anlayalım:

Geçmiş verilere dayanarak müşterilerinin satın alma kalıplarını bilmek isteyen bir e-ticaret şirketini düşünün. Şirketin genel bir içgörü elde etmek için birden fazla müşterinin binlerce kaydını dikkate alması gerekecek.

Şirket, analiz için gerekli olan tüm bu verilere sahip olmayabilir. Örneğin, eğer bir müşteri bir Ceket satın almadıysa, onun Ceketi satın almamasını engelleyen faktörler nelerdir? Bu eksik veriler analizinizde hatalara neden olabilir. Bu sorunlardan nasıl kurtulabiliriz? Bu tür verileri nasıl işleyebiliriz?

Manuel olarak yapılırsa bu görev yüzlerce analist ve binlerce çalışma saati gerektirecektir. SAS analiz aracını kullanarak aynı analizi tek bir analistle birkaç saat içinde yapabilirsiniz. SAS aracı, gereksiz verileri ortadan kaldırmanıza ve ilgili bilgileri optimize etmenize olanak tanır. Eksik verilerle bile bir sonucu tahmin etmenizi sağlayacaktır. SAS daha iyi kararlar almanızı sağlar.

Alternatif SAS Araçları

Alternatif SAS Araçları

R: Açık kaynaklı bir yazılımdır. İyi belgelendiği için R'yi öğrenmek kolaydır. Güçlü istatistiksel yetenekler sunar.

Python bir başka popüler açık kaynaklı betik dilidir. Numpy, Scipy ve MatPlotLib gibi kütüphaneleri destekler. Bu kütüphaneleri kullanarak istediğiniz istatistiksel işlemi gerçekleştirebilir veya istediğiniz modeli oluşturabilirsiniz.

SAS: Ticari analitik pazarında yaygın olarak kullanılan analitik araçtır. Çok sayıda istatistiksel fonksiyon ve iyi bir GUI ile.

Bu SAS programlama eğitiminde İstatistiksel Analitik Sistemler ve bunun sorunlarımızı çözmek için nasıl kullanılabileceğini tartışacağız.

SAS geçmişi

  • SAS, 1970 yılında NC Üniversitesi'nde Jim Goodnight ve John Shall tarafından geliştirildi.
  • Başlangıçta Tarımsal Araştırmalar için geliştirildi.
  • Later, diğerlerinin yanı sıra Tahmine Dayalı Analitik, Veri Yönetimi ve BI'yı da içerecek şekilde bir araç yelpazesine genişletildi.
  • Bugün, Fortune 98'de yer alan dünyanın en büyük şirketlerinden 400'i, SAS veri analitik aracını kullanıyor. Veri analizi.

Bu SAS dil eğitiminde bir sonraki adımda SAS'ın özelliklerini öğreneceğiz.

SAS Özellikleri

SAS'ın temel özellikleri şunlardır:

  • Ham veri dosyalarına ve verilere harici bir veritabanından kolayca erişin. Hemen hemen her veri formatını okuyun ve yazın!
  • Veri girişi, düzenleme alma, biçimlendirme ve dönüştürme araçlarını kullanarak verileri yönetin
  • Tanımlayıcı, istatistik, çok değişkenli teknikler, tahmin, modelleme, doğrusal programlama kullanarak verileri analiz edin
  • Gelişmiş analitik, iş uygulamalarında değişiklik ve iyileştirmeler yapmanıza yardımcı olur.
  • Mükemmel grafiklerle rapor oluşumu
  • Operaaraştırma ve proje yönetimi
  • Veri güncelleme ve değiştirme
  • Güçlü veri işleme dili
  • Mükemmel veri temizleme işlevleri
  • Birden fazla ana bilgisayar sistemiyle etkileşim kurun

Yeni başlayanlara yönelik bu SAS eğitiminin bir sonraki bölümünde SAS Ürün paketi hakkında bilgi edineceğiz.

SAS Ürün Paketi

Piyasada birçok SAS ürünü mevcuttur. Aşağıda en popüler olanların listesi bulunmaktadır.

İsim Açıklamalar
Temel SAS Base SAS yazılımı, donanım çevikliği sunar ve her türlü bilgi işlem ortamına entegre olur.
SAS/GRAFİK Bu araç, yapılandırılmış verileri grafikler halinde temsil etmenize yardımcı olur.
SAS/STAT Bu araç farklı türde regresyon, istatistiksel analiz varyansı, regresyon ve psikometrik analiz gerçekleştirmenize yardımcı olur.
SAS/ETS Tahmin yapmak için kullanılır. Zaman serisi analizini gerçekleştirmenize yardımcı olur.
SAS/IML Etkileşimli Matrik dili IML olarak bilinir. Bu araç matematiksel formülleri yenilikçi bir programa çevirmenize yardımcı olur.
SAS EBİ İş Zekası Uygulamaları için bir araç
SAS Şebeke Yöneticisi Veri yönetimi olanağı ve veri analizi için bir programlama dili sunan temel bir bileşendir.
SAS/VEYA Aracı Operakonu araştırması
SAS/QC Kalite kontrolü için kullanın
SAS/Kurumsal Madenci Veri madenciliği
SAS/PH Klinik deneme analizi
SAS/AF Uygulama imkanı sunar
Kurumsal Kılavuz GUI tabanlı bir kod editörü ve proje yöneticisidir

Bu SAS eğitim rehberinin devamında SAS mimarisini öğreneceğiz.

SAS Archidoku

SAS Archidoku
ArchiSAS'ın yapısı

SAS mimarisi temel olarak üç bölümden oluşur:

  • Müşteri Katmanı
  • Orta Kademe
  • Arka katman

Müşteri katmanı

İstemci katmanı, uygulamanın kullanıcının oturduğu bir makineye yüklendiği yerdir. Portalı ve içeriğini görüntülemek için kullanılan bileşenlerden oluşur. Ayrıca standart HTTP veya HTTPS protokolü üzerinden portalla etkileşimde bulunmak için kullanılan standart bir web tarayıcısını da içerir. Ayrıca SAS web uygulamasını güvenlik duvarı dostu hale getirmenize de yardımcı olur.

orta seviye

Orta katman, kurumsal bilgiler için merkezi bir erişim noktası sunar. İçeriğe tüm erişim, bu katmanda çalışan bileşenler tarafından işlenir. İş mantığının ekran mantığından ayrılması, orta katmanın mantığından yararlanmanıza yardımcı olur. Ayrıca merkezi erişim noktaları, güvenlik kurallarının uygulanmasını, portalın yönetilmesini ve kod değişikliklerinin yönetilmesini kolaylaştırır.

Orta kademe aşağıdaki işlevleri barındırır:

SAS Bilgi Dağıtım Portalı Web Uygulaması: JSP'nin koleksiyonudur, Java servlet'ler, JavaFasulye ve diğer sınıflar ve kaynaklar. Bu bileşenler, kullanıcı için özelleştirilebilir bir arayüz oluşturmak amacıyla kurumsal dizinde saklanan bilgilere erişmenize yardımcı olur.

Servlet Motoru: Servlet motoruna servlet konteyneri de denir. SAS Bilgi Dağıtım Portalı Web Uygulamasının yönetilmesinden sorumludur. Servlet motoru bir çalışma zamanı ortamı sunar. Eşzamanlılık, dağıtım, yaşam döngüsü yönetimi vb. sağlar.

Web sunucusu: Web sunucusu, web sitesini barındırmak için kullanılabilecek servlet motoruna hizmet sunar. Buna portal kullanılarak erişilmelidir.

Arka Katman

Arka katman, iş nesneleri içerebilecek veri ve hesaplama sunucularının çalıştığı bir alandır. Kurumsal bir dizin sunucusudur. Kurumsal dizin sunucusu, kuruluş genelinde bulunan içerikle ilgili meta verileri korur.

SAS Nasıl İndirilir ve Kurulur

Makinenizde Yerel İndirme

Adım 1) Verilen bağlantıdan SAS'ı indirin

Bu bağlantıya git https://www.sas.com/en_in/software/university-edition.html ve Özgür Yazılım Alın'a tıklayın.

SAS'ı indirin ve yükleyin

Adım 2) Seçtiğiniz OperaZamanlama Sistemi

Sisteminize göre işletim sistemini seçin.

SAS'ı indirin ve yükleyin

Adım 3) Sanallaştırma Yazılımını indirin ve yükleyin

SAS, aşağıdaki gibi Sanallaştırma Yazılımını gerektirir: VirtualBox kurulmadan önce kurulmalıdır. İşte ayrıntılı adımlar

SAS'ı indirin ve yükleyin

SAS'ı yüklemek için ekranda belirtilen adımları izleyin. Sahip olmak VirtualBox ve yerel kurulum bazen zor olabilir. AWS kurulumunu öneriyoruz.

AWS Kurulumu

SAS'ı AWS'de dağıtabilirsiniz. Ücretsiz katmana uygundur.

) 1 Adım MyCAD'de yazılım Güncelleme ye git https://aws.amazon.com/marketplace/pp/B00WH10IKW. “Abone Olmaya Devam Et”e tıklayın

SAS'ı indirin ve yükleyin

) 2 Adım Bu sonraki ekranda Şartları Kabul Edin.

SAS'ı indirin ve yükleyin

) 3 Adım Abonelik beklemede onaylanması 10 dakikaya kadar sürer. Aşağıdaki ekranı göreceksiniz.

SAS'ı indirin ve yükleyin

) 4 Adım Sayfayı yenilediğinizde aboneliğiniz onaylanacaktır. Yapılandırmaya Devam Et'e tıklayın

SAS'ı indirin ve yükleyin

) 5 Adım Ayarları varsayılan tutun ve Başlatmaya Devam Et'i tıklayın.

SAS'ı indirin ve yükleyin

) 6 Adım Revyapılandırma sayfasını görüntüleyin. Bir anahtar/değer çifti girin. Dinlenme ayarları varsayılan olmalıdır. Başlat'ı tıklayın

SAS'ı indirin ve yükleyin

) 7 Adım MyCAD'de yazılım Güncelleme ye git https://aws.amazon.com/marketplace/library/ ve Örnekleri Görüntüle'ye tıklayın.

SAS'ı indirin ve yükleyin

) 8 Adım Açılır pencerede

  1. Örnek kimliğini not edin. Bu sizin şifreniz
  2. Erişim yazılımına tıklayın

SAS'ı indirin ve yükleyin

) 9 Adım 8. adımda tıkladıktan sonra görünen açılır pencerede

  1. Kullanıcı kimlik bilgilerini girin. Kimlik: sasdemo şifresi: 8. adımda belirtilen örnek kimliği
  2. Oturum aç'ı tıklayın

SAS'ı indirin ve yükleyin

) 10 Adım Karşılama ekranını göreceksiniz.

SAS'ı indirin ve yükleyin

Sorun giderme

Bağlanamıyorsanız şu adrese gidin: https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ve herkese gelen/giden kurallar

SAS Nasıl Kullanılır?

SAS yazılımını etkili bir şekilde kullanmak için dört adımı izlemeniz gerekir: Verilere Erişim, Verileri Yönetme, Analiz Etme, Sunma

SAS nasıl kullanılır?
SAS nasıl kullanılır?

Verilere Erişim:

SAS, verilere istediğiniz formatta erişmenizi sağlar.

İster sisteminizdeki bir dosyada olsun, ister başka bir veritabanı sisteminde saklanan verilerde olsun, saklanan verilere her yerden erişebilirsiniz. Oracle dosyası, SAS veritabanı dosyası, Raw Database dosyası veya basit bir XLS /CSV dosyası olabilir. Bu verilere kolaylıkla erişmenize yardımcı olacaktır.

Verileri Yönetin:

SAS mükemmel veri yönetimi yetenekleri sunar. Verileri belirli koşullara göre alt kümeleyebilir/dilimleyebilir, değişken oluşturabilir, verileri temizleyebilir ve doğrulayabilirsiniz. Aynı görevi gerçekleştirmenize olanak tanıyan başka araçlar da vardır. Ancak SAS bu işi kolaylıkla yapmanıza yardımcı olur.

SAS, programlama sürecini kolaylaştıran iyi tanımlanmış kütüphanelere ve süreçlere sahiptir. Dahası, değişken veya alt küme verileri oluşturmak yalnızca tek adımlı bir işlemdir. Bu, yalnızca tek bir kod satırıyla karmaşık algoritmalar yazmaktan sizi kurtarır.

Analiz et:

SAS'ı kullanarak çeşitli analiz türleri yapabilirsiniz:

  • Ortalama hesaplamanın Frekansını kontrol eder
  • Regresyon ve Tahmin
  • Karar ağacı

Tüm bu analizler SAS tarafından kolaylıkla yapılabilir. Doğru tahmin için en iyi araçtır.

Mevcut:

Verileri doğru bir şekilde görselleştirirseniz izleyicinin onunla bağlantı kurması zahmetsiz olur. Aracınızın verileri uygun bir şekilde sunması önemlidir. SAS'ın sizin için yaptığı da budur. Mükemmel sunum yeteneklerine sahiptir.

You Can:

1. Raporları listeleyin

2. Özet raporlar

3. Grafik raporları

4. Raporları yazdırın

SAS Programı Örneği

SAS Programı üç gerekli adımdan oluşur:

  • Veri Adımı
  • İşlem Adımı
  • Çıkış Adımı

VERİ Adımı

Veri adımı, gerekli veri setini SAS belleğine yükler ve veri setinin doğru değişkenlerini bulur. Aynı zamanda kayıtları da yakalar. Veri adımlarını şu amaçlarla kullanabiliriz:

  • SAS veri kümelerine veri girme
  • Değerleri Hesapla
  • Verileri kontrol edin veya düzeltin
  • Yeni veri kümeleri üretin

DATA ifadesinin sözdizimi şöyledir:

Sözdizimi

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Örnek:

Aşağıdaki örnek, bir değişkenin nasıl tanımlanacağını, veri kümesinin nasıl adlandırılacağını, yeni değişkenlerin nasıl oluşturulacağını ve verilerin nasıl girileceğini gösterir. Bu örnekte, dize değişkenlerinin sonunda $ olduğunu ve sayısal değerlerin onsuz olduğunu görebilirsiniz.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Not: SAS Bildirimini yürütmek için RUN komutunu belirtmeniz gerekir.

PROC Adımı

Sonuçları ve raporları üretmek için belirli analizleri veya işlevleri gerçekleştirir.

Sözdizimi

PROC procedure_name options; #The name of the proc.
RUN;

Örnek E-posta

Verilen örnek şunu kullanır: ANLAMINA GELİYOR Veri setindeki sayısal değişkenlerin ortalama değerlerini yazdırma prosedürü.

PROC MEANS;
RUN;

ÇIKTI Adımı

Koşullu çıktı ifadeleriyle verilerdeki verileri görüntüleyebilirsiniz.

Sözdizimi

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Her SAS programı, giriş verilerini okumak, verileri analiz etmek ve analizin çıktısını vermek için yukarıda belirtilen tüm adımları izlemelidir. KOŞMAK Her adımın sonundaki ifade o adımın yürütülmesini tamamlar.

SAS Programının tamamı

Aşağıda yukarıdaki adımların her biri için tam kod verilmiştir.

Eksiksiz SAS Programı

Çıktı:

Eksiksiz SAS Programı

Eksiksiz SAS Programı

Eksiksiz SAS Programı

SAS nerede kullanılır?

Aşağıda bazı önemli SAS uygulamaları verilmiştir:

Sanayi kullanım
İlaç İstatistiksel Analiz, Raporlama
Telekom ETL, Raporlama, Veri Madenciliği, Tahmin
Finansallar ETL, Raporlama, Veri Madenciliği, Finansal araştırma
Tahmine dayalı modelleme DB Pazarlama, Faaliyet Bazlı Yönetim
Sağlık hizmeti ETL, raporlama, Veri Madenciliği

SAS vs. R

SAS R
SAS ticari bir yazılım olduğundan finansal yatırım gerektirir. R açık kaynaklı yazılımdır. Bu nedenle herkes kullanabilir.
SAS öğrenmesi en kolay analitik araçtır. Sınırlı SQL bilgisine sahip kişiler bile bunu hızlı bir şekilde öğrenebilir. R, karmaşık ve uzun kodlar yazmanızı gerektirir.
SAS, büyük firmaların çok tercih ettiği bir seçenek olup, teknik açıdan oldukça gelişmiş ve kullanıcı dostudur. R hızlı gelişen bir yazılımdır; ancak yükseltmeye devam etmeniz gerekir.
SAS iyi bir grafik desteğine sahiptir ancak herhangi bir özelleştirme sunmamaktadır. R aracının grafik desteği çok zayıf.

SAS'ın Avantajları

  • SAS, herhangi bir programlama bilgisi gerektirmeden öğrenilebilecek kolay bir sözdizimine sahiptir
  • Büyük bir veritabanını kolaylıkla yönetebilme yeteneği
  • SAS, kolayca hata ayıklanabilen, çok anlaşılır bir dildir
  • "Günlük" penceresi, kodunuzda kolayca hata ayıklamanıza yardımcı olan hatayı açıkça belirtir
  • SAS, algoritmayı kapsamlı bir şekilde test etmenize ve analiz etmenize yardımcı olur
  • SAS tamamen güvenli olduğundan ofiste lisans olmadan veri çıkaramazsınız
  • Programlamayan kullanıcılar için istatistiksel hesaplamayı kolaylaştırır
  • Büyük boyutlu veritabanını etkili bir şekilde yönetir.

SAS'ın dezavantajları

  • Maliyet yüksektir çünkü birey veya kuruluş uygun bir lisans olmadan tüm uygulamaları kullanamaz
  • SAS açık kaynak olmadığından SAS'ta kullanılan algoritmalar ortak kullanıma açık değildir.
  • Metin madenciliği SAS'ta oldukça zahmetli ve zorlu bir süreçtir.

ÖZET

  • SAS yazılımı, Veri analitiği için kullanılan İstatistiksel Analiz Yazılımı anlamına gelir
  • R ve Python SAS'ın yaygın olarak kullanılan iki alternatif aracıdır.
  • SAS, 1970 yılında NC Üniversitesi'nde Jim Goodnight ve John Shall tarafından geliştirildi.
  • SAS, her türlü harici veritabanındaki ham veri dosyalarına ve verilere erişmenizi sağlar
  • SAS mimarisi esas olarak üç bölüme ayrılır: 1) İstemci Katmanı 2) Orta Katman 3) Arka Katman
  • SAS yazılımını kullanmak için dört adımı izlemeniz gerekir: 1)Verilere Erişim, 2)Yönetim 3) Verileri Analiz Etme, 4) Sunum
  • SAS Programı üç temel adımdan oluşur: Veri Adımı, Proc Adımı ve Çıktı Adımı
  • SAS veri analizi aracı İlaç, Telekom, Finans, Tahmine Dayalı Modelleme ve Sağlık Hizmetleri gibi sektörlerde yaygın olarak kullanılmaktadır.
  • SAS ticari bir yazılımdır, R ise açık kaynaklı bir yazılımdır
  • SAS programlama aracının en büyük yararı, herhangi bir programlama bilgisi gerektirmeden öğrenilebilecek kolay bir sözdizimine sahip olmasıdır.
  • SAS modelinin dezavantajlarından biri açık kaynaklı bir araç olmamasıdır. Dolayısıyla SAS prosedürlerinde kullanılan algoritmalar yaygın kullanıma açık değildir.