Yeni Başlayanlar İçin SAS Eğitimi: Nedir ve Programlama Örneği
SAS nedir?
SAS istatistiksel veri analizi ve görselleştirme için yaygın olarak kullanılan, komut odaklı bir istatistiksel yazılım paketidir. SAS'ın tam formu İstatistiksel Analiz Yazılımıdır. Çalışan üretkenliğini ve iş karını artırmanıza yardımcı olan niteliksel teknikleri ve süreçleri kullanmanıza olanak tanır. SAS ayrıca iş zekası, suç soruşturması ve tahmine dayalı analiz gibi gelişmiş analitikler için de kullanılır. SAS, “SaaS” olarak telaffuz edilir.
SAS'ta veriler çıkarılır ve kategorilere ayrılır; bu, veri modellerini tanımlamanıza ve analiz etmenize yardımcı olur. Rekabetçi ve değişen iş koşullarında etkin bir şekilde çalışabilmeniz için ileri analiz, İş Zekası, Tahmine Dayalı Analiz, veri yönetimi yapmanızı sağlayan bir yazılım paketidir. Üstelik SAS platformdan bağımsızdır; bu, SAS'ı Linux veya herhangi bir işletim sisteminde çalıştırabileceğiniz anlamına gelir. Windows.
Diğer ile karşılaştırıldığında BI araçlarıSAS, sürükle ve bırak arayüzünü kullanmanın yanı sıra, verileri programlı bir şekilde dönüştürmek ve analiz etmek için kapsamlı destek sağlar. Bu, USP'si olan veri manipülasyonu ve analizleri üzerinde çok ayrıntılı bir kontrol sağlar.
Neden SAS'a ihtiyacımız var?
Basit bir örnekle SAS ihtiyacını anlayalım:
Geçmiş verilere dayanarak müşterilerinin satın alma kalıplarını bilmek isteyen bir e-ticaret şirketini düşünün. Şirketin genel bir içgörü elde etmek için birden fazla müşterinin binlerce kaydını dikkate alması gerekecek.
Şirket, analiz için gerekli olan tüm bu verilere sahip olmayabilir. Örneğin, eğer bir müşteri bir Ceket satın almadıysa, onun Ceketi satın almamasını engelleyen faktörler nelerdir? Bu eksik veriler analizinizde hatalara neden olabilir. Bu sorunlardan nasıl kurtulabiliriz? Bu tür verileri nasıl işleyebiliriz?
Manuel olarak yapılırsa bu görev yüzlerce analist ve binlerce çalışma saati gerektirecektir. SAS analiz aracını kullanarak aynı analizi tek bir analistle birkaç saat içinde yapabilirsiniz. SAS aracı, gereksiz verileri ortadan kaldırmanıza ve ilgili bilgileri optimize etmenize olanak tanır. Eksik verilerle bile bir sonucu tahmin etmenizi sağlayacaktır. SAS daha iyi kararlar almanızı sağlar.
Alternatif SAS Araçları
R: Açık kaynaklı bir yazılımdır. İyi belgelendiği için R'yi öğrenmek kolaydır. Güçlü istatistiksel yetenekler sunar.
Python bir başka popüler açık kaynaklı betik dilidir. Numpy, Scipy ve MatPlotLib gibi kütüphaneleri destekler. Bu kütüphaneleri kullanarak istediğiniz istatistiksel işlemi gerçekleştirebilir veya istediğiniz modeli oluşturabilirsiniz.
SAS: Ticari analitik pazarında yaygın olarak kullanılan analitik araçtır. Çok sayıda istatistiksel fonksiyon ve iyi bir GUI ile.
Bu SAS programlama eğitiminde İstatistiksel Analitik Sistemler ve bunun sorunlarımızı çözmek için nasıl kullanılabileceğini tartışacağız.
SAS geçmişi
- SAS, 1970 yılında NC Üniversitesi'nde Jim Goodnight ve John Shall tarafından geliştirildi.
- Başlangıçta Tarımsal Araştırmalar için geliştirildi.
- Later, diğerlerinin yanı sıra Tahmine Dayalı Analitik, Veri Yönetimi ve BI'yı da içerecek şekilde bir araç yelpazesine genişletildi.
- Bugün, Fortune 98'de yer alan dünyanın en büyük şirketlerinden 400'i, SAS veri analitik aracını kullanıyor. Veri analizi.
Bu SAS dil eğitiminde bir sonraki adımda SAS'ın özelliklerini öğreneceğiz.
SAS Özellikleri
SAS'ın temel özellikleri şunlardır:
- Ham veri dosyalarına ve verilere harici bir veritabanından kolayca erişin. Hemen hemen her veri formatını okuyun ve yazın!
- Veri girişi, düzenleme alma, biçimlendirme ve dönüştürme araçlarını kullanarak verileri yönetin
- Tanımlayıcı, istatistik, çok değişkenli teknikler, tahmin, modelleme, doğrusal programlama kullanarak verileri analiz edin
- Gelişmiş analitik, iş uygulamalarında değişiklik ve iyileştirmeler yapmanıza yardımcı olur.
- Mükemmel grafiklerle rapor oluşumu
- Operaaraştırma ve proje yönetimi
- Veri güncelleme ve değiştirme
- Güçlü veri işleme dili
- Mükemmel veri temizleme işlevleri
- Birden fazla ana bilgisayar sistemiyle etkileşim kurun
Yeni başlayanlara yönelik bu SAS eğitiminin bir sonraki bölümünde SAS Ürün paketi hakkında bilgi edineceğiz.
SAS Ürün Paketi
Piyasada birçok SAS ürünü mevcuttur. Aşağıda en popüler olanların listesi bulunmaktadır.
İsim | Açıklamalar |
---|---|
Temel SAS | Base SAS yazılımı, donanım çevikliği sunar ve her türlü bilgi işlem ortamına entegre olur. |
SAS/GRAFİK | Bu araç, yapılandırılmış verileri grafikler halinde temsil etmenize yardımcı olur. |
SAS/STAT | Bu araç farklı türde regresyon, istatistiksel analiz varyansı, regresyon ve psikometrik analiz gerçekleştirmenize yardımcı olur. |
SAS/ETS | Tahmin yapmak için kullanılır. Zaman serisi analizini gerçekleştirmenize yardımcı olur. |
SAS/IML | Etkileşimli Matrik dili IML olarak bilinir. Bu araç matematiksel formülleri yenilikçi bir programa çevirmenize yardımcı olur. |
SAS EBİ | İş Zekası Uygulamaları için bir araç |
SAS Şebeke Yöneticisi | Veri yönetimi olanağı ve veri analizi için bir programlama dili sunan temel bir bileşendir. |
SAS/VEYA | Aracı Operakonu araştırması |
SAS/QC | Kalite kontrolü için kullanın |
SAS/Kurumsal Madenci | Veri madenciliği |
SAS/PH | Klinik deneme analizi |
SAS/AF | Uygulama imkanı sunar |
Kurumsal Kılavuz | GUI tabanlı bir kod editörü ve proje yöneticisidir |
Bu SAS eğitim rehberinin devamında SAS mimarisini öğreneceğiz.
SAS Archidoku
SAS mimarisi temel olarak üç bölümden oluşur:
- Müşteri Katmanı
- Orta Kademe
- Arka katman
Müşteri katmanı
İstemci katmanı, uygulamanın kullanıcının oturduğu bir makineye yüklendiği yerdir. Portalı ve içeriğini görüntülemek için kullanılan bileşenlerden oluşur. Ayrıca standart HTTP veya HTTPS protokolü üzerinden portalla etkileşimde bulunmak için kullanılan standart bir web tarayıcısını da içerir. Ayrıca SAS web uygulamasını güvenlik duvarı dostu hale getirmenize de yardımcı olur.
orta seviye
Orta katman, kurumsal bilgiler için merkezi bir erişim noktası sunar. İçeriğe tüm erişim, bu katmanda çalışan bileşenler tarafından işlenir. İş mantığının ekran mantığından ayrılması, orta katmanın mantığından yararlanmanıza yardımcı olur. Ayrıca merkezi erişim noktaları, güvenlik kurallarının uygulanmasını, portalın yönetilmesini ve kod değişikliklerinin yönetilmesini kolaylaştırır.
Orta kademe aşağıdaki işlevleri barındırır:
SAS Bilgi Dağıtım Portalı Web Uygulaması: JSP'nin koleksiyonudur, Java servlet'ler, JavaFasulye ve diğer sınıflar ve kaynaklar. Bu bileşenler, kullanıcı için özelleştirilebilir bir arayüz oluşturmak amacıyla kurumsal dizinde saklanan bilgilere erişmenize yardımcı olur.
Servlet Motoru: Servlet motoruna servlet konteyneri de denir. SAS Bilgi Dağıtım Portalı Web Uygulamasının yönetilmesinden sorumludur. Servlet motoru bir çalışma zamanı ortamı sunar. Eşzamanlılık, dağıtım, yaşam döngüsü yönetimi vb. sağlar.
Web sunucusu: Web sunucusu, web sitesini barındırmak için kullanılabilecek servlet motoruna hizmet sunar. Buna portal kullanılarak erişilmelidir.
Arka Katman
Arka katman, iş nesneleri içerebilecek veri ve hesaplama sunucularının çalıştığı bir alandır. Kurumsal bir dizin sunucusudur. Kurumsal dizin sunucusu, kuruluş genelinde bulunan içerikle ilgili meta verileri korur.
SAS Nasıl İndirilir ve Kurulur
Makinenizde Yerel İndirme
Adım 1) Verilen bağlantıdan SAS'ı indirin
Bu bağlantıya git https://www.sas.com/en_in/software/university-edition.html ve Özgür Yazılım Alın'a tıklayın.
Adım 2) Seçtiğiniz OperaZamanlama Sistemi
Sisteminize göre işletim sistemini seçin.
Adım 3) Sanallaştırma Yazılımını indirin ve yükleyin
SAS, aşağıdaki gibi Sanallaştırma Yazılımını gerektirir: VirtualBox kurulmadan önce kurulmalıdır. İşte ayrıntılı adımlar
SAS'ı yüklemek için ekranda belirtilen adımları izleyin. Sahip olmak VirtualBox ve yerel kurulum bazen zor olabilir. AWS kurulumunu öneriyoruz.
AWS Kurulumu
SAS'ı AWS'de dağıtabilirsiniz. Ücretsiz katmana uygundur.
) 1 Adım MyCAD'de yazılım Güncelleme ye git https://aws.amazon.com/marketplace/pp/B00WH10IKW. “Abone Olmaya Devam Et”e tıklayın
) 2 Adım Bu sonraki ekranda Şartları Kabul Edin.
) 3 Adım Abonelik beklemede onaylanması 10 dakikaya kadar sürer. Aşağıdaki ekranı göreceksiniz.
) 4 Adım Sayfayı yenilediğinizde aboneliğiniz onaylanacaktır. Yapılandırmaya Devam Et'e tıklayın
) 5 Adım Ayarları varsayılan tutun ve Başlatmaya Devam Et'i tıklayın.
) 6 Adım Revyapılandırma sayfasını görüntüleyin. Bir anahtar/değer çifti girin. Dinlenme ayarları varsayılan olmalıdır. Başlat'ı tıklayın
) 7 Adım MyCAD'de yazılım Güncelleme ye git https://aws.amazon.com/marketplace/library/ ve Örnekleri Görüntüle'ye tıklayın.
) 8 Adım Açılır pencerede
- Örnek kimliğini not edin. Bu sizin şifreniz
- Erişim yazılımına tıklayın
) 9 Adım 8. adımda tıkladıktan sonra görünen açılır pencerede
- Kullanıcı kimlik bilgilerini girin. Kimlik: sasdemo şifresi: 8. adımda belirtilen örnek kimliği
- Oturum aç'ı tıklayın
) 10 Adım Karşılama ekranını göreceksiniz.
Sorun giderme
Bağlanamıyorsanız şu adrese gidin: https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId ve herkese gelen/giden kurallar
SAS Nasıl Kullanılır?
SAS yazılımını etkili bir şekilde kullanmak için dört adımı izlemeniz gerekir: Verilere Erişim, Verileri Yönetme, Analiz Etme, Sunma
Verilere Erişim:
SAS, verilere istediğiniz formatta erişmenizi sağlar.
İster sisteminizdeki bir dosyada olsun, ister başka bir veritabanı sisteminde saklanan verilerde olsun, saklanan verilere her yerden erişebilirsiniz. Oracle dosyası, SAS veritabanı dosyası, Raw Database dosyası veya basit bir XLS /CSV dosyası olabilir. Bu verilere kolaylıkla erişmenize yardımcı olacaktır.
Verileri Yönetin:
SAS mükemmel veri yönetimi yetenekleri sunar. Verileri belirli koşullara göre alt kümeleyebilir/dilimleyebilir, değişken oluşturabilir, verileri temizleyebilir ve doğrulayabilirsiniz. Aynı görevi gerçekleştirmenize olanak tanıyan başka araçlar da vardır. Ancak SAS bu işi kolaylıkla yapmanıza yardımcı olur.
SAS, programlama sürecini kolaylaştıran iyi tanımlanmış kütüphanelere ve süreçlere sahiptir. Dahası, değişken veya alt küme verileri oluşturmak yalnızca tek adımlı bir işlemdir. Bu, yalnızca tek bir kod satırıyla karmaşık algoritmalar yazmaktan sizi kurtarır.
Analiz et:
SAS'ı kullanarak çeşitli analiz türleri yapabilirsiniz:
- Ortalama hesaplamanın Frekansını kontrol eder
- Regresyon ve Tahmin
- Karar ağacı
Tüm bu analizler SAS tarafından kolaylıkla yapılabilir. Doğru tahmin için en iyi araçtır.
Mevcut:
Verileri doğru bir şekilde görselleştirirseniz izleyicinin onunla bağlantı kurması zahmetsiz olur. Aracınızın verileri uygun bir şekilde sunması önemlidir. SAS'ın sizin için yaptığı da budur. Mükemmel sunum yeteneklerine sahiptir.
You Can:
1. Raporları listeleyin
2. Özet raporlar
3. Grafik raporları
4. Raporları yazdırın
SAS Programı Örneği
SAS Programı üç gerekli adımdan oluşur:
- Veri Adımı
- İşlem Adımı
- Çıkış Adımı
VERİ Adımı
Veri adımı, gerekli veri setini SAS belleğine yükler ve veri setinin doğru değişkenlerini bulur. Aynı zamanda kayıtları da yakalar. Veri adımlarını şu amaçlarla kullanabiliriz:
- SAS veri kümelerine veri girme
- Değerleri Hesapla
- Verileri kontrol edin veya düzeltin
- Yeni veri kümeleri üretin
DATA ifadesinin sözdizimi şöyledir:
Sözdizimi
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
Örnek:
Aşağıdaki örnek, bir değişkenin nasıl tanımlanacağını, veri kümesinin nasıl adlandırılacağını, yeni değişkenlerin nasıl oluşturulacağını ve verilerin nasıl girileceğini gösterir. Bu örnekte, dize değişkenlerinin sonunda $ olduğunu ve sayısal değerlerin onsuz olduğunu görebilirsiniz.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Not: SAS Bildirimini yürütmek için RUN komutunu belirtmeniz gerekir.
PROC Adımı
Sonuçları ve raporları üretmek için belirli analizleri veya işlevleri gerçekleştirir.
Sözdizimi
PROC procedure_name options; #The name of the proc. RUN;
Örnek E-posta
Verilen örnek şunu kullanır: ANLAMINA GELİYOR Veri setindeki sayısal değişkenlerin ortalama değerlerini yazdırma prosedürü.
PROC MEANS; RUN;
ÇIKTI Adımı
Koşullu çıktı ifadeleriyle verilerdeki verileri görüntüleyebilirsiniz.
Sözdizimi
PROC PRINT DATA = data_set; OPTIONS; RUN;
Her SAS programı, giriş verilerini okumak, verileri analiz etmek ve analizin çıktısını vermek için yukarıda belirtilen tüm adımları izlemelidir. KOŞMAK Her adımın sonundaki ifade o adımın yürütülmesini tamamlar.
SAS Programının tamamı
Aşağıda yukarıdaki adımların her biri için tam kod verilmiştir.
Çıktı:
SAS nerede kullanılır?
Aşağıda bazı önemli SAS uygulamaları verilmiştir:
Sanayi | kullanım |
---|---|
İlaç | İstatistiksel Analiz, Raporlama |
Telekom | ETL, Raporlama, Veri Madenciliği, Tahmin |
Finansallar | ETL, Raporlama, Veri Madenciliği, Finansal araştırma |
Tahmine dayalı modelleme | DB Pazarlama, Faaliyet Bazlı Yönetim |
Sağlık hizmeti | ETL, raporlama, Veri Madenciliği |
SAS vs. R
SAS | R |
---|---|
SAS ticari bir yazılım olduğundan finansal yatırım gerektirir. | R açık kaynaklı yazılımdır. Bu nedenle herkes kullanabilir. |
SAS öğrenmesi en kolay analitik araçtır. Sınırlı SQL bilgisine sahip kişiler bile bunu hızlı bir şekilde öğrenebilir. | R, karmaşık ve uzun kodlar yazmanızı gerektirir. |
SAS, büyük firmaların çok tercih ettiği bir seçenek olup, teknik açıdan oldukça gelişmiş ve kullanıcı dostudur. | R hızlı gelişen bir yazılımdır; ancak yükseltmeye devam etmeniz gerekir. |
SAS iyi bir grafik desteğine sahiptir ancak herhangi bir özelleştirme sunmamaktadır. | R aracının grafik desteği çok zayıf. |
SAS'ın Avantajları
- SAS, herhangi bir programlama bilgisi gerektirmeden öğrenilebilecek kolay bir sözdizimine sahiptir
- Büyük bir veritabanını kolaylıkla yönetebilme yeteneği
- SAS, kolayca hata ayıklanabilen, çok anlaşılır bir dildir
- "Günlük" penceresi, kodunuzda kolayca hata ayıklamanıza yardımcı olan hatayı açıkça belirtir
- SAS, algoritmayı kapsamlı bir şekilde test etmenize ve analiz etmenize yardımcı olur
- SAS tamamen güvenli olduğundan ofiste lisans olmadan veri çıkaramazsınız
- Programlamayan kullanıcılar için istatistiksel hesaplamayı kolaylaştırır
- Büyük boyutlu veritabanını etkili bir şekilde yönetir.
SAS'ın dezavantajları
- Maliyet yüksektir çünkü birey veya kuruluş uygun bir lisans olmadan tüm uygulamaları kullanamaz
- SAS açık kaynak olmadığından SAS'ta kullanılan algoritmalar ortak kullanıma açık değildir.
- Metin madenciliği SAS'ta oldukça zahmetli ve zorlu bir süreçtir.
ÖZET
- SAS yazılımı, Veri analitiği için kullanılan İstatistiksel Analiz Yazılımı anlamına gelir
- R ve Python SAS'ın yaygın olarak kullanılan iki alternatif aracıdır.
- SAS, 1970 yılında NC Üniversitesi'nde Jim Goodnight ve John Shall tarafından geliştirildi.
- SAS, her türlü harici veritabanındaki ham veri dosyalarına ve verilere erişmenizi sağlar
- SAS mimarisi esas olarak üç bölüme ayrılır: 1) İstemci Katmanı 2) Orta Katman 3) Arka Katman
- SAS yazılımını kullanmak için dört adımı izlemeniz gerekir: 1)Verilere Erişim, 2)Yönetim 3) Verileri Analiz Etme, 4) Sunum
- SAS Programı üç temel adımdan oluşur: Veri Adımı, Proc Adımı ve Çıktı Adımı
- SAS veri analizi aracı İlaç, Telekom, Finans, Tahmine Dayalı Modelleme ve Sağlık Hizmetleri gibi sektörlerde yaygın olarak kullanılmaktadır.
- SAS ticari bir yazılımdır, R ise açık kaynaklı bir yazılımdır
- SAS programlama aracının en büyük yararı, herhangi bir programlama bilgisi gerektirmeden öğrenilebilecek kolay bir sözdizimine sahip olmasıdır.
- SAS modelinin dezavantajlarından biri açık kaynaklı bir araç olmamasıdır. Dolayısıyla SAS prosedürlerinde kullanılan algoritmalar yaygın kullanıma açık değildir.