SAS Урок за начинаещи: Какво е и пример за програмиране

Какво е SAS?

SAS е управляван от команди статистически софтуерен пакет, широко използван за анализ и визуализация на статистически данни. Пълната форма на SAS е софтуер за статистически анализ. Тя ви позволява да използвате качествени техники и процеси, които ви помагат да подобрите производителността на служителите и бизнес печалбите. SAS се използва и за разширен анализ като бизнес разузнаване, разследване на престъпления и прогнозен анализ. SAS се произнася като „SaaS“.

В SAS данните се извличат и категоризират, което ви помага да идентифицирате и анализирате модели на данни. Това е софтуерен пакет, който ви позволява да извършвате разширен анализ, бизнес разузнаване, предсказуем анализ, управление на данни, за да работите ефективно в конкурентни и променящи се бизнес условия. Освен това SAS е независим от платформата, което означава, че можете да стартирате SAS на всяка операционна система или Linux, или Windows.

В сравнение с други BI инструменти, SAS предоставя широка поддръжка за програмно трансформиране и анализиране на данни, освен използването на интерфейса за плъзгане и пускане. Това осигурява много подробен контрол върху манипулирането на данни и анализите, което е USP.

Защо се нуждаем от SAS?

Нека разберем необходимостта от SAS с прост пример:

Помислете за компания за електронна търговия, която иска да знае моделите на покупка на своите клиенти въз основа на исторически данни. Компанията ще трябва да разгледа хиляди записи на множество клиенти, за да получи обобщена представа.

Компанията може да не разполага с всички тези данни, необходими за анализа. Например, ако клиент не е купил яке, тогава какви са факторите, които са го спрели да не купи якето? Тези липсващи данни могат да създадат грешки във вашия анализ. Как можем да се отървем от тези проблеми? Как можем да обработваме този тип данни?

Ако се извършва ръчно, тази задача ще изисква стотици анализатори и хиляди човекочасове. С помощта на аналитичния инструмент на SAS можете да направите същия анализ за няколко часа с един анализатор. Инструментът SAS ви позволява да елиминирате ненужните данни и да оптимизирате съответната информация. Това ще ви позволи да предвидите резултат дори при липсващи данни. SAS ви позволява да вземате по-добри решения.

Алтернативни SAS инструменти

Алтернативни SAS инструменти

R: Това е софтуер с отворен код. Лесно е да научите R, тъй като е добре документиран. Той предлага силни статистически възможности.

Python е друг популярен скриптов език с отворен код. Той поддържа библиотеки като Numpy, Scipy и MatPlotLib. Можете да извършите всяка статистическа операция или можете да изградите произволен модел, като използвате тези библиотеки.

SAS: Това е широко използваният аналитичен инструмент на пазара за търговски анализи. С множество статистически функции и добър GUI.

В този урок по програмиране на SAS ще обсъдим статистическите аналитични системи и как могат да бъдат използвани за решаване на нашите проблеми.

История на SAS

  • SAS е разработен от Джим Гуднайт и Джон Шал през 1970 г. в NC University
  • Първоначално е разработен за селскостопански изследвания.
  • Later, той се разшири до гама от инструменти, за да включва предсказуем анализ, управление на данни, BI между другото.
  • Днес 98 от най-големите световни компании в Fortune 400 използват инструмента за анализ на данни SAS за Анализ на данни.

След това в този езиков урок за SAS ще научим за функциите на SAS.

Характеристики на SAS

Основните характеристики на SAS са:

  • Лесен достъп до файлове с необработени данни и данни от външна база данни. Четете и записвайте почти всеки формат на данни!
  • Управлявайте данни с помощта на инструменти за въвеждане на данни, редактиране, извличане, форматиране и преобразуване
  • Анализирайте данни с помощта на описателни, статистически, многовариантни техники, прогнозиране, моделиране, линейно програмиране
  • Разширеният анализ ви помага да правите промени и подобрения в бизнес практиките.
  • Формиране на отчет с перфектни графики
  • Operaизследвания и управление на проекти
  • Актуализиране и модифициране на данни
  • Мощен език за обработка на данни
  • Отлични функции за почистване на данни
  • Взаимодействайте с множество хост системи

След това в този урок за SAS за начинаещи ще научим за продуктовия пакет на SAS.

Продуктов пакет на SAS

На пазара има много продукти на SAS. Следва списък на по-популярните.

Име Descriptйон
База SAS Софтуерът Base SAS предлага гъвкавост на хардуера и се интегрира във всякакъв вид компютърна среда.
SAS/ГРАФИКА Този инструмент ви помага да представяте структурирани данни в графики.
SAS/STAT Този инструмент ви помага да извършвате различни видове регресия, статистически дисперсионен анализ, регресия и психометричен анализ.
SAS/ETS Използва се за прогнозиране. Помага ви да извършите анализ на времеви редове.
SAS/IML Интерактивният матричен език е известен като IML. Този инструмент ви помага да преведете математически формули в иновативна програма.
SAS EBI Инструмент за приложения за бизнес разузнаване
SAS Grid Manager Това е основен компонент, който предлага средства за управление на данни и език за програмиране за анализ на данни
SAS/ИЛИ Инструмент за Operaционни изследвания
SAS/QC Използвайте за контрол на качеството
SAS/Enterprise Miner Извличане на данни
SAS/PH Анализ на клиничните изпитвания
SAS/AF Предлага възможност за приложения
Ръководство за предприятие Това е GUI базиран редактор на код и мениджър на проекти

След това в това ръководство за уроци по SAS ще научим за архитектурата на SAS.

SAS Archiтекстура

SAS Archiтекстура
Archiструктура на SAS

Архитектурата на SAS е разделена основно на три части:

  • Клиентско ниво
  • Средно ниво
  • Заден слой

Клиентско ниво

Клиентското ниво е мястото, където приложението е инсталирано на машина, където седи потребителят. Състои се от компонентите, които се използват за преглед на портала и неговото съдържание. Той също така включва стандартен уеб браузър, който се използва за взаимодействие с портала по стандартен HTTP или HTTPS протокол. Освен това ви помага да направите защитната стена на уеб приложението SAS приятелска.

Средно ниво

Средният слой предлага централизирана точка за достъп до корпоративна информация. Целият достъп до съдържание се обработва от компоненти, работещи на това ниво. Разделянето на бизнес логиката от логиката на дисплея ви помага да използвате логиката на средното ниво. Освен това централизираните точки за достъп улесняват налагането на правила за сигурност, администрирането на портала и управлението на промените в кода.

Средният слой разполага със следните функции:

SAS Уеб приложение за портал за доставка на информация: Това е колекцията от JSP, Java сервлети, JavaФасул и други класове и ресурси. Тези компоненти ви помагат да получите достъп до информация, съхранена в директорията на предприятието, за да създадете адаптивен интерфейс за потребителя.

Servlet Engine: Сървлет машината се нарича още сервлет контейнер. Той отговаря за управлението на уеб приложението SAS Information Delivery Portal. Сървлет машината предлага среда за изпълнение. Той осигурява едновременност, внедряване, управление на жизнения цикъл и т.н.

Уеб сървър: Уеб сървърът предлага услуга за сървлет машината, която може да се използва за хостване на уебсайт. Това трябва да бъде достъпно чрез портала.

Заден ред

Задният слой е област, където работят сървърите за данни и изчисления, които могат да съдържат бизнес обекти. Това е корпоративен директориен сървър. Сървърът на корпоративната директория поддържа метаданни за съдържание, което се намира в предприятието.

Как да изтеглите и инсталирате SAS

Локално изтегляне във вашата машина

Стъпка 1) Изтеглете SAS от дадената връзка

Отидете на тази връзка https://www.sas.com/en_in/software/university-edition.html и щракнете върху Вземете безплатен софтуер.

Изтеглете и инсталирайте SAS

Стъпка 2) Изберете своя Operaтинг система

Изберете операционната система според вашата система.

Изтеглете и инсталирайте SAS

Стъпка 3) Изтеглете и инсталирайте софтуер за виртуализация

SAS изисква софтуер за виртуализация като VirtualBox да бъде инсталиран, преди да може да бъде инсталиран. Ето подробните стъпки

Изтеглете и инсталирайте SAS

Следвайте стъпките, споменати на екрана, за да инсталирате SAS. Имайки VirtualBox и локалната инсталация понякога може да бъде трудна. Препоръчваме инсталиране на AWS-

Инсталиране на AWS

Можете да внедрите SAS в AWS. Отговаря на условията за безплатно ниво.

Стъпка 1) Отиди https://aws.amazon.com/marketplace/pp/B00WH10IKW. Кликнете върху „Продължете да се абонирате“

Изтеглете и инсталирайте SAS

Стъпка 2) В следващия екран Приемете условията.

Изтеглете и инсталирайте SAS

Стъпка 3) Одобрението на абонамента е в процес на изчакване отнема до 10 минути. Ще видите следния екран.

Изтеглете и инсталирайте SAS

Стъпка 4) Обновете страницата и абонаментът ще бъде потвърден. Кликнете върху Продължете към конфигурацията

Изтеглете и инсталирайте SAS

Стъпка 5) Запазете настройките по подразбиране и щракнете върху Продължи към стартиране.

Изтеглете и инсталирайте SAS

Стъпка 6) Revт.е. вижте страницата за конфигурация. Въведете двойка ключ-стойност. Настройките за почивка трябва да са по подразбиране. Щракнете върху Стартиране

Изтеглете и инсталирайте SAS

Стъпка 7) Отиди https://aws.amazon.com/marketplace/library/ и щракнете върху Преглед на екземпляри.

Изтеглете и инсталирайте SAS

Стъпка 8) В изскачащия прозорец

  1. Обърнете внимание на идентификатора на екземпляра. Това е вашата парола
  2. Щракнете върху Access software

Изтеглете и инсталирайте SAS

Стъпка 9) В изскачащия прозорец, който се появява, след като щракнете в стъпка 8

  1. Въведете потребителски идентификационни данни. Id: sasdemo парола: id на екземпляр, отбелязан в стъпка 8
  2. Щракнете върху Вход

Изтеглете и инсталирайте SAS

Стъпка 10) Ще видите началния екран.

Изтеглете и инсталирайте SAS

Отстраняване на проблеми

Ако не можете да се свържете, отидете на https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId и входящи/изходящи правила за всички

Как да използваме SAS?

За да използвате ефективно SAS софтуера, трябва да следвате четири стъпки, които са: Достъп до данни, Данни за управление, Анализиране, Представяне

Как да използвате SAS
Как да използвате SAS

Данни за достъп:

SAS ви позволява достъп до данни във всеки желан формат, който желаете.

Имате достъп до данни, които се съхраняват навсякъде, независимо дали са във файл във вашата система или данни, които се съхраняват в друга система от бази данни. Това може да бъде файл на Oracle, SAS файл с база данни, необработен файл с база данни или обикновен XLS /CSV файл. Това ще ви помогне да получите лесен достъп до тези данни.

Управление на данни:

SAS предлага страхотни възможности за управление на данни. Можете да подмножествате/разделяте данни въз основа на определени условия, да създавате променливи, да почиствате и валидирате данни. Има и други инструменти, които ви позволяват да изпълнявате същата задача. SAS обаче ви помага да изпълнявате тази работа с лекота.

SAS има добре дефинирани библиотеки и процеси, което прави процеса на програмиране лесен. Нещо повече, създаването на променливи или подмножества данни е процес само в една стъпка. Това ви спестява писането на сложни алгоритми само с един ред код.

Анализирам:

Можете да извършвате различни видове анализи с помощта на SAS:

  • Той проверява честотата на изчисляване на средната стойност
  • Регресия и прогнозиране
  • Дърво на решенията

Всички тези анализи могат лесно да се обработват от SAS. Това е най-добрият инструмент за точно прогнозиране.

настояще:

Ако визуализирате данните правилно, за публиката е лесно да се свърже с тях. Важно е вашият инструмент да представя данните по подходящ начин. Това е, което SAS прави за вас. Има отлични презентационни възможности.

Можете да:

1. Списък на отчетите

2. Обобщени отчети

3. Графични отчети

4. Отпечатване на отчети

Пример за програма SAS

Програмата SAS се състои от три необходими стъпки:

  • Стъпка с данни
  • Стъпка на процедурата
  • Изходна стъпка

Стъпка ДАННИ

Стъпката за данни зарежда необходимия набор от данни в SAS паметта и намира правилните променливи на набора от данни. Той също така улавя записите. Можем да използваме стъпките за данни за:

  • Въведете данни в набори от данни на SAS
  • Изчисляване на стойности
  • Проверете или коригирайте данните
  • Създайте нови набори от данни

Синтаксисът на оператора DATA е:

Синтаксис

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Пример:

Следващият пример показва как да дефинирате променлива, да наименувате набора от данни, да създадете нови променливи и да въведете данните. В този пример можете да видите, че низовата променлива има $ в края, а числовите стойности са без него.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Забележка: За да изпълните SAS Statement, трябва да посочите командата RUN.

Стъпка PROC

Той извършва специфични анализи или функции за получаване на резултати и отчети.

Синтаксис

PROC procedure_name options; #The name of the proc.
RUN;

Пример

Даденият пример използва СРЕДСТВА процедура за отпечатване на средните стойности на числовите променливи в набора от данни.

PROC MEANS;
RUN;

Стъпка ИЗХОД

Можете да покажете данните от данните с условни изходни изрази.

Синтаксис

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Всяка SAS програма трябва да следва всички горепосочени стъпки за четене на входните данни, анализиране на данните и предоставяне на резултат от анализа. The RUN оператор в края на всяка стъпка завършва изпълнението на тази стъпка.

Пълната програма SAS

По-долу е даден пълният код за всяка от горните стъпки.

Пълната програма SAS

Изход:

Пълната програма SAS

Пълната програма SAS

Пълната програма SAS

Къде се използва SAS?

По-долу са дадени някои важни SAS приложения:

Индустрия употреба
Фармацевтична индустрия Статистически анализи, отчетност
Telecom ETL, докладване, извличане на данни, прогнозиране
Финанси ETL, отчетност, извличане на данни, финансови изследвания
Прогнозно моделиране DBMarketing, управление, базирано на дейности
Здравеопазване ETL, докладване, извличане на данни

SAS Vs. Р

SAS R
SAS е търговски софтуер, така че изисква финансова инвестиция. R е софтуер с отворен код. Следователно всеки може да го използва.
SAS е най-лесният аналитичен инструмент за научаване. Дори хора с ограничени познания по SQL могат да го научат бързо. R изисква да пишете сложни и дълги кодове.
SAS е много предпочитан избор от големите компании и е доста напреднал технически и удобен за потребителя. R е бързо развиващ се софтуер; обаче трябва да продължите да го надграждате.
SAS има добра графична поддръжка, но не предлага персонализиране. Графичната поддръжка на инструмента R е много лоша.

Предимства на SAS

  • SAS има лесен синтаксис, който може да се научи без никакви познания по програмиране
  • Възможност за лесно боравене с голяма база данни
  • SAS е много разбираем език, който лесно може да бъде отстранен
  • Неговият прозорец „дневник“ ясно посочва грешката, която ви помага лесно да отстраните грешките в кода си
  • SAS ви помага задълбочено да тествате и анализирате алгоритъма
  • SAS е напълно защитен, така че не можете да извличате без лиценз в офиса
  • Улеснява статистическите изчисления за потребителите, които не програмират
  • Работи ефективно с големи бази данни.

Недостатъци на SAS

  • Цената е висока, тъй като физическо лице или организация не може да използва всички приложения без подходящ лиценз
  • SAS не е с отворен код, така че използваните в SAS алгоритми не са достъпни за обща употреба
  • Извличането на текст е много обезпокоителен и труден процес в SAS.

Oбобщение

  • Софтуер SAS означава софтуер за статистически анализ, който се използва за анализ на данни
  • R и Python са два широко използвани алтернативни инструмента на SAS.
  • SAS е разработен от Джим Гуднайт и Джон Шал през 1970 г. в NC University
  • SAS ви позволява достъп до файлове с необработени данни и данни във външна база данни от всякакъв вид
  • Архитектурата на SAS е разделена основно на три части 1) Клиентско ниво 2) Средно ниво 3) Задно ниво
  • За да използвате софтуера SAS, трябва да следвате четири стъпки, които са: 1) Достъп до данни, 2) Управление, 3) Анализ на данни, 4) Представяне
  • Програмата SAS се състои от три основни стъпки: стъпка на данни, стъпка на обработка и стъпка на изход
  • SAS инструмент за анализ на данни се използва широко в сектори като фармация, телекомуникации, финанси, прогнозно моделиране и здравеопазване
  • SAS е търговски софтуер, докато R е софтуер с отворен код
  • Най-голямото предимство на инструмента за програмист SAS е, че има лесен синтаксис, който може да се научи без каквито и да е познания по програмиране.
  • Един от недостатъците на модела SAS е, че той не е инструмент с отворен код. Така че алгоритмите, използвани в SAS процедурите, не са достъпни за обща употреба.