Підручник SAS для початківців: що таке та приклад програмування
Що таке SAS?
ПАР це програмний пакет програмного забезпечення, що керується командами, широко використовується для статистичного аналізу та візуалізації даних. Повна форма SAS – це програмне забезпечення для статистичного аналізу. Це дозволяє вам використовувати якісні методи та процеси, які допомагають підвищити продуктивність співробітників і бізнес-прибуток. SAS також використовується для розширеної аналітики, наприклад бізнес-аналітики, розслідування злочинів і прогнозного аналізу. SAS вимовляється як «SaaS».
У SAS дані витягуються та класифікуються, що допомагає вам ідентифікувати та аналізувати шаблони даних. Це пакет програмного забезпечення, який дозволяє виконувати розширений аналіз, бізнес-аналітику, прогнозний аналіз, керування даними для ефективної роботи в конкурентних і мінливих умовах бізнесу. Крім того, SAS не залежить від платформи, що означає, що ви можете запускати SAS на будь-якій операційній системі Linux або Windows.
Порівняно з іншими Інструменти BI, SAS надає широку підтримку для програмної трансформації та аналізу даних, крім використання інтерфейсу перетягування. Це забезпечує дуже детальний контроль над маніпулюванням даними та аналізом, що є USP.
Навіщо нам SAS?
Давайте зрозуміємо необхідність SAS на простому прикладі:
Розглянемо компанію електронної комерції, яка хоче знати моделі купівлі своїх клієнтів на основі історичних даних. Компанії доведеться розглянути тисячі записів кількох клієнтів, щоб отримати узагальнене розуміння.
Компанія може не мати всіх даних, необхідних для аналізу. Наприклад, якщо клієнт не купив піджак, то які фактори завадили йому не купити піджак? Ці відсутні дані можуть призвести до помилок у вашому аналізі. Як ми можемо позбутися цих проблем? Як ми можемо обробляти цей тип даних?
Якщо виконувати це завдання вручну, це потребуватиме сотень аналітиків і тисячі людино-годин. Використовуючи аналітичний інструмент SAS, ви можете зробити той самий аналіз за лічені години з одним аналітиком. Інструмент SAS дозволяє усунути непотрібні дані та оптимізувати відповідну інформацію. Це дозволить вам передбачити результат навіть за відсутніх даних. SAS дозволяє приймати кращі рішення.
Альтернативні інструменти SAS
R: Це програмне забезпечення з відкритим кодом. Вивчити R легко, оскільки він добре задокументований. Він пропонує потужні статистичні можливості.
Python є ще однією популярною мовою сценаріїв з відкритим кодом. Він підтримує такі бібліотеки, як Numpy, Scipy і MatPlotLib. Ви можете виконати будь-яку статистичну операцію або побудувати будь-яку модель за допомогою цих бібліотек.
SAS: Це широко використовуваний аналітичний інструмент на ринку комерційної аналітики. З великою кількістю статистичних функцій і хорошим графічним інтерфейсом.
У цьому посібнику з програмування SAS ми обговоримо статистичні аналітичні системи та те, як їх можна використовувати для вирішення наших проблем.
Історія SAS
- SAS був розроблений Джимом Гуднайтом і Джоном Шаллом у 1970 році в університеті NC
- Спочатку він був розроблений для сільськогосподарських досліджень.
- Later, він розширився до набору інструментів, включаючи інтелектуальну аналітику, керування даними, BI та ін.
- Сьогодні 98 провідних компаній світу зі списку Fortune 400 використовують інструмент аналізу даних SAS для Аналіз даних.
Далі в цьому підручнику з мови SAS ми дізнаємося про особливості SAS.
Функції SAS
Ключові особливості SAS:
- Легко отримуйте доступ до файлів необроблених даних і даних із зовнішньої бази даних. Читайте та записуйте майже будь-який формат даних!
- Керуйте даними за допомогою інструментів для введення даних, редагування, пошуку, форматування та перетворення
- Аналізуйте дані за допомогою описових, статистичних, багатовимірних методів, прогнозування, моделювання, лінійного програмування
- Розширена аналітика допомагає вносити зміни та покращувати бізнес-практику.
- Формування звіту з ідеальними графіками
- Operaдослідження та управління проектами
- Оновлення та модифікація даних
- Потужна мова обробки даних
- Відмінні функції очищення даних
- Взаємодія з кількома хост-системами
Далі в цьому підручнику SAS для початківців ми дізнаємося про набір продуктів SAS.
Набір продуктів SAS
На ринку доступно багато продуктів SAS. Нижче наведено список найбільш популярних.
ІМ'Я | Опис |
---|---|
База SAS | Програмне забезпечення Base SAS забезпечує гнучкість апаратного забезпечення та інтегрується в будь-яке обчислювальне середовище. |
SAS/ГРАФ | Цей інструмент допомагає представити структуровані дані у вигляді графіків. |
SAS/STAT | Цей інструмент допомагає вам виконувати різні типи регресії, дисперсійного статистичного аналізу, регресії та психометричного аналізу. |
SAS/ETS | Використовується для прогнозування. Допомагає виконувати аналіз часових рядів. |
SAS/IML | Інтерактивна матрична мова відома як IML. Цей інструмент допоможе вам перетворити математичні формули в інноваційну програму. |
SAS EBI | Інструмент для додатків бізнес-аналітики |
SAS Grid Manager | Це основний компонент, який пропонує засоби керування даними та мову програмування для аналізу даних |
SAS/АБО | Інструмент для Operaції дослідження |
SAS/QC | Використовуйте для контролю якості |
SAS/Enterprise Майнер | Видобуток даних |
SAS/PH | Аналіз клінічних випробувань |
SAS/AF | Він пропонує засоби додатків |
Посібник підприємства | Це графічний редактор коду та менеджер проектів |
Далі в цьому підручнику SAS ми дізнаємося про архітектуру SAS.
ПАР Archiтектура
Архітектура SAS в основному складається з трьох частин:
- Клієнтський рівень
- Середній рівень
- Задній ярус
Клієнтський рівень
Клієнтський рівень — це місце, де програма встановлена на машині, де сидить користувач. Він складається з компонентів, які використовуються для перегляду порталу та його вмісту. Він також містить стандартний веб-браузер, який використовується для взаємодії з порталом через стандартний протокол HTTP або HTTPS. Це також допоможе вам зробити брандмауер веб-додатків SAS дружнім.
середній ярус
Середній рівень пропонує централізовану точку доступу до корпоративної інформації. Весь доступ до вмісту обробляється компонентами, що працюють на цьому рівні. Відокремлення бізнес-логіки від логіки відображення допомагає використовувати логіку середнього рівня. Крім того, централізовані точки доступу спрощують дотримання правил безпеки, адміністрування порталу та керування змінами коду.
Середній рівень містить такі функції:
Веб-програма SAS Information Delivery Portal: Це колекція JSP, Java сервлети, JavaBeans та інші класи та ресурси. Ці компоненти допомагають отримати доступ до інформації, що зберігається в корпоративному каталозі, щоб створити настроюваний інтерфейс для користувача.
Двигун сервлетів: Механізм сервлетів також називають контейнером сервлетів. Він відповідає за керування веб-програмою SAS Information Delivery Portal. Механізм сервлетів пропонує середовище виконання. Він забезпечує паралельність, розгортання, керування життєвим циклом тощо.
Веб-сервер: Веб-сервер пропонує службу для механізму сервлетів, який можна використовувати для розміщення веб-сайту. Це має бути доступно через портал.
Задній ярус
Задній рівень — це область, де працюють сервери даних і обчислень, які можуть містити бізнес-об’єкти. Це корпоративний сервер каталогів. Сервер корпоративних каталогів підтримує метадані про вміст, який розміщено на підприємстві.
Як завантажити та встановити SAS
Локальне завантаження на вашу машину
Крок 1) Завантажте SAS за вказаним посиланням
Перейдіть за цим посиланням https://www.sas.com/en_in/software/university-edition.html і натисніть Отримати безкоштовне програмне забезпечення.
Крок 2) Виберіть свій Operating System
Виберіть операційну систему відповідно до вашої системи.
Крок 3) Завантажте та встановіть програмне забезпечення віртуалізації
Для SAS потрібне програмне забезпечення віртуалізації VirtualBox буде встановлено перед його встановленням. Ось докладні кроки
Щоб установити SAS, дотримуйтеся вказівок на екрані. мати VirtualBox і локальне встановлення іноді може бути складним. Ми рекомендуємо інсталяцію AWS-
Установка AWS
Ви можете розгорнути SAS в AWS. Він має право на безкоштовний рівень.
Крок 1) Перейдіть до https://aws.amazon.com/marketplace/pp/B00WH10IKW. Натисніть «Продовжити підписку»
Крок 2) На наступному екрані Прийміть умови.
Крок 3) Підтвердження підписки очікує на підтвердження до 10 хвилин. Ви побачите наступний екран.
Крок 4) Оновіть сторінку, і ви отримаєте підтвердження підписки. Натисніть «Продовжити до налаштування».
Крок 5) Залиште налаштування за замовчуванням і натисніть «Продовжити до запуску».
Крок 6) Revтобто перегляньте сторінку конфігурації. Введіть пару ключ-значення. Налаштування решти мають бути за замовчуванням. Натисніть Запустити
Крок 7) Перейдіть до https://aws.amazon.com/marketplace/library/ і натисніть «Переглянути екземпляри».
Крок 8) У спливаючому вікні
- Зверніть увагу на ідентифікатор екземпляра. Це ваш пароль
- Клацніть Access software
Крок 9) У спливаючому вікні, яке з’являється після натискання на кроці 8
- Введіть облікові дані користувача. Ідентифікатор: пароль sasdemo: ідентифікатор екземпляра, зазначений у кроці 8
- Натисніть Увійти
Крок 10) Ви побачите екран привітання.
Пошук і усунення несправностей
Якщо ви не можете підключитися, перейдіть до https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId і вхідні/вихідні правила для всіх
Як використовувати SAS?
Щоб ефективно використовувати програмне забезпечення SAS, вам потрібно виконати чотири кроки, а саме: доступ до даних, дані керування, аналіз, представлення
Дані доступу:
SAS дозволяє отримувати доступ до даних у будь-якому бажаному форматі.
Ви можете отримати доступ до даних, які зберігаються будь-де, чи то у файлі у вашій системі, чи до даних, які зберігаються в іншій системі баз даних. Це може бути файл Oracle, файл бази даних SAS, файл Raw Database або простий файл XLS/CSV. Це допоможе вам легко отримати доступ до цих даних.
Керувати даними:
SAS пропонує чудові можливості керування даними. Ви можете підмножини/зрізати дані на основі певних умов, створювати змінні, очищати та перевіряти дані. Існують інші інструменти, які дозволяють виконувати те саме завдання. Однак SAS допоможе вам легко виконати цю роботу.
SAS має чітко визначені бібліотеки та процеси, що полегшує процес програмування. Більше того, створення змінних або підмножинних даних є лише одним кроком. Це позбавляє вас від написання складних алгоритмів лише одним рядком коду.
Проаналізуйте:
Ви можете виконувати різні види аналізу за допомогою SAS:
- Він перевіряє частоту розрахунку середнього значення
- Регресія та прогнозування
- Дерево рішень
Усі ці аналізи легко впорається з SAS. Це найкращий інструмент для точного прогнозування.
Присутні:
Якщо ви правильно візуалізуєте дані, аудиторія легко з ними зрозуміє. Важливо, щоб ваш інструмент представляв дані належним чином. Ось що SAS робить для вас. Має чудові презентаційні можливості.
Ви можете:
1. Перелік звітів
2. Зведені звіти
3. Графічні звіти
4. Друк звітів
Приклад програми SAS
Програма SAS складається з трьох необхідних кроків:
- Крок даних
- Крок процедури
- Вихідний крок
Крок ДАНИХ
Крок даних завантажує необхідний набір даних у пам’ять SAS і знаходить правильні змінні набору даних. Він також фіксує записи. Ми можемо використовувати кроки даних, щоб:
- Введіть дані в набори даних SAS
- Обчислення значень
- Перевірте або виправте дані
- Створення нових наборів даних
Синтаксис оператора DATA:
синтаксис
DATA data_set_name; #Give a name to the dataset INPUT var1,var2,var3; #Declare variables in the dataset. NEW_VAR; #Define new variables. LABEL; #Give variables a label DATALINES; #Provide data RUN;
приклад:
У наступному прикладі показано, як визначити змінну, назвати набір даних, створити нові змінні та ввести дані. У цьому прикладі ви бачите, що рядкова змінна має $ у кінці, а числові значення без нього.
INPUT ID $ NAME $ SALARY DEPARTMENT $; comm = SALARY*1.50; LABEL ID = 'Emp_ID' comm = 'COMMISION'; DATALINES; 1 Tom 5000 IT 2 Harry 6000 Operations 3 Michelle 7000 IT 4 Dick 8000 HR 5 John 9000 Finance ; RUN;
Примітка. Для виконання SAS Statement потрібно вказати команду RUN.
Крок PROC
Він виконує певний аналіз або виконує функції для отримання результатів і звітів.
синтаксис
PROC procedure_name options; #The name of the proc. RUN;
Приклад
У наведеному прикладі використовується ЗАСОБИ процедура для друку середніх значень числових змінних у наборі даних.
PROC MEANS; RUN;
Крок OUTPUT
Ви можете відобразити дані з даних за допомогою операторів умовного виведення.
синтаксис
PROC PRINT DATA = data_set; OPTIONS; RUN;
Кожна програма SAS повинна виконувати всі описані вище дії, щоб зчитувати вхідні дані, аналізувати дані та видавати результати аналізу. The RUN оператор у кінці кожного кроку завершує виконання цього кроку.
Повна програма SAS
Нижче наведено повний код для кожного з вищезазначених кроків.
вихід:
Де використовується SAS?
Нижче наведено деякі важливі програми SAS:
Промисловість | Використання |
---|---|
фармацевтична | Статистичний аналіз, звітність |
Telecom | ETL, звітність, аналіз даних, прогнозування |
Фінанси | ETL, звітність, аналіз даних, фінансові дослідження |
Прогностичне моделювання | DBMarketing, управління на основі діяльності |
Охорона здоров'я | ETL, звітність, інтелектуальний аналіз даних |
SAS проти Р
ПАР | R |
---|---|
SAS є комерційним програмним забезпеченням, тому вимагає фінансових вкладень. | R є програмним забезпеченням з відкритим кодом. Тому ним може скористатися кожен. |
SAS є найпростішим аналітичним інструментом для вивчення. Навіть люди з обмеженими знаннями SQL можуть швидко вивчити його. | R вимагає від вас написання складних і довгих кодів. |
Великі компанії віддають перевагу SAS, він досить технічно просунутий і зручний для користувача. | R — програмне забезпечення, що швидко розвивається; однак вам потрібно продовжувати його оновлювати. |
SAS має хорошу графічну підтримку, але не пропонує жодних налаштувань. | Графічна підтримка інструменту R дуже погана. |
Переваги SAS
- SAS має простий синтаксис, який можна вивчити без будь-яких знань програмування
- Можливість легко обробляти велику базу даних
- SAS — це дуже зрозуміла мова, яку можна легко налагодити
- Його вікно «журналу» чітко вказує на помилку, що допомагає вам легко налагодити код
- SAS допоможе вам ретельно перевірити й проаналізувати алгоритм
- SAS повністю захищений, тому ви не можете отримати без ліцензії в офісі
- Полегшує статистичне обчислення для користувачів, які не займаються програмуванням
- Ефективно обробляє базу даних великого розміру.
Недоліки SAS
- Вартість висока, оскільки окрема особа чи організація не може використовувати всі програми без належної ліцензії
- SAS не є відкритим кодом, тому алгоритми, які використовуються в SAS, недоступні для загального використання
- Видобуток тексту – дуже клопіткий і важкий процес у SAS.
Підсумки
- Програмне забезпечення SAS означає програмне забезпечення статистичного аналізу, яке використовується для аналізу даних
- R і Python це два широко використовувані альтернативні інструменти SAS.
- SAS був розроблений Джимом Гуднайтом і Джоном Шаллом у 1970 році в університеті NC
- SAS дозволяє отримати доступ до файлів необроблених даних і даних у зовнішній базі даних будь-якого типу
- Архітектура SAS складається в основному з трьох частин: 1) Клієнтський рівень 2) Середній рівень 3) Задній рівень
- Щоб використовувати програмне забезпечення SAS, вам потрібно виконати чотири кроки, а саме: 1) Доступ до даних, 2) Керування 3) Аналіз даних, 4) Презентація
- Програма SAS складається з трьох основних кроків: крок даних, етап обробки та етап виведення
- ПАР інструмент аналізу даних широко використовується в таких секторах, як фармацевтика, телекомунікації, фінанси, прогнозне моделювання та охорона здоров'я
- SAS є комерційним програмним забезпеченням, тоді як R є програмним забезпеченням з відкритим кодом
- Найбільша перевага інструменту програмування SAS полягає в тому, що він має простий синтаксис, який можна вивчити без будь-яких знань програмування.
- Одним із недоліків моделі SAS є те, що вона не є інструментом з відкритим кодом. Таким чином, алгоритми, які використовуються в процедурах SAS, недоступні для загального використання.