Учебное пособие по SAS для начинающих: что такое и пример программирования

Что такое САС?

ПАВ представляет собой пакет статистического программного обеспечения, управляемый командами, широко используемый для анализа и визуализации статистических данных. Полная форма SAS — это программное обеспечение для статистического анализа. Это позволяет вам использовать качественные методы и процессы, которые помогут вам повысить производительность сотрудников и прибыль бизнеса. SAS также используется для расширенной аналитики, такой как бизнес-аналитика, расследование преступлений и прогнозный анализ. SAS произносится как «SaaS».

In SAS, data is extracted & categorized which helps you to identify and analyze data patterns. It is a software suite which allows you to perform advanced analysis, Business Intelligence, Predictive Analysis, data management to operate effectively in the competitive & changing business conditions. Moreover, SAS is platform independent which means you can run SAS on any operating system either Linux or Windows.

По сравнению с другими Инструменты бизнес-аналитикиSAS обеспечивает обширную поддержку программного преобразования и анализа данных, помимо использования интерфейса перетаскивания. Это обеспечивает очень детальный контроль над манипулированием и анализом данных, что является его USP.

Зачем нам нужен САС?

Давайте поймем необходимость SAS на простом примере:

Рассмотрим компанию электронной коммерции, которая хочет узнать модели покупок своих клиентов на основе исторических данных. Чтобы получить обобщенное представление, компании придется рассмотреть тысячи записей множества клиентов.

Компания может не располагать всеми этими данными, необходимыми для анализа. Например, если покупатель не купил куртку, какие факторы помешали ему не купить куртку? Эти недостающие данные могут привести к ошибкам в вашем анализе. Как мы можем избавиться от этих проблем? Как мы можем обрабатывать этот тип данных?

Если выполнять эту задачу вручную, потребуются сотни аналитиков и тысячи человеко-часов. Используя аналитический инструмент SAS, вы можете выполнить тот же анализ за считанные часы с помощью одного аналитика. Инструмент SAS позволяет исключить ненужные данные и оптимизировать соответствующую информацию. Это позволит вам предсказать результат даже при недостающих данных. SAS позволяет вам принимать более обоснованные решения.

Альтернативные инструменты SAS

Альтернативные инструменты SAS

R: Это программное обеспечение с открытым исходным кодом. Изучить R легко, поскольку он хорошо документирован. Он предлагает сильные статистические возможности.

Питон — еще один популярный язык сценариев с открытым исходным кодом. Он поддерживает такие библиотеки, как Numpy, Scipy и MatPlotLib. Вы можете выполнить любую статистическую операцию или построить любую модель, используя эти библиотеки.

SAS: Это широко используемый аналитический инструмент на рынке коммерческой аналитики. С множеством статистических функций и хорошим графическим интерфейсом.

В этом руководстве по программированию SAS мы обсудим статистические аналитические системы и то, как их можно использовать для решения наших проблем.

История САС

  • SAS был разработан Джимом Гуднайтом и Джоном Шаллом в 1970 году в Университете Северной Каролины.
  • Первоначально он был разработан для сельскохозяйственных исследований.
  • Later, it expanded to a gamut of tools to include Predictive Analytics, Data Management, BI among others.
  • Сегодня 98 крупнейших компаний мира из списка Fortune 400 используют инструмент анализа данных SAS для Анализ данных.

Далее в этом руководстве по языку SAS мы узнаем о функциях SAS.

Возможности САС

Ключевые особенности SAS:

  • Легкий доступ к файлам необработанных данных и данным из внешней базы данных. Чтение и запись практически любого формата данных!
  • Управляйте данными с помощью инструментов для ввода данных, редактирования, поиска, форматирования и преобразования.
  • Анализируйте данные с использованием описательных, статистических, многомерных методов, прогнозирования, моделирования, линейного программирования.
  • Расширенная аналитика помогает вам вносить изменения и улучшения в бизнес-практику.
  • Формирование отчетов с идеальными графиками
  • Исследование операций и управление проектами
  • Обновление и модификация данных
  • Мощный язык обработки данных
  • Отличные функции очистки данных
  • Взаимодействие с несколькими хост-системами

Далее в этом руководстве по SAS для начинающих мы узнаем о пакете продуктов SAS.

Пакет продуктов SAS

На рынке доступно множество продуктов SAS. Фоллоwing список наиболее популярных из них.

Фамилия Описание
База САС Программное обеспечение Base SAS обеспечивает гибкость аппаратного обеспечения и интегрируется в любую вычислительную среду.
САС/ГРАФ Этот инструмент помогает вам представлять структурированные данные в виде графиков.
САС/СТАТ Этот инструмент помогает вам выполнять различные типы регрессии, статистического дисперсионного анализа, регрессии и психометрического анализа.
САС/ЕТС Его используют для прогнозирования. Помогает вам выполнить анализ временных рядов.
САС/ИМЛ Interactive Matric language is known as IML. This tool helps you to translate mathematical formulas into an innovative program.
САС ЭБИ Инструмент для приложений бизнес-аналитики
Менеджер сети SAS Это основной компонент, который предлагает средства управления данными и язык программирования для анализа данных.
САС/ИЛИ Инструмент для исследования операций
САС/КК Использование для контроля качества
SAS/корпоративный майнер Сбор данных
САС/ПХ Анализ клинических испытаний
САС/АФ Он предлагает возможности приложений
Руководство для предприятий Это редактор кода и менеджер проектов на основе графического интерфейса.

Next in this SAS tutorials guide, we will learn about SAS archiтектура.

ПАВ Archiтекстура

ПАВ Archiтекстура
Architecture of SAS

ПАВ architecture is divided mainly of three parts:

  • Клиентский уровень
  • Средний уровень
  • Задний ярус

Клиентский уровень

Клиентский уровень — это место, где приложение установлено на машине, где сидит пользователь. Он состоит из компонентов, которые используются для просмотра портала и его содержимого. Он также включает стандартный веб-браузер, который используется для взаимодействия с порталом по стандартному протоколу HTTP или HTTPS. Это также поможет вам сделать брандмауэр веб-приложений SAS дружественным.

Средний уровень

Средний уровень предлагает централизованную точку доступа к корпоративной информации. Весь доступ к контенту обрабатывается компонентами, работающими на этом уровне. Разделение бизнес-логики с логикой отображения помогает использовать логику среднего уровня. Более того, централизованные точки доступа упрощают соблюдение правил безопасности, администрирование портала и управление изменениями кода.

На среднем ярусе находится следующийwing функции:

Веб-приложение портала доставки информации SAS: Это коллекция JSP, сервлетов Java, JavaBeans и других классов и ресурсов. Эти компоненты помогают вам получить доступ к информации, хранящейся в каталоге предприятия, чтобы создать настраиваемый интерфейс для пользователя.

Механизм сервлетов: Механизм сервлетов также называется контейнером сервлетов. Он отвечает за управление веб-приложением портала доставки информации SAS. Механизм сервлетов предлагает среду выполнения. Он обеспечивает параллелизм, развертывание, управление жизненным циклом и т. д.

Веб сервер: Веб-сервер предлагает услуги для механизма сервлетов, которые можно использовать для размещения веб-сайта. Доступ к этому должен осуществляться через портал.

Задний уровень

Задний уровень — это область, где работают серверы данных и вычислений, которые могут содержать бизнес-объекты. Это сервер каталогов предприятия. Сервер каталогов предприятия хранит метаданные о контенте, расположенном по всему предприятию.

Как скачать и установить SAS

Локальная загрузка на вашем компьютере

Шаг 1) Загрузите SAS по данной ссылке.

Перейти к этой ссылке https://www.sas.com/en_in/software/university-edition.html и нажмите «Получить бесплатное программное обеспечение».

Загрузите и установите SAS

Шаг 2) Выберите свою операционную систему

Выберите операционную систему в соответствии с вашей системой.

Загрузите и установите SAS

Шаг 3) Загрузите и установите программное обеспечение виртуализации.

SAS requires Virtualization Software like VirtualBox необходимо установить до того, как его можно будет установить. Вот подробные шаги

Загрузите и установите SAS

Follow the steps mentioned onscreen to install SAS. Having VirtualBox и локальная установка иногда может быть сложной. Мы рекомендуем установку AWS-

Установка AWS

Вы можете развернуть SAS в AWS. Он соответствует уровню бесплатного пользования.

Шаг 1) Перейдите на https://aws.amazon.com/marketplace/pp/B00WH10IKW. Нажмите «Продолжить подписку»

Загрузите и установите SAS

Шаг 2) На следующем экране примите условия.

Загрузите и установите SAS

Шаг 3) Подписка находится на рассмотрении. На ее одобрение уходит до 10 минут. Вы увидите следующееwing экран.

Загрузите и установите SAS

Шаг 4) Обновите страницу, и подписка будет подтверждена. Нажмите «Продолжить настройку».

Загрузите и установите SAS

Шаг 5) Оставьте настройки по умолчанию и нажмите «Продолжить запуск».

Загрузите и установите SAS

Шаг 6) Просмотрите страницу конфигурации. Введите пару ключ-значение. Остальные настройки должны быть по умолчанию. Нажмите «Запустить».

Загрузите и установите SAS

Шаг 7) Перейдите на https://aws.amazon.com/marketplace/library/ и нажмите «Просмотреть экземпляры».

Загрузите и установите SAS

Шаг 8) Во всплывающем окне

  1. Обратите внимание на идентификатор экземпляра. Это ваш пароль
  2. Нажмите «Доступ к программному обеспечению».

Загрузите и установите SAS

Шаг 9) Во всплывающем окне, которое появляется после нажатия на шаге 8.

  1. Введите учетные данные пользователя. Идентификатор: пароль sasdemo: идентификатор экземпляра, указанный на шаге 8.
  2. Нажмите Войти

Загрузите и установите SAS

Шаг 10) Вы увидите экран приветствия.

Загрузите и установите SAS

УСТРАНЕНИЕ НЕПОЛАДОК

Если вы не можете подключиться, перейдите по ссылке https://console.aws.amazon.com/ec2/v2/home?region=us-east-1#SecurityGroups:sort=groupId и входящие/исходящие правила для всех

Как использовать САС?

Чтобы эффективно использовать программное обеспечение SAS, вам необходимо выполнить четыре шага: доступ к данным, данные управления, анализ, представление.

Как использовать САС
Как использовать САС

Доступ к данным:

SAS позволяет вам получать доступ к данным в любом желаемом формате.

You can access data that is stored anywhere, whether it is in a file on your system or data that is stored in another database system. It can be oracle file, SAS database file, Raw Database file or a simple XLS /CSV file. It will help you to access this data with ease.

Управление данными:

SAS предлагает отличные возможности управления данными. Вы можете подмножество/разрезать данные на основе определенных условий, создавать переменные, очищать и проверять данные. Существуют и другие инструменты, которые позволяют выполнить ту же задачу. Однако SAS поможет вам легко выполнить эту работу.

SAS имеет четко определенные библиотеки и процессы, что упрощает процесс программирования. Более того, создание переменных или подмножества данных — это всего лишь один этап процесса. Это избавит вас от необходимости писать complex алгоритмы с помощью всего лишь одной строки кода.

Анализ:

С помощью SAS можно выполнять различные виды анализа:

  • Он проверяет частоту расчета среднего значения.
  • Регрессия и прогнозирование
  • Древо решений

Все эти анализы можно легко выполнить с помощью SAS. Это лучший инструмент для точного прогнозирования.

Присутствовали:

Если вы правильно визуализируете данные, аудитории будет легко с ними связаться. Очень важно, чтобы ваш инструмент представлял данные в подходящем виде. Это то, что SAS делает для вас. Имеет отличные презентационные возможности.

Вы можете:

1. Список отчетов

2. Сводные отчеты

3. Графические отчеты

4. Печать отчетов

Пример программы SAS

Программа SAS состоит из трех необходимых шагов:

  • Шаг данных
  • Шаг процедуры
  • Выходной шаг

ДАННЫЕ Шаг

Шаг данных загружает необходимый набор данных в память SAS и находит правильные переменные набора данных. Он также фиксирует записи. Мы можем использовать шаги данных, чтобы:

  • Ввод данных в наборы данных SAS
  • Вычисление значений
  • Проверьте или исправьте данные
  • Создание новых наборов данных

Синтаксис оператора DATA:

Синтаксис

DATA data_set_name;		#Give a name to the dataset
INPUT var1,var2,var3; 		#Declare variables in the dataset.
NEW_VAR;			         #Define new variables.
LABEL;			      	#Give variables a label
DATALINES;		      	#Provide data
RUN;

Это критически важно для анализа и выбора наиболее эффективных ключевых слов для улучшения рейтинга вашего сайта.

Фоллоwing пример показывает, как определить переменную, назвать набор данных, создать новые переменные и ввести данные. В этом примере вы можете видеть, что строковая переменная имеет знак $ в конце, а числовые значения — без него.

INPUT ID $ NAME $ SALARY DEPARTMENT $;
comm = SALARY*1.50;
LABEL ID = 'Emp_ID' comm = 'COMMISION';
DATALINES;
1 Tom 5000 IT
2 Harry 6000 Operations
3 Michelle 7000 IT
4 Dick 8000 HR
5 John 9000 Finance 
;
RUN;

Примечание. Для выполнения оператора SAS необходимо указать команду RUN.

Шаг ПРОЦ

Он выполняет конкретный анализ или функции для получения результатов и отчетов.

Синтаксис

PROC procedure_name options; #The name of the proc.
RUN;

Пример

В данном примере используется СРЕДСТВА процедура для печати средних значений числовых переменных в наборе данных.

PROC MEANS;
RUN;

Шаг ВЫВОДА

Вы можете отображать данные из данных с помощью операторов условного вывода.

Синтаксис

PROC PRINT DATA = data_set;
OPTIONS;
RUN;

Каждая программа SAS должна выполнить все вышеперечисленные шаги для чтения входных данных, их анализа и предоставления результатов анализа. БЕГ оператор в конце каждого шага завершает выполнение этого шага.

Полная программа SAS

Ниже приведен полный код для каждого из вышеуказанных шагов.

Полная программа SAS

Вывод:

Полная программа SAS

Полная программа SAS

Полная программа SAS

Где используется SAS?

Ниже приведены некоторые важные приложения SAS:

Промышленный дизайн Применение
в Фармацевтической отрасли Статистический анализ, отчетность
Телеком ETL, отчетность, интеллектуальный анализ данных, прогнозирование
Финансы ETL, отчетность, интеллектуальный анализ данных, финансовые исследования
Прогнозное моделирование DBMarketing, Управление на основе деятельности
Здоровье ETL, отчетность, интеллектуальный анализ данных

САС против. р

ПАВ R
SAS — коммерческое программное обеспечение, поэтому оно требует финансовых вложений. R является программным обеспечением с открытым исходным кодом. Следовательно, любой может использовать его.
SAS — самый простой в освоении аналитический инструмент. Даже люди с ограниченными знаниями SQL могут быстро освоить его. R требует от вас написания сложных и длинных кодов.
SAS является предпочтительным выбором крупных компаний, он достаточно технически продвинут и удобен для пользователя. R — быстроразвивающееся программное обеспечение; однако вам необходимо продолжать его обновлять.
SAS имеет хорошую графическую поддержку, но не предлагает никаких настроек. Графическая поддержка инструмента R очень плохая.

Преимущества САС

  • SAS имеет простой синтаксис, который можно изучить без каких-либо знаний программирования.
  • Умение легко работать с большой базой данных
  • SAS — очень понятный язык, который легко отладить.
  • В окне «журнала» четко указана ошибка, что помогает легко отлаживать код.
  • SAS поможет вам тщательно протестировать и проанализировать алгоритм.
  • SAS полностью защищен, поэтому без лицензии вы не сможете извлечь данные в офисе.
  • Облегчает статистические вычисления для пользователей, не занимающихся программированием.
  • Эффективно обрабатывает базы данных большого размера.

Недостатки САС

  • Стоимость высока, поскольку отдельные лица или организации не могут использовать все приложения без соответствующей лицензии.
  • SAS не является открытым исходным кодом, поэтому алгоритмы, используемые в SAS, недоступны для общего использования.
  • Интеллектуальный анализ текста — очень хлопотный и сложный процесс в SAS.

Итоги

  • Программное обеспечение SAS означает программное обеспечение для статистического анализа, которое используется для анализа данных.
  • Р и Питон — это два широко используемых альтернативных инструмента SAS.
  • SAS был разработан Джимом Гуднайтом и Джоном Шаллом в 1970 году в Университете Северной Каролины.
  • SAS позволяет вам получать доступ к файлам необработанных данных и данным во внешней базе данных любого типа.
  • ПАВ architecture is divided mainly of three parts 1)Client Tier 2) Middle Tier 3) Back tier
  • Чтобы использовать программное обеспечение SAS, вам необходимо выполнить четыре шага: 1) Доступ к данным, 2) Управление, 3) Анализ данных, 4) Презентация.
  • Программа SAS состоит из трех основных этапов: шаг обработки данных, этап обработки и этап вывода.
  • ПАВ инструмент анализа данных широко используется в таких секторах, как фармацевтика, телекоммуникации, финансы, прогнозное моделирование и здравоохранение.
  • SAS — коммерческое программное обеспечение, а R — программное обеспечение с открытым исходным кодом.
  • Самым большим преимуществом инструмента программирования SAS является то, что он имеет простой синтаксис, который можно изучить без каких-либо знаний программирования.
  • Одним из недостатков модели SAS является то, что она не является инструментом с открытым исходным кодом. Таким образом, алгоритмы, используемые в процедурах SAS, недоступны для общего использования.