SAP DS (службы данных) в HANA
Что такое SAP Службы передачи данных?
SAP Службы обработки данных — это инструмент ETL, который предоставляет единое решение корпоративного уровня для интеграции данных, преобразования, качества данных, профилирования данных и обработки текстовых данных из гетерогенного источника в целевую базу данных или хранилище данных.
Мы можем создавать приложения (задания), в которых можно выполнять сопоставление и преобразование данных с помощью Конструктора. (Последняя версия SAP БОДС – 4.2).
Особенности служб передачи данных
- Он обеспечивает высокопроизводительные параллельные преобразования.
- Он имеет комплексные административные инструменты и инструмент отчетности.
- Он поддерживает многопользовательскую работу.
- SAP ТЕЛА очень гибок с приложениями на основе веб-сервисов.
- Это позволяет использовать язык сценариев с богатым набором функций.
- Службы данных могут интегрироваться с SAP LT Replication Server (SLT) с технологией Trigger-based. SLT добавляет дельта-возможности к каждому SAP или неSAP исходная таблица, которая позволяет использовать сбор данных для изменения и передачи дельта-данных исходной таблицы.
- Проверка данных с помощью информационных панелей и аудит процессов.
- Инструмент администрирования с возможностями планирования и мониторинга/панелями мониторинга.
- Отладка и встроенные средства профилирования и просмотра данных.
- SAP Поддержка BODS Широкий источник и цель.
- Любые приложения (например SAP).
- Любые базы данных с массовой загрузкой и сбором данных об изменениях.
- Файлы: фиксированная ширина, через запятую, COBOL, XML, Excel.
Компонент служб данных
SAP Службы DATA имеют следующий компонент:
- Дизайнер - Это инструмент разработки, с помощью которого мы можем создавать, тестировать и выполнять задание, заполняющее хранилище данных. Он позволяет разработчику создавать объекты и настраивать их, выбирая значок на диаграмме потока от источника к цели. Это может быть используется для создания приложения путем указания рабочих процессов и потоков данных. Чтобы открыть конструктор службы данных, перейдите в раздел Меню «Пуск» -> «Все программы» -> SAP Службы данных (4.2 здесь) -> Дизайнер служб данных.
- Сервер заданий- Это приложение, которое запускает механизм обработки служб данных и служит интерфейсом для этого механизма и пакета служб данных.
- Двигатель- Механизм службы данных выполняет отдельные задания, определенные в приложении.
- Репозиторий- Репозиторий — это база данных, в которой хранятся предопределенные дизайнером объекты и объекты, определенные пользователем (исходные и целевые метаданные, правила преобразования). Репозиторий бывает двух типов:
- Локальный репозиторий (Используется Designer и сервером заданий).
- Центральный репозиторий (Используется для совместного использования объектов и контроля версий)
- Сервер доступа- Сервер доступа передает сообщения между веб-приложениями, сервером заданий служб данных и механизмами.
- Администратор- Веб-администратор обеспечивает администрирование ресурсов служб данных с помощью браузера. Подробная информация приведена ниже:
- Настройка, запуск и остановка служб реального времени.
- Планирование, мониторинг и выполнение пакетных заданий.
- Настройка использования сервера заданий, сервера доступа и репозитория.
- Управление пользователями.
- Публикация пакетных заданий и сервисов реального времени через веб-сервисы.
- Настройка и управление адаптерами.
Услуги по передаче данных Archiтектура –
Архитектура служб данных состоит из следующих компонентов:
- Центральный репозиторий – используется для настройки репозиториев на серверах заданий, управления безопасностью, контроля версий и совместного использования объектов.
- Конструктор — используется для создания проекта, задания, рабочего процесса, потока данных и запуска.
- Локальный репозиторий (здесь вы можете создавать изменения и запускать задания, рабочий процесс, поток данных).
- Сервер и механизм заданий – управляют заданиями.
- Сервер доступа – используется для выполнения заданий в реальном времени, созданных разработчиками в репозиториях.
На изображении ниже показана связь служб данных и их компонентов.
SAP ТЕЛА Archiтекстура
Деталь дизайнерского окна: Сначала мы рассмотрим первый компонент SAP служба данных-дизайнер
Подробности каждого раздела дизайнера службы данных приведены ниже:
- Панель инструментов (Используется для открытия, сохранения, возврата, проверки, выполнения и т. д.).
- Площадь проекта (Содержит текущий проект, включающий задание, рабочий процесс и поток данных. В службах данных все сущности являются объектами.
- Рабочее пространство (Область окна приложения, в которой мы определяем, отображаем и изменяем объекты).
- Локальная библиотека объектов (Он содержит объекты локального репозитория, такие как преобразования, задания, рабочие процессы, потоки данных и т. д.).
- Палитра инструментов (Кнопки на палитре инструментов позволяют добавлять новые объекты в рабочую область).
Иерархия объектов
На диаграмме ниже показаны иерархические отношения для ключевых типов объектов в службах данных.
>
Примечание:
Рабочие процессы и условия* не являются обязательными.
Предметы, используемые в SAP Детали услуг передачи данных приведены ниже:
Объекты | Описание |
---|---|
Проект | Проект — это объект самого высокого уровня в окне дизайнера. Проекты предоставляют вам возможность упорядочить другие объекты, создаваемые вами в службах данных. Одновременно открыт только один проект (где «открытый» означает «видимый в области проекта»). |
работа | «Задание» — это наименьшая единица работы, выполнение которой можно запланировать независимо. |
Сценарии | Подмножество строк в процедуре. |
Рабочий процесс | «Рабочий поток» — это объединение нескольких потоков данных в единый рабочий поток для всей работы. Рабочий процесс не является обязательным. Рабочий процесс — это процедура.
|
Поток данных | «Поток данных» — это процесс, посредством которого исходные данные преобразуются в целевые данные. Поток данных — это объект многократного использования. Он всегда вызывается из рабочего процесса или задания.
|
Хранилище данных | Логический канал, который соединяет службы данных с исходными и целевыми базами данных хранилища данных.
|
Target | Таблица или файл, в который службы данных загружают данные из источника. |
Пример служб данных путем загрузки данных из SAP Исходная таблица
Все в службах данных является объектом. Нам необходимо разделить хранилище данных для каждой исходной и целевой базы данных.
Шаги по загрузке данных из SAP исходная таблица – SAP BODS состоит из множества этапов, на которых нам необходимо создать хранилище данных для источника и цели и сопоставить их.
- Создать хранилище данных между источником и BODS
- Импортируйте метаданные (структуры) в BODS.
- Настройка сервера импорта
- Импортируйте метаданные в систему HANA.
- Создайте хранилище данных между BODS и HANA.
- Создать проект.
- Создать задание (пакетное/в режиме реального времени)
- Создать рабочий процесс
- Создать поток данных
- Добавить объект в поток данных
- Выполнить задание
- Проверьте предварительный просмотр данных в HANA
Шаг 1) Создать хранилище данных между SAP Источник и БОДС
- Чтобы загрузить данные из SAP Источник для SAP Хана через SAP BODS, нам нужно хранилище данных. Поэтому сначала мы создаем хранилище данных, как показано ниже – Проект -> Создать -> Хранилище данных.
- Появится всплывающее окно «Создать новое хранилище данных», введите данные, как показано ниже:
- Введите имя хранилища данных «ds_ecc».
- Выберите имя типа хранилища данных как «SAP Приложения".
- Введите имя сервера базы данных
- Имя пользователя и пароль.
- Нажмите кнопку «Применить».
- Нажмите кнопку «ОК».
- Будет создано хранилище данных, и вы сможете просмотреть созданное хранилище данных, как показано ниже:
- Перейти в локальную библиотеку объектов
- Выберите вкладку «Хранилище данных».
- Будет отображено хранилище данных «ds_ecc».
Шаг 2) Импортируйте метаданные (структуру) на сервер BODS.
Мы создали хранилище данных для ECC в BODS; теперь импортируем метаданные из ECC в BODS. Для импорта выполните следующие действия:
- Выберите хранилище данных «ds_ecc» и щелкните правой кнопкой мыши.
- Выберите опцию «Импортировать по имени».
Появится всплывающее окно для импорта по имени. Введите детали, как показано ниже –
- Выберите Тип в виде таблицы.
- Введите имя таблицы, которую мы хотим импортировать. Здесь мы импортируем таблицу KNA1.
- Нажмите кнопку «Импорт». Таблица KNA1 появится под узлом таблицы источника данных «ds_ecc».
Метаданные таблицы будут импортированы в хранилище данных ds_ecc, как показано ниже:
Шаг 3) Настройка сервера импорта
До сих пор мы импортировали таблицу в данные, хранящиеся «ds_ecc», созданные для ECC. SAP Соединение БОДС. Чтобы импортировать данные в SAP HANA, нам нужно настроить сервер импорта,
- Для этого перейдите в Быстрый просмотр-> Настройка сервера импорта как показано ниже –
- Появится всплывающее окно «Выбрать систему», «Выбрать». SAP Система HANA (здесь HDB), как показано ниже:
- Нажмите кнопку «Далее». Появится еще одно всплывающее окно с учетными данными службы передачи данных. Введите следующие данные.
- SAP Адрес сервера BODS (здесь BODS:6400 )
- Enter SAP Имя репозитория BODS (Имя репозитория HANAUSER)
- Введите источник данных ODBC (ZTDS_DS).
- Введите порт по умолчанию для SAP BODS-сервер(8080).
Нажмите кнопку «Готово».
Шаг 4) Импортируйте метаданные в систему HANA.
1. До сих пор у нас есть настроенный сервер импорта, теперь мы будем импортировать метаданные из SAP BODS-сервер.
- Нажмите «Импорт» в режиме быстрого просмотра.
- Появится всплывающее окно с опцией импорта. Выберите опцию «Выборочный импорт метаданных».
Нажмите кнопку «Далее».
2. Появится всплывающее окно «Выборочный импорт метаданных», в котором мы выбираем целевую систему.
- Выберите SAP Система HANA (здесь HDB).
Нажмите кнопку «Далее».
Шаг 5) Создайте хранилище данных между BODS и HANA.
Как мы знаем, в BODS нам нужно создать отдельное хранилище данных для источника и цели. Мы уже создали хранилище данных для источника, теперь нам нужно создать хранилище данных для цели (между BODS и HANA). Итак, мы создаем новое хранилище данных с именем «DS_BODS_HANA».
- Перейдите в Проект -> Создать -> Хранилище данных.
- Появится экран создания нового хранилища данных, как показано ниже.
- Введите имя хранилища данных (DS_BODS_HANA).
- Введите тип хранилища данных как «База данных».
- Введите тип базы данных как SAP ХАНА.
- Выберите версию базы данных.
- Enter SAP Имя сервера базы данных HANA.
- Введите имя порта для SAP База данных Хана.
- Введите имя пользователя и пароль.
- Ставим галочку «Включить автоматическую передачу данных».
Нажмите «Применить», а затем кнопку «ОК».
Хранилище данных «DS_BODS_HANA» будет отображаться на вкладке хранилища данных локальной библиотеки объектов как
Ниже-
- Теперь мы импортируем таблицу в хранилище данных «DS_BODS_HANA».
- Выберите хранилище данных «DS_BODS_HANA» и щелкните правой кнопкой мыши.
- Выберите «Импортировать по имени».
- Появится всплывающее окно для импорта по имени, как показано ниже:
- Выберите Тип как таблица.
- Введите имя как KNA1.
- Владелец будет отображаться как Ханаузер.
- Нажмите кнопку «Импорт».
Таблица будет импортирована в хранилище данных «DS_BOD_HANA». Чтобы просмотреть данные в таблице, выполните следующие действия:
- Нажмите на таблицу «KNA1» в хранилище данных «DS_BODS_HANA».
- Данные будут отображаться в ТАБЛИЧНОМ формате.
Шаг 6) Определите проект: Проектная группа и организация связанные объекты. Проект может содержать любое количество заданий, рабочих процессов и потоков данных.
- Перейдите в меню дизайнерского проекта.
- Выберите новый вариант.
- Выберите опцию «Проект».
Всплывающее окно для создания нового проекта выглядит, как показано ниже. Введите имя проекта и нажмите кнопку «Создать». В нашем случае будет создана папка проекта BODS_DHK.
Шаг 7) Определите работу: Job — это объект многократного использования. Он содержит рабочие процессы и потоки данных. Задания могут выполняться вручную или по расписанию. Для выполнения процесса BODS нам необходимо определить задание.
Мы создаем задание как JOB_Customer.
- Выберите проект (BODS_DHK), созданный на шаге 1, щелкните правой кнопкой мыши и выберите «Новое пакетное задание».
- Переименуйте его в «JOB_Customer».
Шаг 8) Определите рабочий процесс:
- Выберите задание «JOB_Customer» в области проекта,
- Нажмите кнопку рабочего процесса на палитре инструментов. Нажмите на область «Черное рабочее пространство». В рабочей области появится значок рабочего процесса.
- Измените имя рабочего процесса на «WF_Customer».
Щелкните имя рабочего процесса, в рабочей области появится пустое представление рабочего процесса.
Шаг 9) Определите поток данных:
- Нажмите «Рабочий процесс «WF_Customer».
- Нажмите кнопку «Поток данных» на палитре инструментов. Нажмите на область «Черное рабочее пространство». В рабочей области появится значок потока данных.
- Измените имя потока данных на «DF_Customer».
- Поток данных также отображается в области проекта слева под именем задания.
Шаг 10) Добавьте объект в поток данных:
Внутри потока данных мы можем предоставить инструкции для преобразования исходных данных в желаемую форму для целевой таблицы.
Мы увидим объект ниже –
- Объект для источника.
- Объект для целевой таблицы.
- Объект для преобразования запроса. (Преобразование запроса сопоставляет столбцы из источника в целевой объект.) Щелкните в потоке данных DF_Customer. Появится пустое рабочее пространство, как показано ниже:
- Указать объект из источника – Перейдите в хранилище данных «ds_ecc», выберите таблицу KNA1 и перетащите ее на пустой экран потока данных, как показано ниже.
- Укажите объект для Target- Выберите хранилище данных «DS_BODS_HANA» из репозитория и выберите таблицу KNA1.
- Перетащите в рабочую область и выберите «Сделать Target «опция. Будет две таблицы для источника и цели. Здесь мы определим таблицу как источник и цель.
- Преобразование запроса – Это инструмент, используемый для получения данных на основе входной схемы для конкретных условий пользователя и для транспортировки данных из источника в цель.
- Выберите значок «Преобразование запроса» на палитре инструментов и перетащите его между исходным и целевым объектом в рабочей области, как показано ниже:
- Свяжите объект запроса с источником.
- Связать объект запроса с Target таблице.
- Double Нажмите на значок запроса. Тем самым мы сопоставляем столбец из входной схемы с выходной схемой.
Когда мы нажмем значок «Запрос», появится следующее окно для сопоставления, в котором мы выполняем следующие шаги:
- Выбрана исходная таблица KNA1.
- Выберите все столбцы из исходной таблицы, щелкните правой кнопкой мыши и выберите карту для вывода.
- Target Выход выбран как «Запрос», и столбец будет сопоставлен.
5. Сохраните и подтвердите проект.
1. Нажмите значок подтверждения.
2. Появится всплывающее окно об успешной проверке.
Шаг 11) Выполнить задание – Чтобы выполнить задание, следуйте следующему пути:
- Выберите значок «Область проекта», чтобы открыть проект, и выберите созданный проект.
- Выберите «Задание» и щелкните правой кнопкой мыши.
- Выберите опцию «Выполнить», чтобы выполнить задание.
- После выполнения задания отображается окно журнала заданий, в котором отображаются все сообщения, касающиеся задания.
- Последним сообщением будет «Задание <> успешно завершено».
Шаг 12) – Проверка/проверка данных в SAP База данных Хана.
- Войти, чтобы SAP База данных HANA через SAP HANA Studioи выберите схему HANAUSER.
- Выберите таблицу KNA1 в узле Таблица.
- Щелкните правой кнопкой мыши таблицу KNA1 и выберите «Предварительный просмотр открытых данных».
- Таблица (KNA1) Данные, загруженные процессами BODS, как указано выше, будут отображаться на экране предварительного просмотра данных.