Учебное пособие по SSIS для начинающих: что такое, Archiтектура, Пакеты

Что такое ССИС?

Служба интеграции SQL Server (SSIS) является компонентом Microsoft Программное обеспечение базы данных SQL Server, которое можно использовать для выполнения широкого спектра задач миграции данных. SSIS — это быстрый и гибкий инструмент хранилища данных, используемый для извлечения, загрузки и преобразования данных, таких как очистка, агрегирование, объединение данных и т. д.

Это позволяет легко перемещать данные из одной базы данных в другую. SSIS может извлекать данные из самых разных источников, таких как базы данных SQL Server, файлы Excel, Oracle и базы данных DB2 и т. д.

SSIS также включает в себя графические инструменты и мастера для выполнения функций рабочего процесса, таких как отправка электронных писем.mail сообщения, операции FTP, источники данных и места назначения.

Почему мы используем SSIS?

Вот основные причины использования инструмента SSIS:

  • Инструмент SSIS помогает вам объединять данные из различных хранилищ данных.
  • Автоматизирует административные функции и загрузку данных
  • Заполняет витрины данных и хранилища данных
  • Помогает очистить и стандартизировать данные
  • Встраивание BI в процесс преобразования данных
  • Автоматизация административных функций и загрузки данных
  • SIS содержит графический интерфейс, который помогает пользователям легко преобразовывать данные вместо написания больших программ.
  • Он может загружать миллионы строк из одного источника данных в другой за считанные минуты.
  • Выявление, сбор и обработка изменений данных
  • Координация обслуживания, обработки или анализа данных
  • SSIS устраняет необходимость в профессиональных программистах
  • SSIS предлагает надежную обработку ошибок и событий.

История SSIS

До SSIS использовался SQL Server, Data Transformation Services (DTS), который был частью SQL Server 7 и 2000.

Версия Подробнее
SQL Server 2005 Microsoft команда решила обновить DTS. Однако вместо обновления DTS они решили назвать продукт Integration Services (SSIS).
Версия SQL-сервера 2008 г. В SSIS было внесено множество улучшений производительности. Были также представлены новые источники.
SQL Server 2012 Это был самый крупный релиз для SSIS. В этой версии представлена ​​концепция модели развертывания проекта. Это позволяет целым проектам и их пакетам развертываться на сервере вместо конкретных пакетов.
SQL Server 2014 В этой версии для SSIS внесено не так много изменений. Но были добавлены новые источники или преобразования, что было сделано путем отдельной загрузки через Code.Plex или пакет дополнительных компонентов SQL Server.
В SQL Server 2016 Эта версия позволяет развертывать целые проекты вместо отдельных пакетов. Имеются дополнительные источники, особенно облачные, а также источники больших данных, и в каталог было внесено несколько изменений.

Основные особенности SSIS

Вот некоторые важные основные функции SSIS:

  • Студийная среда
  • Соответствующие функции интеграции данных
  • Эффективная скорость внедрения
  • Тесная интеграция с другими Microsoft Семейство SQL
  • Преобразование запросов интеллектуального анализа данных
  • Нечеткий поиск и групповые преобразования
  • Извлечение терминов и преобразования поиска терминов
  • Компоненты высокоскоростного подключения к данным, такие как подключение к SAP или Oracle

ССИС Archiтекстура

ССИС Archiтекстура
ССИС Archiтекстура

Фоллоwing являются компонентами SSIS archiтекстура:

  • Поток управления (хранит контейнеры и задачи)
  • Поток данных (источник, место назначения, преобразования)
  • Обработчик событий (отправка сообщений, Emails)
  • Package Explorer (предлагает единое представление для всех в пакете)
  • Параметры (Взаимодействие с пользователем)

Давайте разберемся в каждом компоненте подробно:

1. Поток управления

Поток управления — это мозг пакета SSIS. Это поможет вам организовать порядок выполнения всех его компонентов. Компоненты содержат контейнеры и задачи, которые управляются ограничениями приоритета.

2. Ограничения приоритета

Ограничение приоритета — это компонент пакета, который направляет выполнение задач в заранее определенном порядке. Он также определяет рабочий процесс всего пакета SSIS. Он контролирует выполнение двух связанных задач, выполняя целевые задачи на основе результата предыдущей задачи — бизнес-правил, которые определяются с помощью специальных выражений.

3. Задача

«Задача» — это отдельная единица работы. Это то же самое, что метод/функция, используемая в языке программирования. Однако в SSIS вы не используете методы кодирования. Вместо этого вы будете использовать технику перетаскивания для проектирования поверхностей и их настройки.

4. Контейнеры

Контейнер — это единицы группировки задач в единицы работы. Помимо обеспечения визуальной согласованности, он также позволяет вам объявлять переменные и обработчики событий, которые должны находиться в области действия этого конкретного контейнера.

Четыре типа контейнеров в SSIS:

  • Контейнер последовательности
  • Контейнер цикла for
  • Контейнер цикла по каждому элементу

Контейнер последовательности: позволяет организовывать вспомогательные задачи, группируя их, а также применять транзакции или назначать ведение журнала для контейнера.

Для контейнера цикла:Предоставляет ту же функциональность, что и Контейнер последовательности, за исключением того, что он также позволяет запускать задачи несколько раз. Однако он основан на условии оценки, например цикле от 1 до 100.

Для каждого контейнера цикла: Это также позволяет зацикливаться. Но разница в том, что вместо использования выражения условия цикл, выполняемый над набором объектов, любит файлы в папке.

5. Поток данных

Основное использование инструмента SSIS — извлечение данных в память сервера, их преобразование и запись в другое место назначения. Если поток управления — это мозг, то поток данных — это сердце SSIS.

6. Пакеты SSIS

Еще одним ключевым компонентом SSIS является notion пакета. Это набор задач, которые выполняются упорядоченным образом. Здесь президентские ограничения помогают управлять порядком выполнения задачи.

Пакет может помочь вам сохранить файлы на SQL Server, в базе данных msdb или каталога пакетов. Его можно сохранить в виде файла .dtsx, который представляет собой структурированный файл, очень похожий на файлы .rdl в службах Reporting Services.

Пакеты SSIS

7. параметры

Параметры ведут себя так же, как переменные, но с несколькими основными исключениями. Его можно легко установить вне упаковки. Его можно обозначить как значения, которые необходимо передать для запуска пакета.

Типы задач SSIS

В инструменте SSIS вы можете добавить задачу для управления потоком. Существуют различные типы задач, которые выполняют различные виды работ.

Некоторые важные задачи SSIS упомянуты ниже:

Название задачи Описание
Выполнить задачу SQL Как следует из названия, он выполняет оператор SQL для реляционной базы данных.
Задача потока данных Эта задача может считывать данные из одного или нескольких источников. Преобразуйте данные, когда они находятся в памяти, и запишите их в одно или несколько мест назначения.
Задача обработки служб Analysis Services Используйте эту задачу для обработки объектов табличной модели или куба SSAS.
Выполнение задачи пакета Эту задачу SSIS можно использовать для выполнения других пакетов из того же проекта.
Выполнить задачу процесса С помощью этой задачи вы можете указать параметры командной строки.
Задача файловой системы Он производит манипуляции в файловой системе. Например, перемещение, переименование, удаление файлов и создание каталогов.
FTP-задачи Он позволяет выполнять основные функции FTP.
Задача сценария Это пустая задача. Вы можете написать NET-код, выполняющий любую задачу; вы хотите выступить.
Отправить Mail Сложность задачи Вы можете отправить электронное письмоmail для уведомления пользователей о том, что ваш пакет завершен или произошла какая-то ошибка.
Массовая вставка задачи Использование может загружать данные в таблицу с помощью команды массовой вставки.
Задача сценария Запускает набор VB.NET или кодирование C# внутри Visual Studio окружающей среды.
Задача веб-службы Он выполняет метод веб-службы.
Задача наблюдения за событиями WMI Эта задача позволяет пакету SSIS ожидать и реагировать на определенные события WMI.
XML-задача Эта задача поможет вам объединить, разделить или переформатировать любой XML-файл.

Другие важные инструменты ETL

  • Службы данных SAP
  • Управление данными SAS
  • Oracle Строитель складов (OWB)
  • PowerCenter Информатика
  • IBM Инфосферный информационный сервер
  • Репертуар эликсира для ETL данных
  • Поток данных Сарджента

Преимущества и недостатки использования SSIS

Инструмент SSIS предлагает следующиеwing преимущества:

  • Широкая документация и поддержка
  • Простота и скорость внедрения
  • Тесная интеграция с SQL Server и visual studio
  • Стандартизированная интеграция данных
  • Предлагает возможности работы в режиме реального времени на основе сообщений.
  • Поддержка модели распространения
  • Помогает устранить сеть как узкое место для вставки данных с помощью SSIS в SQL.
  • SISS позволяет использовать назначение SQL Server вместо OLE DB для более быстрой загрузки данных.

Недостатки SSIS

Некоторые недостатки использования инструментов SSIS заключаются в следующем:

  • Иногда создают проблемы в не-windows средах
  • Неясное видение и стратегия
  • В SSIS отсутствует поддержка альтернативных стилей интеграции данных.
  • Проблемная интеграция с другими продуктами.

Пример передового опыта работы с SSIS

  • SSIS — это конвейер в памяти. Вот почему важно следить за тем, чтобы все преобразования происходили в памяти.
  • Постарайтесь свести к минимуму регистрируемые операции.
  • Планируйте мощность, понимая использование ресурсов
  • Оптимизируйте преобразование поиска SQL, источник данных и место назначения.
  • Планируйте и распределяйте это правильно

Выводы

  • Полная форма SSIS — это службы интеграции SQL Server.
  • Инструмент SSIS помогает вам объединять данные из различных хранилищ данных.
  • Важными версиями службы интеграции SQL Server являются 2005, 2008, 2012, 2014 и 216.
  • Среды Studio, соответствующие функции интеграции данных и эффективная скорость реализации — вот некоторые важные особенности SSIS.
  • Поток управления, поток данных, обработчик событий, обозреватель пакетов и параметры необходимы для SSIS. archiкомпоненты
  • Выполнение задачи SQL, задача потока данных, задача обработки служб Analysis Services, задача выполнения пакета, задача выполнения процесса, задача файловой системы, задачи FTP, отправка Mail Задача, Задача веб-службы — некоторые важные
  • Широкая документация и поддержка
  • Самым большим недостатком SSIS является отсутствие поддержки альтернативных стилей интеграции данных.
  • Службы данных SAP, Управление данными SAS, Oracle Строитель складов (OWB), PowerCenter Informatica, IBM Инфосферный информационный сервер
  • SSIS — это конвейер в памяти. Поэтому очень важно убедиться, что все преобразования происходят в памяти.