Урок за SSIS за начинаещи: Какво е, Archiтекстура, пакети
Какво е SSIS?
SQL Server Integration Service (SSIS) е компонент на Microsoft SQL Server софтуер за база данни, който може да се използва за изпълнение на широк набор от задачи за мигриране на данни. SSIS е бърз и гъвкав инструмент за съхранение на данни, използван за извличане, зареждане и трансформиране на данни като почистване, агрегиране, обединяване на данни и др.
Това улеснява преместването на данни от една база данни в друга база данни. SSIS може да извлича данни от голямо разнообразие от източници като бази данни на SQL Server, Excel файлове, Oracle и DB2 бази данни и др.
SSIS също включва графични инструменти и съветници за изпълнение на функции на работния процес като изпращане на имейл съобщения, FTP операции, източници на данни и дестинации.
Защо използваме SSIS?
Ето основните причини за използването на SSIS инструмента:
- Инструментът SSIS ви помага да обедините данни от различни хранилища на данни
- Автоматизира административните функции и зареждането на данни
- Попълва Data Marts & Data Warehouses
- Помага ви да изчистите и стандартизирате данните
- Изграждане на BI в процес на трансформация на данни
- Автоматизиране на административни функции и зареждане на данни
- SIS съдържа GUI, който помага на потребителите лесно да трансформират данни, вместо да пишат големи програми
- Той може да зареди милиони редове от един източник на данни в друг за много няколко минути
- Идентифициране, улавяне и обработка на промените в данните
- Координиране на поддръжката, обработката или анализа на данни
- SSIS елиминира нуждата от хардкор програмисти
- SSIS предлага надеждна обработка на грешки и събития
История на SSIS
Преди SSIS се използваха SQL Server, Data Transformation Services (DTS), които бяха част от SQL Server 7 и 2000
версия | детайл |
---|---|
SQL Server 2005 | - Microsoft екип реши да преработи DTS. Въпреки това, вместо да актуализират DTS, те решиха да кръстят продукта Integration Services (SSIS). |
Версия на SQL сървър 2008 | В SSIS бяха направени много подобрения в производителността. Бяха въведени и нови източници. |
SQL Server 2012 | Това беше най-голямата версия за SSIS. С тази версия е въведена концепцията за модела за внедряване на проекта. Той позволява цели проекти и техните пакети се разполагат на сървър, вместо конкретни пакети. |
SQL Server 2014 | В тази версия не се правят много промени за SSIS. Но бяха добавени нови източници или трансформации, което беше направено чрез отделни изтегляния чрез CodePlex или SQL Server Feature Pack. |
В SQL Server 2016 | Версията ви позволява да разгръщате цели проекти вместо отделни пакети. Има допълнителни източници, особено облачни и големи източници на данни и бяха направени малко промени в каталога. |
Характеристики на SSIS
Ето някои важни основни характеристики на SSIS:
- Студийни среди
- Съответни функции за интегриране на данни
- Ефективна скорост на внедряване
- Тясна интеграция с други Microsoft Семейство SQL
- Трансформация на заявка за извличане на данни
- Неясни трансформации за търсене и групиране
- Извличане на термини и трансформации за търсене на термини
- Компоненти за свързване на данни с по-висока скорост, като свързаност към SAP or Oracle
SSIS Archiтекстура
Следват компоненти на SSIS архитектурата:
- Контролен поток (съхранява контейнери и задачи)
- Поток от данни (източник, дестинация, трансформации)
- Обработчик на събития (изпращане на съобщения, имейли)
- Package Explorer (Предлага един изглед за всички в пакета)
- Параметри (взаимодействие с потребителя)
Нека разберем подробно всеки компонент:
1. Контролен поток
Контролният поток е мозъкът на SSIS пакета. Помага ви да организирате реда на изпълнение за всички негови компоненти. Компонентите съдържат контейнери и задачи, които се управляват от ограничения на приоритета.
2. Ограничения на приоритета
Ограничението за приоритет е компонент на пакета, който насочва задачите да се изпълняват в предварително определен ред. Той също така определя работния процес на целия пакет SSIS. Той контролира изпълнението на двете свързани задачи, като изпълнява целевите задачи въз основа на резултата от по-ранната задача — бизнес правила, които се дефинират с помощта на специални изрази.
3. Задача
„Задача“ е индивидуална единица работа. Това е същото като метод/функция, използван в език за програмиране. В SSIS обаче не използвате методи за кодиране. Вместо това ще използвате техниката на плъзгане и пускане, за да проектирате повърхности и да ги конфигурирате.
4. Контейнери
Контейнерът представлява единици за групиране на задачи заедно в работни единици. Освен че предлага визуална последователност, той също така ви позволява да декларирате променливи и манипулатори на събития, които трябва да бъдат в обхвата на този конкретен контейнер.
Четири вида контейнери в SSIS са:
- Контейнер за последователност
- Контейнер за цикъл
- Foreach Loop Container
Контейнер за последователност: позволява ви да организирате спомагателни задачи, като ги групирате, и ви позволява да прилагате транзакции или да присвоявате регистриране на контейнера.
За контейнер за цикъл:Предоставя същата функционалност като контейнера за последователност, с изключение на това, че ви позволява да изпълнявате задачите многократно. Въпреки това, той се основава на условие за оценка, като цикъл от 1 до 100.
За всеки контурен контейнер: Освен това позволява зацикляне. Но разликата, че вместо да се използва израз на условие, цикълът се извършва върху набор от обекти, харесва файлове в папка.
5. Поток от данни
Основната употреба на инструмента SSIS е да извлича данни в паметта на сървъра, да ги трансформира и записва на друго местоназначение. Ако Control Flow е мозъкът, Data Flow е сърцето на SSIS
6. SSIS пакети
Друг основен компонент на SSIS е понятието пакет. Това е набор от задачи, които се изпълняват по подреден начин. Тук президентските ограничения помагат да се управлява редът, в който ще се изпълнява задачата.
Пакет може да ви помогне да записвате файлове на a SQL Server, в базата данни msdb или каталог на пакети. Може да записва като .dtsx файл, който е структуриран файл, много подобен на .rdl файловете за Reporting Services.
7. Параметри
Параметрите се държат много като променлива, но с няколко основни изключения. Може лесно да се постави извън опаковката. Може да се посочи като стойности, които трябва да бъдат предадени, за да стартира пакетът.
SSIS типове задачи
В инструмента SSIS можете да добавите задача за контрол на потока. Има различни видове задачи, които изпълняват различни видове работи.
Някои важни SSIS задачи са споменати по-долу:
Име на задачата | Descriptйони |
---|---|
Изпълнете SQL задача | Както подсказва името му, той ще изпълни SQL израз срещу релационна база данни. |
Задача за поток от данни | Тази задача може да чете данни от един или повече източници. Преобразувайте данните, когато са в паметта, и ги запишете срещу една или повече дестинации. |
Задача за обработка на услуги за анализ | Използвайте тази задача, за да обработвате обекти на табличен модел или като SSAS куб. |
Изпълнение на пакетна задача | Използването може да използва тази SSIS задача за изпълнение на други пакети от същия проект. |
Изпълнение на процесната задача | С помощта на тази задача можете да зададете параметри на командния ред. |
Задача на файловата система | Извършва манипулации във файловата система. Като преместване, преименуване, изтриване на файлове и създаване на директории. |
FTP задачи | Позволява ви да изпълнявате основни FTP функции. |
Скрипт Задача | Това е празна задача. Можете да напишете NET код, който изпълнява всяка задача; искате да изпълните. |
Изпрати Mail Task | Можете да изпратите имейл до потребителите, за да уведомите, че вашият пакет е завършен или че е възникнала някаква грешка. |
Задача за групово вмъкване | Използването може да зарежда данни в таблица с помощта на командата за групово вмъкване. |
Скрипт Задача | Изпълнява набор от VB.NET или C# кодиране в среда на Visual Studio. |
Задача за уеб услуга | Той изпълнява метод на уеб услуга. |
Задача за наблюдение на събития на WMI | Тази задача позволява на SSIS пакета да чака и да отговаря на определени WMI събития. |
XML задача | Тази задача ви помага да обедините, разделите или преформатирате всеки XML файл. |
Други важни ETL инструменти
- SAP Услуги за данни
- SAS Управление на данни
- Oracle Warehouse Builder (OWB)
- PowerCenter Informatica
- IBM Информационен сървър на Infosphere
- Репертоар на Elixir за Data ETL
- Поток от данни на Sargent
Предимства и недостатъци на използването на SSIS
SSIS инструментът предлага следните предимства:
- Обширна документация и поддръжка
- Лекота и бързина на изпълнение
- Тясна интеграция със SQL Server и визуално студио
- Стандартизирана интеграция на данни
- Предлага възможности в реално време, базирани на съобщения
- Поддръжка на модел на разпространение
- Помага ви да премахнете мрежата като пречка за вмъкване на данни от SSIS в SQL
- SISS ви позволява да използвате местоназначението на SQL Server вместо OLE DB, за да заредите данните по-бързо
Недостатъци на SSIS
Малко недостатъци на използването на SSIS инструменти са следните:
- Понякога създават проблеми в среда без Windows
- Неясна визия и стратегия
- SSIS няма поддръжка за алтернативни стилове на интегриране на данни
- Проблемна интеграция с други продукти
Пример за най-добри практики за SSIS
- SSIS е конвейер в паметта. Ето защо е важно да се уверите, че всички трансформации се случват в паметта
- Опитайте се да минимизирате регистрираните операции
- Планирайте капацитет чрез разбиране на използването на ресурсите
- Оптимизирайте трансформацията на SQL справка, източника на данни и дестинацията
- Планирайте и го разпределете правилно
Oбобщение
- Пълната форма на SSIS е SQL Server Integration Services
- Инструментът SSIS ви помага да обедините данни от различни хранилища на данни
- Важни версии на SQL Server Integration Service са 2005, 2008, 2012, 2014 и 216
- Студийни среди, подходящи функции за интегриране на данни и ефективна скорост на внедряване са някои важни характеристики на SSIS
- Контролен поток, поток от данни, манипулатор на събития, изследовател на пакети и параметри са основни компоненти на SSIS архитектурата
- Изпълнение на SQL задача, Задача за поток от данни, Задача за обработка на услуги за анализ, Изпълнение на задача за пакет, Изпълнение на задача на процес, Задача за файлова система, FTP задачи, Изпращане Mail Task, Web Service Task са някои важни
- Обширна документация и поддръжка
- Най-големият недостатък на SSIS е, че му липсва поддръжка за алтернативни стилове на интегриране на данни
- SAP Услуги за данни, SAS Управление на данни, Oracle Warehouse Builder (OWB), PowerCenter Informatica, IBM Информационен сървър на Infosphere
- SSIS е конвейер в паметта. Следователно е важно да се уверите, че всички трансформации се случват в паметта