SSIS oktatóanyag kezdőknek: Mi az, Architecture, Csomagok

Mi az SSIS?

SQL Server Integration Service (SSIS) összetevője a Microsoft SQL Server adatbázisszoftver, amellyel sokféle adatmigrációs feladatot lehet végrehajtani. Az SSIS egy gyors és rugalmas adattárolási eszköz, amelyet adatok kinyerésére, betöltésére és átalakítására használnak, mint például az adatok tisztítása, összesítése, egyesítése stb.

Ez megkönnyíti az adatok áthelyezését egyik adatbázisból a másikba. Az SSIS sokféle forrásból képes adatokat kinyerni, például SQL Server adatbázisokból, Excel-fájlokból, Oracle és DB2 adatbázisok stb.

Az SSIS grafikus eszközöket és varázslókat is tartalmaz olyan munkafolyamat-funkciók végrehajtásához, mint például e-mail üzenetek küldése, FTP-műveletek, adatforrások és célállomások.

Miért használjuk az SSIS-t?

Íme az SSIS eszköz használatának fő okai:

  • Az SSIS eszköz segítségével egyesítheti a különböző adattárak adatait
  • Automatizálja az adminisztratív funkciókat és az adatbetöltést
  • Feltölti a Data Martokat és az adattárházakat
  • Segít az adatok tisztításában és szabványosításában
  • A BI felépítése adatátalakítási folyamattá
  • Adminisztrációs funkciók és adatbetöltés automatizálása
  • A SIS tartalmaz egy grafikus felhasználói felületet, amely segít a felhasználóknak az adatok egyszerű átalakításában, nem pedig nagy programok írásában
  • Néhány perc alatt több millió sort képes betölteni egyik adatforrásból a másikba
  • Adatváltozások azonosítása, rögzítése és feldolgozása
  • Az adatok karbantartásának, feldolgozásának vagy elemzésének koordinálása
  • Az SSIS szükségtelenné teszi a hardcore programozókat
  • Az SSIS robusztus hiba- és eseménykezelést kínál

Az SSIS története

Az SSIS, az SQL Server előtt a Data Transformation Services (DTS) szolgáltatást használták, amely az SQL Server 7 és 2000 része volt.

Változat Részlet
SQL Server 2005 A Microsoft csapat úgy döntött, hogy megújítja a DTS-t. A DTS frissítése helyett azonban úgy döntöttek, hogy Integration Services (SSIS) nevet adnak a terméknek.
2008-as SQL szerver verzió Rengeteg teljesítményjavítás történt az SSIS-ben. Új forrásokat is bemutattak.
SQL Server 2012 Ez volt az SSIS legnagyobb kiadása. Ezzel a verzióval bevezették a projekttelepítési modell koncepcióját. Teljes projekteket tesz lehetővé, és azok csomagjait a rendszer egy kiszolgálóra telepíti, bizonyos csomagok helyett.
SQL Server 2014 Ebben a verzióban nem sok módosítás történik az SSIS-ben. De új források vagy átalakítások kerültek hozzáadásra, ami a Code-on keresztüli külön letöltésekkel történtPlex vagy az SQL Server Feature Pack.
SQL Server 2016-ban A verzió lehetővé teszi teljes projektek telepítését az egyes csomagok helyett. Vannak további források, különösen a felhő, és nagy adatforrások, valamint néhány módosítás történt a katalógusban.

Az SSIS kiemelkedő jellemzői

Íme néhány fontos SSIS alapfunkció:

  • Stúdiókörnyezetek
  • Releváns adatintegrációs funkciók
  • Hatékony végrehajtási sebesség
  • Szoros integráció másokkal Microsoft SQL család
  • Adatbányászati ​​lekérdezés átalakítása
  • Fuzzy keresés és csoportosítási transzformációk
  • Kifejezés-kivonás és kifejezés-keresés átalakítások
  • Nagyobb sebességű adatkapcsolati összetevők, mint például a csatlakozás SAP or Oracle

SSIS Architectúra

SSIS Architectúra
SSIS Architectúra

A következők az SSIS architektúra összetevői:

  • Flow szabályozása (tárolókat és feladatokat tárol)
  • Adatfolyam (forrás, cél, átalakítások)
  • Eseménykezelő (üzenetek, e-mailek küldése)
  • Package Explorer (egyetlen nézetet kínál a csomagban lévő összes számára)
  • Paraméterek (felhasználói interakció)

Nézzük meg részletesen az egyes összetevőket:

1. Control Flow

A Control flow az SSIS-csomag agya. Segít az összes összetevő végrehajtási sorrendjének rendezésében. Az összetevők konténereket és feladatokat tartalmaznak, amelyeket prioritási megszorítások kezelnek.

2. Elsőbbségi korlátozások

Az elsőbbségi kényszer olyan csomagkomponens, amely előre meghatározott sorrendben hajtja végre a feladatokat. Meghatározza a teljes SSIS-csomag munkafolyamatát is. A két összekapcsolt feladat végrehajtását úgy vezérli, hogy a célfeladatokat a korábbi feladat eredménye – speciális kifejezésekkel meghatározott üzleti szabályok – alapján hajtja végre.

3. Feladat

A „Feladat” egy önálló munkaegység. Ez ugyanaz, mint egy programozási nyelvben használt metódus/függvény. Az SSIS-ben azonban nem használ kódolási módszereket. Ehelyett fogd és vidd technikát fog használni a felületek megtervezéséhez és konfigurálásához.

4. Konténerek

A tároló egységek a feladatok munkaegységekbe csoportosítására. A vizuális konzisztencia mellett lehetővé teszi olyan változók és eseménykezelők deklarálását is, amelyeknek az adott tároló hatókörébe kell tartozniuk.

Négy típusú konténer az SSIS-ben:

  • Egy szekvencia tároló
  • A For Loop Container
  • Foreach Loop Container

Sequence Container: lehetővé teszi a kiegészítő feladatok rendszerezését csoportosítással, és lehetővé teszi tranzakciók alkalmazását vagy naplózás hozzárendelését a tárolóhoz.

A huroktárolóhoz:Ugyanazokat a funkciókat nyújtja, mint a szekvenciatároló, kivéve, hogy lehetővé teszi a feladatok többszöri futtatását. Ez azonban egy értékelési feltételen alapul, például egy hurok 1-től 100-ig.

Minden huroktárolóhoz: Lehetővé teszi a hurkolást is. De az a különbség, hogy ahelyett, hogy feltétel kifejezést használnánk, a ciklus objektumok halmazán történik, szereti a mappában lévő fájlokat.

5. Adatáramlás

Az SSIS eszköz fő célja az adatok kinyerése a kiszolgáló memóriájába, átalakítása és másik célhelyre írása. Ha a Control Flow az agy, az adatfolyam az SSIS szíve

6. SSIS-csomagok

Az SSIS másik alapvető összetevője a csomag fogalma. Ez olyan feladatok gyűjteménye, amelyek rendezett módon hajtódnak végre. Itt az elnöki korlátozások segítenek a feladat végrehajtási sorrendjének kezelésében.

Egy csomag segíthet a fájlok mentésében a SQL Server, az msdb vagy a csomagkatalógus adatbázisában. Menthető .dtsx fájlként, amely egy olyan strukturált fájl, amely nagyon hasonlít a Reporting Services .rdl fájljaihoz.

SSIS csomagok

7. Paraméterek

A paraméterek úgy viselkednek, mint egy változó, de néhány fő kivétellel. Könnyen beállítható a csomagon kívülre. Meg lehet jelölni olyan értékekként, amelyeket át kell adni a csomag elindításához.

SSIS feladattípusok

Az SSIS eszközben feladatot adhat hozzá az áramlás szabályozásához. Különböző típusú feladatok vannak, amelyek különböző típusú munkákat hajtanak végre.

Az alábbiakban felsorolunk néhány fontos SSIS-feladatot:

A feladat neve Descriptionok
Végezze el az SQL feladatot Ahogy a neve is sugallja, SQL utasítást fog végrehajtani egy relációs adatbázis ellen.
Adatáramlási feladat Ez a feladat egy vagy több forrásból képes adatokat olvasni. Átalakítsa az adatokat, amikor azok a memóriában vannak, és írják ki egy vagy több célhoz.
Elemzési szolgáltatások feldolgozási feladat Ezzel a feladattal egy táblázatos modell objektumait vagy SSAS-kockaként dolgozhatja fel.
Csomagfeladat végrehajtása A Use használhatja ezt az SSIS-feladatot más csomagok végrehajtására ugyanabban a projektben.
Folyamatfeladat végrehajtása A feladat segítségével parancssori paramétereket adhat meg.
Fájlrendszer feladat Manipulációkat hajt végre a fájlrendszerben. Mint például a fájlok áthelyezése, átnevezése, törlése és könyvtárak létrehozása.
FTP feladatok Lehetővé teszi az alapvető FTP funkciók végrehajtását.
Script Task Ez egy üres feladat. NET kódot írhat, amely bármilyen feladatot végrehajt; szeretne előadni.
Küldés Mail Feladat E-mailt küldhet a felhasználóknak arról, hogy a csomag elkészült, vagy valamilyen hiba történt.
Feladat tömeges beszúrása A Use a tömeges beszúrás paranccsal töltheti be az adatokat egy táblázatba.
Script Task Egy készletet futtat VB.NET vagy C# kódolás Visual Studio környezetben.
Webszolgáltatási feladat Egy metódust hajt végre egy webszolgáltatáson.
WMI eseményfigyelő feladat Ez a feladat lehetővé teszi az SSIS-csomag számára, hogy várjon bizonyos WMI-eseményekre és válaszoljon azokra.
XML feladat Ez a feladat segít az XML-fájlok egyesítésében, felosztásában vagy újraformázásában.

Egyéb fontos ETL eszközök

  • SAP Adatszolgáltatások
  • SAS adatkezelés
  • Oracle Raktárépítő (OWB)
  • PowerCenter Informatica
  • IBM Infoszféra információs szerver
  • Elixir repertoár Data ETL-hez
  • Sargent Data Flow

Az SSIS használatának előnyei és hátrányai

Az SSIS eszköz a következő előnyöket kínálja:

  • Széleskörű dokumentáció és támogatás
  • A végrehajtás egyszerűsége és gyorsasága
  • Szoros integráció az SQL Serverrel és vizuális Stúdió
  • Szabványos adatintegráció
  • Valós idejű, üzenetalapú lehetőségeket kínál
  • Támogatás az elosztási modellhez
  • Segít eltávolítani a hálózatot, mint szűk keresztmetszetet az SSIS által az SQL-be ​​való adatok beszúrásához
  • A SISS lehetővé teszi az SQL Server Destination használatát az OLE DB helyett az adatok gyorsabb betöltéséhez

Az SSIS hátrányai

Az SSIS-eszközök használatának néhány hátránya a következő:

  • Néha problémákat okoz nem Windows környezetben
  • Tisztázatlan jövőkép és stratégia
  • Az SSIS nem támogatja az alternatív adatintegrációs stílusokat
  • Problémás integráció más termékekkel

Példa az SSIS legjobb gyakorlataira

  • Az SSIS egy memórián belüli folyamat. Ezért fontos, hogy minden transzformáció a memóriában történjen
  • Próbálja minimalizálni a naplózott műveleteket
  • Tervezze meg a kapacitást az erőforrás-felhasználás megértésével
  • Optimalizálja az SQL-keresési átalakítást, az adatforrást és a célhelyet
  • Ütemezze be és ossza el helyesen

Összegzésként

  • Az SSIS teljes formája az SQL Server Integration Services
  • Az SSIS eszköz segítségével egyesítheti a különböző adattárak adatait
  • Az SQL Server Integration Service fontos verziói a 2005, 2008, 2012, 2014 és 216
  • A Studio környezetek, a releváns adatintegrációs funkciók és a hatékony megvalósítási sebesség az SSIS néhány fontos jellemzője
  • A vezérlési folyamat, az adatfolyam, az eseménykezelő, a csomagböngésző és a paraméterek az SSIS architektúra alapvető összetevői
  • SQL-feladat végrehajtása, adatfolyam-feladat, elemzőszolgáltatás-feldolgozási feladat, csomagfeladat végrehajtása, folyamatfeladat végrehajtása, fájlrendszer-feladat, FTP-feladatok, küldés Mail A Task és a Web Service Task fontosak
  • Széleskörű dokumentáció és támogatás
  • Az SSIS legnagyobb hátránya, hogy nem támogatja az alternatív adatintegrációs stílusokat
  • SAP Adatszolgáltatások, SAS adatkezelés, Oracle Warehouse Builder (OWB), PowerCenter Informatica, IBM Infoszféra információs szerver
  • Az SSIS egy memórián belüli folyamat. Ezért elengedhetetlen annak biztosítása, hogy minden transzformáció a memóriában történjen