SSIS Tutorial for begyndere: Hvad er, Architecture, Pakker

Hvad er SSIS?

SQL Server Integration Service (SSIS) er en del af Microsoft SQL Server databasesoftware, der kan bruges til at udføre en bred vifte af datamigreringsopgaver. SSIS er et hurtigt og fleksibelt data warehousing værktøj, der bruges til dataudtræk, indlæsning og transformation som rengøring, aggregering, fletning af data osv.

Det gør det nemt at flytte data fra en database til en anden. SSIS kan udtrække data fra en lang række kilder som SQL Server-databaser, Excel-filer, Oracle og DB2-databaser osv.

SSIS inkluderer også grafiske værktøjer og guider til at udføre workflow-funktioner som afsendelse af e-mail-beskeder, FTP-handlinger, datakilder og destinationer.

Hvorfor bruger vi SSIS?

Her er de vigtigste grunde til at bruge SSIS-værktøjet:

  • SSIS-værktøj hjælper dig med at flette data fra forskellige datalagre
  • Automatiserer administrative funktioner og dataindlæsning
  • Befolker Data Marts & Data Warehouses
  • Hjælper dig med at rense og standardisere data
  • Opbygning af BI til en datatransformationsproces
  • Automatisering af administrative funktioner og dataindlæsning
  • SIS indeholder en GUI, der hjælper brugere med at transformere data nemt i stedet for at skrive store programmer
  • Det kan indlæse millioner af rækker fra én datakilde til en anden på meget få minutter
  • Identifikation, indsamling og behandling af dataændringer
  • Koordinering af datavedligeholdelse, -behandling eller -analyse
  • SSIS eliminerer behovet for hardcore programmører
  • SSIS tilbyder robust fejl- og hændelseshåndtering

Historien om SSIS

Før SSIS blev der brugt SQL Server, Data Transformation Services (DTS), som var en del af SQL Server 7 og 2000

Udgave Detalje
SQL Server 2005 Microsoft team besluttede at forny DTS. Men i stedet for at opdatere DTS besluttede de at navngive produktet Integration Services (SSIS).
2008 SQL server version Der blev lavet masser af ydeevneforbedringer til SSIS. Nye kilder blev også introduceret.
SQL Server 2012 Det var den største udgivelse for SSIS. Med denne version blev konceptet med projektimplementeringsmodellen introduceret. Det tillader hele projekter, og deres pakker distribueres til en server i stedet for specifikke pakker.
SQL Server 2014 I denne version er der ikke lavet mange ændringer for SSIS. Men nye kilder eller transformationer blev tilføjet, hvilket blev udført ved separate downloads gennem kodePlex eller SQL Server Feature Pack.
I SQL Server 2016 Versionen giver dig mulighed for at implementere hele projekter i stedet for individuelle pakker. Der er yderligere kilder, især cloud, og store datakilder og få ændringer blev foretaget i kataloget.

SSIS fremtrædende funktioner

Her er nogle vigtige SSIS grundlæggende funktioner:

  • Studiemiljøer
  • Relevante dataintegrationsfunktioner
  • Effektiv implementeringshastighed
  • Tæt integration med andre Microsoft SQL familie
  • Data Mining Query Transformation
  • Fuzzy Lookup og Grouping Transformations
  • Term Extraction og Term Lookup Transformationer
  • Højere hastighed dataforbindelseskomponenter såsom tilslutning til SAP or Oracle

SSIS Architecture

SSIS Architecture
SSIS Architecture

Følgende er komponenter i SSIS-arkitekturen:

  • Kontrolflow (gemmer containere og opgaver)
  • Dataflow (kilde, destination, transformationer)
  • Event Handler (afsendelse af beskeder, e-mails)
  • Pakke Explorer (Tilbyder en enkelt visning for alle i pakken)
  • Parametre (brugerinteraktion)

Lad os forstå hver komponent i detaljer:

1. Styr flow

Kontrolflow er hjernen i SSIS-pakken. Det hjælper dig med at arrangere udførelsesrækkefølgen for alle dens komponenter. Komponenterne indeholder containere og opgaver, som styres af prioritetsbegrænsninger.

2. Forrangsbegrænsninger

Precedence constrain er pakkekomponent, som dirigerer opgaver til at udføre i en foruddefineret rækkefølge. Det definerer også arbejdsgangen for hele SSIS-pakken. Den styrer udførelsen af ​​de to forbundne opgaver ved at udføre destinationsopgaverne baseret på resultatet af den tidligere opgave - forretningsregler, som er defineret ved hjælp af specielle udtryk.

3. Opgave

En 'opgave' er en individuel arbejdsenhed. Det er det samme som en metode/funktion, der bruges i et programmeringssprog. I SSIS bruger du dog ikke kodningsmetoder. I stedet vil du bruge træk og slip-teknik til at designe overflade og konfigurere dem.

4. beholdere

Containeren er enheder til at gruppere opgaver i arbejdsenheder. Udover at tilbyde visuel konsistens, giver det dig også mulighed for at erklære variabler og hændelseshandlere, som bør være inden for den specifikke containers omfang.

Fire typer containere i SSIS er:

  • En sekvensbeholder
  • En Til Loop Container
  • Foreach Loop Container

Sekvensbeholder: giver dig mulighed for at organisere underordnede opgaver ved at gruppere dem, og giver dig mulighed for at anvende transaktioner eller tildele logning til containeren.

Til sløjfebeholder:Giver den samme funktionalitet som sekvensbeholderen, bortset fra at den også lader dig køre opgaverne flere gange. Det er dog baseret på en evalueringsbetingelse, som en looping fra 1 til 100.

For hver løkkebeholder: Det tillader også looping. Men forskellen på, at i stedet for at bruge et betingelsesudtryk, udføres loop s over et sæt objekter, kan lide filer i en mappe.

5. Dataflow

Hovedanvendelsen af ​​SSIS-værktøjet er at udtrække data til serverens hukommelse, transformere dem og skrive dem til en anden destination. Hvis Control Flow er hjernen, er Data Flow hjertet af SSIS

6. SSIS-pakker

En anden kernekomponent i SSIS er begrebet en pakke. Det er en samling af opgaver, der udføres på en ordnet måde. Her hjælper præsidentens begrænsninger med at styre den rækkefølge, som opgaven skal udføres i.

En pakke kan hjælpe dig med at gemme filer på en SQL Server, i msdb- eller pakkekatalogdatabasen. Den kan gemme som en .dtsx-fil, som er en struktureret fil, der meget ligner .rdl-filer til Reporting Services.

SSIS-pakker

7. Parametre

Parametre opfører sig meget som en variabel, men med nogle få hovedundtagelser. Det kan nemt sættes uden for pakken. Det kan udpeges som værdier, der skal sendes ind, for at pakken kan starte.

SSIS-opgavetyper

I SSIS-værktøjet kan du tilføje en opgave for at styre flowet. Der er forskellige typer opgaver, som udfører forskellige slags opgaver.

Nogle vigtige SSIS-opgaver er nævnt nedenfor:

Opgave navn Descriptioner
Udfør SQL-opgave Som navnet antyder, vil den udføre en SQL-sætning mod en relationsdatabase.
Dataflowopgave Denne opgave kan læse data fra en eller flere kilder. Transformer dataene, når de er i hukommelsen, og skriv dem ud mod en eller flere destinationer.
Analyse Services Behandlingsopgave Brug denne opgave til at behandle objekter af en tabelmodel eller som en SSAS-terning.
Udfør pakkeopgave Brug kan bruge denne SSIS-opgave til at udføre andre pakker fra det samme projekt.
Udfør procesopgave Ved hjælp af denne opgave kan du angive kommandolinjeparametre.
Filsystemopgave Den udfører manipulationer i filsystemet. Som at flytte, omdøbe, slette filer og oprette mapper.
FTP opgaver Det giver dig mulighed for at udføre grundlæggende FTP-funktioner.
Script opgave Dette er en tom opgave. Du kan skrive NET-kode, som udfører enhver opgave; du vil optræde.
Send Mail Opgaver Du kan sende en e-mail til brugere med besked om, at din pakke er færdig, eller der opstår en fejl.
Masseindsættelsesopgave Brug kan indlæse data i en tabel ved at bruge kommandoen bulk insert.
Script opgave Kører et sæt af VB.NET eller C#-kodning i et Visual Studio-miljø.
Webserviceopgave Det udfører en metode på en webtjeneste.
WMI Event Watcher opgave Denne opgave gør det muligt for SSIS-pakken at vente på og reagere på visse WMI-hændelser.
XML-opgave Denne opgave hjælper dig med at flette, opdele eller omformatere enhver XML-fil.

Andre vigtige ETL-værktøjer

  • SAP Datatjenester
  • SAS Data Management
  • Oracle Lagerbygger (OWB)
  • PowerCenter Informatica
  • IBM Infosphere informationsserver
  • Elixir Repertoire for Data ETL
  • Sargent dataflow

Fordele og ulemper ved at bruge SSIS

SSIS-værktøjet tilbyder følgende fordele:

  • Bred dokumentation og support
  • Nem og hurtig implementering
  • Tæt integration med SQL Server og visuelt studie
  • Standardiseret dataintegration
  • Tilbyder beskedbaserede funktioner i realtid
  • Support til distributionsmodel
  • Hjælper dig med at fjerne netværk som en flaskehals for indsættelse af data af SSIS i SQL
  • SISS giver dig mulighed for at bruge SQL Server-destinationen i stedet for OLE DB til at indlæse dataene hurtigere

Ulemper ved SSIS

Nogle få ulemper ved at bruge SSIS-værktøjer er som følger:

  • Nogle gange skaber problemer i ikke-Windows-miljøer
  • Uklar vision og strategi
  • SSIS mangler understøttelse af alternative dataintegrationsstile
  • Problematisk integration med andre produkter

SSIS Bedste Practices Eksempel

  • SSIS er en pipeline i hukommelsen. Derfor er det vigtigt at sikre sig, at alle transformationer sker i hukommelsen
  • Prøv at minimere loggede operationer
  • Planlæg for kapacitet ved at forstå ressourceudnyttelse
  • Optimer SQL-opslagstransformationen, datakilden og destinationen
  • Planlæg og distribuer det korrekt

Resumé

  • Den fulde form for SSIS er SQL Server Integration Services
  • SSIS-værktøj hjælper dig med at flette data fra forskellige datalagre
  • Vigtige versioner af SQL Server Integration Service er 2005, 2008, 2012, 2014 og 216
  • Studiemiljøer, relevante dataintegrationsfunktioner og effektiv implementeringshastighed er nogle vigtige funktioner i SSIS
  • Control Flow, Data Flow, Event Handler, Package Explorer og Parametre er vigtige SSIS-arkitekturkomponenter
  • Udfør SQL-opgave, Dataflow-opgave, Analysis Services-behandlingsopgave, Udfør pakkeopgave, Udfør procesopgave, filsystemopgave, FTP-opgaver, Send Mail Opgave, Web Service Opgave er nogle vigtige
  • Bred dokumentation og support
  • Den største ulempe ved SSIS er, at den mangler understøttelse af alternative dataintegrationsstile
  • SAP Data Services, SAS Data Management, Oracle Lagerbygger (OWB), PowerCenter Informatica, IBM Infosphere informationsserver
  • SSIS er en pipeline i hukommelsen. Derfor er det vigtigt at sikre, at alle transformationer sker i hukommelsen