SSIS Tutorial for begyndere: Hvad er, Architecture, Pakker
Hvad er SSIS?
SQL Server Integration Service (SSIS) er en del af Microsoft SQL Server databasesoftware, der kan bruges til at udføre en bred vifte af datamigreringsopgaver. SSIS er et hurtigt og fleksibelt data warehousing værktøj, der bruges til dataudtræk, indlæsning og transformation som rengøring, aggregering, fletning af data osv.
Det gør det nemt at flytte data fra en database til en anden. SSIS kan udtrække data fra en lang række kilder som SQL Server-databaser, Excel-filer, Oracle og DB2-databaser osv.
SSIS inkluderer også grafiske værktøjer og guider til at udføre workflow-funktioner som afsendelse af e-mail-beskeder, FTP-handlinger, datakilder og destinationer.
Hvorfor bruger vi SSIS?
Her er de vigtigste grunde til at bruge SSIS-værktøjet:
- SSIS-værktøj hjælper dig med at flette data fra forskellige datalagre
- Automatiserer administrative funktioner og dataindlæsning
- Befolker Data Marts & Data Warehouses
- Hjælper dig med at rense og standardisere data
- Opbygning af BI til en datatransformationsproces
- Automatisering af administrative funktioner og dataindlæsning
- SIS indeholder en GUI, der hjælper brugere med at transformere data nemt i stedet for at skrive store programmer
- Det kan indlæse millioner af rækker fra én datakilde til en anden på meget få minutter
- Identifikation, indsamling og behandling af dataændringer
- Koordinering af datavedligeholdelse, -behandling eller -analyse
- SSIS eliminerer behovet for hardcore programmører
- SSIS tilbyder robust fejl- og hændelseshåndtering
Historien om SSIS
Før SSIS blev der brugt SQL Server, Data Transformation Services (DTS), som var en del af SQL Server 7 og 2000
Udgave | Detalje |
---|---|
SQL Server 2005 | Microsoft team besluttede at forny DTS. Men i stedet for at opdatere DTS besluttede de at navngive produktet Integration Services (SSIS). |
2008 SQL server version | Der blev lavet masser af ydeevneforbedringer til SSIS. Nye kilder blev også introduceret. |
SQL Server 2012 | Det var den største udgivelse for SSIS. Med denne version blev konceptet med projektimplementeringsmodellen introduceret. Det tillader hele projekter, og deres pakker distribueres til en server i stedet for specifikke pakker. |
SQL Server 2014 | I denne version er der ikke lavet mange ændringer for SSIS. Men nye kilder eller transformationer blev tilføjet, hvilket blev udført ved separate downloads gennem kodePlex eller SQL Server Feature Pack. |
I SQL Server 2016 | Versionen giver dig mulighed for at implementere hele projekter i stedet for individuelle pakker. Der er yderligere kilder, især cloud, og store datakilder og få ændringer blev foretaget i kataloget. |
SSIS fremtrædende funktioner
Her er nogle vigtige SSIS grundlæggende funktioner:
- Studiemiljøer
- Relevante dataintegrationsfunktioner
- Effektiv implementeringshastighed
- Tæt integration med andre Microsoft SQL familie
- Data Mining Query Transformation
- Fuzzy Lookup og Grouping Transformations
- Term Extraction og Term Lookup Transformationer
- Højere hastighed dataforbindelseskomponenter såsom tilslutning til SAP or Oracle
SSIS Architecture
Følgende er komponenter i SSIS-arkitekturen:
- Kontrolflow (gemmer containere og opgaver)
- Dataflow (kilde, destination, transformationer)
- Event Handler (afsendelse af beskeder, e-mails)
- Pakke Explorer (Tilbyder en enkelt visning for alle i pakken)
- Parametre (brugerinteraktion)
Lad os forstå hver komponent i detaljer:
1. Styr flow
Kontrolflow er hjernen i SSIS-pakken. Det hjælper dig med at arrangere udførelsesrækkefølgen for alle dens komponenter. Komponenterne indeholder containere og opgaver, som styres af prioritetsbegrænsninger.
2. Forrangsbegrænsninger
Precedence constrain er pakkekomponent, som dirigerer opgaver til at udføre i en foruddefineret rækkefølge. Det definerer også arbejdsgangen for hele SSIS-pakken. Den styrer udførelsen af de to forbundne opgaver ved at udføre destinationsopgaverne baseret på resultatet af den tidligere opgave - forretningsregler, som er defineret ved hjælp af specielle udtryk.
3. Opgave
En 'opgave' er en individuel arbejdsenhed. Det er det samme som en metode/funktion, der bruges i et programmeringssprog. I SSIS bruger du dog ikke kodningsmetoder. I stedet vil du bruge træk og slip-teknik til at designe overflade og konfigurere dem.
4. beholdere
Containeren er enheder til at gruppere opgaver i arbejdsenheder. Udover at tilbyde visuel konsistens, giver det dig også mulighed for at erklære variabler og hændelseshandlere, som bør være inden for den specifikke containers omfang.
Fire typer containere i SSIS er:
- En sekvensbeholder
- En Til Loop Container
- Foreach Loop Container
Sekvensbeholder: giver dig mulighed for at organisere underordnede opgaver ved at gruppere dem, og giver dig mulighed for at anvende transaktioner eller tildele logning til containeren.
Til sløjfebeholder:Giver den samme funktionalitet som sekvensbeholderen, bortset fra at den også lader dig køre opgaverne flere gange. Det er dog baseret på en evalueringsbetingelse, som en looping fra 1 til 100.
For hver løkkebeholder: Det tillader også looping. Men forskellen på, at i stedet for at bruge et betingelsesudtryk, udføres loop s over et sæt objekter, kan lide filer i en mappe.
5. Dataflow
Hovedanvendelsen af SSIS-værktøjet er at udtrække data til serverens hukommelse, transformere dem og skrive dem til en anden destination. Hvis Control Flow er hjernen, er Data Flow hjertet af SSIS
6. SSIS-pakker
En anden kernekomponent i SSIS er begrebet en pakke. Det er en samling af opgaver, der udføres på en ordnet måde. Her hjælper præsidentens begrænsninger med at styre den rækkefølge, som opgaven skal udføres i.
En pakke kan hjælpe dig med at gemme filer på en SQL Server, i msdb- eller pakkekatalogdatabasen. Den kan gemme som en .dtsx-fil, som er en struktureret fil, der meget ligner .rdl-filer til Reporting Services.
7. Parametre
Parametre opfører sig meget som en variabel, men med nogle få hovedundtagelser. Det kan nemt sættes uden for pakken. Det kan udpeges som værdier, der skal sendes ind, for at pakken kan starte.
SSIS-opgavetyper
I SSIS-værktøjet kan du tilføje en opgave for at styre flowet. Der er forskellige typer opgaver, som udfører forskellige slags opgaver.
Nogle vigtige SSIS-opgaver er nævnt nedenfor:
Opgave navn | Descriptioner |
---|---|
Udfør SQL-opgave | Som navnet antyder, vil den udføre en SQL-sætning mod en relationsdatabase. |
Dataflowopgave | Denne opgave kan læse data fra en eller flere kilder. Transformer dataene, når de er i hukommelsen, og skriv dem ud mod en eller flere destinationer. |
Analyse Services Behandlingsopgave | Brug denne opgave til at behandle objekter af en tabelmodel eller som en SSAS-terning. |
Udfør pakkeopgave | Brug kan bruge denne SSIS-opgave til at udføre andre pakker fra det samme projekt. |
Udfør procesopgave | Ved hjælp af denne opgave kan du angive kommandolinjeparametre. |
Filsystemopgave | Den udfører manipulationer i filsystemet. Som at flytte, omdøbe, slette filer og oprette mapper. |
FTP opgaver | Det giver dig mulighed for at udføre grundlæggende FTP-funktioner. |
Script opgave | Dette er en tom opgave. Du kan skrive NET-kode, som udfører enhver opgave; du vil optræde. |
Send Mail Opgaver | Du kan sende en e-mail til brugere med besked om, at din pakke er færdig, eller der opstår en fejl. |
Masseindsættelsesopgave | Brug kan indlæse data i en tabel ved at bruge kommandoen bulk insert. |
Script opgave | Kører et sæt af VB.NET eller C#-kodning i et Visual Studio-miljø. |
Webserviceopgave | Det udfører en metode på en webtjeneste. |
WMI Event Watcher opgave | Denne opgave gør det muligt for SSIS-pakken at vente på og reagere på visse WMI-hændelser. |
XML-opgave | Denne opgave hjælper dig med at flette, opdele eller omformatere enhver XML-fil. |
Andre vigtige ETL-værktøjer
- SAP Datatjenester
- SAS Data Management
- Oracle Lagerbygger (OWB)
- PowerCenter Informatica
- IBM Infosphere informationsserver
- Elixir Repertoire for Data ETL
- Sargent dataflow
Fordele og ulemper ved at bruge SSIS
SSIS-værktøjet tilbyder følgende fordele:
- Bred dokumentation og support
- Nem og hurtig implementering
- Tæt integration med SQL Server og visuelt studie
- Standardiseret dataintegration
- Tilbyder beskedbaserede funktioner i realtid
- Support til distributionsmodel
- Hjælper dig med at fjerne netværk som en flaskehals for indsættelse af data af SSIS i SQL
- SISS giver dig mulighed for at bruge SQL Server-destinationen i stedet for OLE DB til at indlæse dataene hurtigere
Ulemper ved SSIS
Nogle få ulemper ved at bruge SSIS-værktøjer er som følger:
- Nogle gange skaber problemer i ikke-Windows-miljøer
- Uklar vision og strategi
- SSIS mangler understøttelse af alternative dataintegrationsstile
- Problematisk integration med andre produkter
SSIS Bedste Practices Eksempel
- SSIS er en pipeline i hukommelsen. Derfor er det vigtigt at sikre sig, at alle transformationer sker i hukommelsen
- Prøv at minimere loggede operationer
- Planlæg for kapacitet ved at forstå ressourceudnyttelse
- Optimer SQL-opslagstransformationen, datakilden og destinationen
- Planlæg og distribuer det korrekt
Resumé
- Den fulde form for SSIS er SQL Server Integration Services
- SSIS-værktøj hjælper dig med at flette data fra forskellige datalagre
- Vigtige versioner af SQL Server Integration Service er 2005, 2008, 2012, 2014 og 216
- Studiemiljøer, relevante dataintegrationsfunktioner og effektiv implementeringshastighed er nogle vigtige funktioner i SSIS
- Control Flow, Data Flow, Event Handler, Package Explorer og Parametre er vigtige SSIS-arkitekturkomponenter
- Udfør SQL-opgave, Dataflow-opgave, Analysis Services-behandlingsopgave, Udfør pakkeopgave, Udfør procesopgave, filsystemopgave, FTP-opgaver, Send Mail Opgave, Web Service Opgave er nogle vigtige
- Bred dokumentation og support
- Den største ulempe ved SSIS er, at den mangler understøttelse af alternative dataintegrationsstile
- SAP Data Services, SAS Data Management, Oracle Lagerbygger (OWB), PowerCenter Informatica, IBM Infosphere informationsserver
- SSIS er en pipeline i hukommelsen. Derfor er det vigtigt at sikre, at alle transformationer sker i hukommelsen