SSIS handledning för nybörjare: Vad är, Architecture, paket
Vad är SSIS?
SQL Server Integration Service (SSIS) är en del av Microsoft SQL Server databasprogramvara som kan användas för att utföra ett brett utbud av datamigreringsuppgifter. SSIS är ett snabbt och flexibelt datalagerverktyg som används för dataextraktion, laddning och transformation som rengöring, aggregering, sammanslagning av data, etc.
Det gör det enkelt att flytta data från en databas till en annan databas. SSIS kan extrahera data från en mängd olika källor som SQL Server-databaser, Excel-filer, Oracle och DB2-databaser osv.
SSIS innehåller också grafiska verktyg och guider för att utföra arbetsflödesfunktioner som att skicka e-postmeddelanden, FTP-operationer, datakällor och destinationer.
Varför använder vi SSIS?
Här är de viktigaste skälen till att använda SSIS-verktyget:
- SSIS-verktyget hjälper dig att slå samman data från olika datalager
- Automatiserar administrativa funktioner och dataladdning
- Befolkar Data Marts & Data Warehouses
- Hjälper dig att rensa och standardisera data
- Bygga BI till en datatransformationsprocess
- Automatisera administrativa funktioner och dataladdning
- SIS innehåller ett GUI som hjälper användare att enkelt transformera data istället för att skriva stora program
- Den kan ladda miljontals rader från en datakälla till en annan på mycket få minuter
- Identifiera, fånga in och bearbeta dataförändringar
- Koordinering av dataunderhåll, bearbetning eller analys
- SSIS eliminerar behovet av hardcore programmerare
- SSIS erbjuder robust fel- och händelsehantering
SSIS historia
Före SSIS användes SQL Server, Data Transformation Services (DTS), som var en del av SQL Server 7 och 2000
version | Detalj |
---|---|
SQL Server 2005 | Ocuco-landskapet Microsoft team beslutade att förnya DTS. Men istället för att uppdatera DTS bestämde de sig för att döpa produkten till Integration Services (SSIS). |
2008 SQL-serverversion | Många prestandaförbättringar gjordes för SSIS. Nya källor introducerades också. |
SQL Server 2012 | Det var den största releasen för SSIS. Med denna version introducerades konceptet med projektimplementeringsmodellen. Det tillåter hela projekt, och deras paket distribueras till en server, istället för specifika paket. |
SQL Server 2014 | I den här versionen görs inte många ändringar för SSIS. Men nya källor eller transformationer lades till som gjordes genom separata nedladdningar genom kodPlex eller SQL Server Feature Pack. |
I SQL Server 2016 | Versionen låter dig distribuera hela projekt, istället för enskilda paket. Det finns ytterligare källor, särskilt moln, och stora datakällor och få ändringar gjordes i katalogen. |
SSIS framträdande egenskaper
Här är några viktiga SSIS grundläggande funktioner:
- Studiomiljöer
- Relevanta dataintegreringsfunktioner
- Effektiv implementeringshastighet
- Tät integration med andra Microsoft SQL familj
- Data Mining Query Transformation
- Fuzzy Lookup och gruppering Transformationer
- Termextraktion och Term Lookup Transformationer
- Höghastighetsdataanslutningskomponenter såsom anslutning till SAP or Oracle
SSIS Architecture
Följande är komponenter i SSIS-arkitekturen:
- Kontrollflöde (lagrar behållare och uppgifter)
- Dataflöde (källa, destination, transformationer)
- Händelsehanterare (sändning av meddelanden, e-postmeddelanden)
- Package Explorer (Erbjuder en enda vy för alla i paketet)
- Parametrar (användarinteraktion)
Låt oss förstå varje komponent i detalj:
1. Styr flöde
Kontrollflöde är hjärnan i SSIS-paketet. Det hjälper dig att ordna utförandeordningen för alla dess komponenter. Komponenterna innehåller behållare och uppgifter som hanteras av prioritetsbegränsningar.
2. Företrädesbegränsningar
Precedence constrain är paketkomponenter som styr uppgifter att utföra i en fördefinierad ordning. Den definierar också arbetsflödet för hela SSIS-paketet. Den kontrollerar exekveringen av de två länkade uppgifterna genom att utföra destinationsuppgifterna baserat på resultatet av den tidigare uppgiften - affärsregler som definieras med hjälp av speciella uttryck.
3. Uppgift
En "uppgift" är en individuell arbetsenhet. Det är samma sak som en metod/funktion som används i ett programmeringsspråk. Men i SSIS använder du inte kodningsmetoder. Istället kommer du att använda dra & släpp-teknik för att designa ytor och konfigurera dem.
4. Behållare
Containern är enheter för att gruppera uppgifter till arbetsenheter. Förutom att erbjuda visuell konsistens, låter den dig också deklarera variabler och händelsehanterare som bör vara inom ramen för den specifika behållaren.
Fyra typer av containrar i SSIS är:
- En sekvensbehållare
- En För Loop Container
- Foreach Loop Container
Sekvensbehållare: låter dig organisera underordnade uppgifter genom att gruppera dem, och låter dig tillämpa transaktioner eller tilldela loggning till behållaren.
För slingbehållare:Ger samma funktionalitet som sekvensbehållaren förutom att den också låter dig köra uppgifterna flera gånger. Det är dock baserat på ett utvärderingsvillkor, som en looping från 1 till 100.
För varje loopbehållare: Det tillåter också looping. Men skillnaden att istället för att använda ett villkorsuttryck, gör loopar över en uppsättning objekt, gillar filer i en mapp.
5. Data flöde
Den huvudsakliga användningen av SSIS-verktyget är att extrahera data till serverns minne, transformera den och skriva den till en annan destination. Om Control Flow är hjärnan, är Data Flow hjärtat av SSIS
6. SSIS-paket
En annan kärnkomponent i SSIS är idén om ett paket. Det är en samling uppgifter som utförs på ett ordnat sätt. Här hjälper presidentens begränsningar att hantera ordningen i vilken uppgiften ska utföras.
Ett paket kan hjälpa dig att spara filer på en SQL Server, i msdb- eller paketkatalogdatabasen. Den kan sparas som en .dtsx-fil, vilket är en strukturerad fil som mycket liknar .rdl-filer för Reporting Services.
7. parametrar
Parametrar beter sig ungefär som en variabel men med några få huvudsakliga undantag. Den kan enkelt placeras utanför förpackningen. Det kan anges som värden som måste skickas in för att paketet ska starta.
SSIS-uppgiftstyper
I SSIS-verktyget kan du lägga till en uppgift för att kontrollera flödet. Det finns olika typer av uppgifter som utför olika typer av arbeten.
Några viktiga SSIS-uppgifter nämns nedan:
Arbetsnamn | Descriptjoner |
---|---|
Kör SQL-uppgift | Som namnet antyder kommer den att köra en SQL-sats mot en relationsdatabas. |
Dataflödesuppgift | Denna uppgift kan läsa data från en eller flera källor. Omvandla data när den finns i minnet och skriv ut den mot en eller flera destinationer. |
Analystjänster Bearbetningsuppgift | Använd den här uppgiften för att bearbeta objekt av en tabellmodell eller som en SSAS-kub. |
Utför paketuppgift | Använd kan använda denna SSIS-uppgift för att köra andra paket från samma projekt. |
Utför processuppgift | Med hjälp av denna uppgift kan du ange kommandoradsparametrar. |
Filsystemuppgift | Den utför manipulationer i filsystemet. Som att flytta, byta namn, ta bort filer och skapa kataloger. |
FTP-uppgifter | Det låter dig utföra grundläggande FTP-funktioner. |
Skriptuppgift | Detta är en tom uppgift. Du kan skriva NET-kod som utför vilken uppgift som helst; du vill prestera. |
Skicka Mail uppgift | Du kan skicka ett e-postmeddelande för att meddela användarna att ditt paket är färdigt eller att något fel uppstår. |
Bulk Infoga uppgift | Använd kan laddar data till en tabell genom att använda kommandot bulk insert. |
Skriptuppgift | Kör en uppsättning av VB.NET eller C#-kodning i en Visual Studio-miljö. |
Webbtjänstuppgift | Den kör en metod på en webbtjänst. |
WMI Event Watcher-uppgift | Denna uppgift låter SSIS-paketet vänta på och svara på vissa WMI-händelser. |
XML-uppgift | Den här uppgiften hjälper dig att slå samman, dela upp eller formatera om valfri XML-fil. |
Andra viktiga ETL-verktyg
- SAP Datatjänster
- SAS Data Management
- Oracle Lagerbyggare (OWB)
- PowerCenter Informatica
- IBM Infosphere Information Server
- Elixirrepertoar för data ETL
- Sargent dataflöde
Fördelar och nackdelar med att använda SSIS
SSIS-verktyget erbjuder följande fördelar:
- Bred dokumentation och support
- Enkel och snabb implementering
- Tätt integration med SQL Server och visuell Studio
- Standardiserad dataintegration
- Erbjuder meddelandebaserade funktioner i realtid
- Stöd för distributionsmodell
- Hjälper dig att ta bort nätverk som en flaskhals för infogning av data av SSIS i SQL
- SISS låter dig använda SQL Server Destination istället för OLE DB för att ladda data snabbare
Nackdelar med SSIS
Några nackdelar med att använda SSIS-verktyg är följande:
- Skapar ibland problem i miljöer utanför Windows
- Otydlig vision och strategi
- SSIS saknar stöd för alternativa dataintegrationsstilar
- Problematisk integration med andra produkter
Exempel på SSIS Best Practices
- SSIS är en pipeline i minnet. Det är därför det är viktigt att se till att alla transformationer sker i minnet
- Försök att minimera loggade operationer
- Planera för kapacitet genom att förstå resursutnyttjandet
- Optimera SQL-uppslagstransformationen, datakällan och destinationen
- Schemalägg och distribuera det korrekt
Sammanfattning
- Den fullständiga formen av SSIS är SQL Server Integration Services
- SSIS-verktyget hjälper dig att slå samman data från olika datalager
- Viktiga versioner av SQL Server Integration Service är 2005, 2008, 2012, 2014 och 216
- Studiomiljöer, relevanta dataintegreringsfunktioner och effektiv implementeringshastighet är några viktiga funktioner i SSIS
- Kontrollflöde, dataflöde, händelsehanterare, paketutforskare och parametrar är viktiga SSIS-arkitekturkomponenter
- Kör SQL-uppgift, dataflödesuppgift, analystjänstbearbetningsuppgift, exekvera paketuppgift, exekvera processuppgift, filsystemuppgift, FTP-uppgifter, skicka Mail Uppgift, Web Service Task är några viktiga
- Bred dokumentation och support
- Den största nackdelen med SSIS är att det saknar stöd för alternativa dataintegrationsstilar
- SAP Data Services, SAS Data Management, Oracle Lagerbyggare (OWB), PowerCenter Informatica, IBM Infosphere Information Server
- SSIS är en pipeline i minnet. Därför är det viktigt att se till att alla transformationer sker i minnet