SAP DS (Data Services) i HANA
Vad är SAP Datatjänster?
SAP Datatjänster är ett ETL-verktyg som ger en lösning på en enda företagsnivå för dataintegration, transformation, datakvalitet, dataprofilering och textdatabearbetning från den heterogena källan till en måldatabas eller datalager.
Vi kan skapa applikationer (jobb) där datakartläggning och transformation kan göras med hjälp av Designern. (Senaste versionen av SAP BODS är 4.2).
Funktioner i datatjänster
- Det ger högpresterande parallella transformationer.
- Den har omfattande administrativa verktyg och rapporteringsverktyg.
- Den stöder flera användare.
- SAP BODS är mycket flexibel med webbtjänstbaserad applikation.
- Det tillåter skriptspråk med rika uppsättningar funktioner.
- Datatjänster kan integreras med SAP LT Replication Server (SLT) , med den triggerbaserade teknologin. SLT lägger till delta-funktioner till alla SAP eller icke-SAP källtabell, som gör det möjligt att använda datafångst för förändring och överföring av deltadata från källtabellen.
- Datavalidering med dashboards och processrevision.
- Administrationsverktyg med schemaläggningsfunktioner och övervakning/dashboards.
- Felsökning och inbyggd profilering och visning av data.
- SAP BODS-stöd Bred källa och mål.
- Alla applikationer (t.ex SAP).
- Alla databaser med bulkladdning och datainsamling
- Filer: fast bredd, kommaavgränsad, COBOL, XML, excel.
Komponent av datatjänster
SAP DATA-tjänster har nedanstående komponent –
- Designer – Det är ett utvecklingsverktyg med vilket vi kan skapa, testa och utföra ett jobb som fyller ett datalager. Det låter utvecklaren skapa objekt och konfigurera dem genom att välja en ikon i ett flödesdiagram från källa till mål. används för att skapa en applikation genom att ange arbetsflöden och dataflöden. För att öppna Data Service Designer gå till Startmeny -> Alla program -> SAP Datatjänster (4.2 här) -> Datatjänstdesigner.
- Job Server- Det är en applikation som startar datatjänstens bearbetningsmotor och fungerar som ett gränssnitt till motorn och Data Services Suite.
- Motor- Data Service-motorn utför individuella jobb som är definierade i applikationen.
- Förvar- Repository är en databas som lagrar designers fördefinierade objekt och användardefinierade objekt (käll- och målmetadata, transformationsregler). Repository är av två typer –
- Lokalt förråd (Används av Designer och Job Server).
- Centralförvaret (Används för objektdelning och versionskontroll)
- Access Server- Access server skickar meddelanden mellan webbapplikationer, datatjänster jobbserver och motorer.
- Administratör- Webbadministratör tillhandahåller webbläsarbaserad administration av datatjänsters resurser. Detaljerna är enligt nedan –
- Konfigurera, starta och stoppa realtidstjänster.
- Schemalägga, övervaka och utföra batchjobb.
- Konfigurera användning av jobbserver, åtkomstserver och arkiv.
- Hantera användare.
- Publicering av batchjobb och realtidstjänster via webbtjänster
- Konfigurera och hantera adaptrar.
Datatjänster Archilära –
Data Services-arkitekturen har följande komponent-
- Central Repository – det används för arkivkonfigurationer till jobbservrar, säkerhetshantering, versionskontroll och objektdelning
- Designer – Används för att skapa projekt, jobb, arbetsflöde, dataflöde och körning.
- Lokalt arkiv (här kan du skapa ändrings- och startjobb, arbetsflöde, dataflöde).
- Jobbserver & motor – Den hanterar jobben.
- Access Server – Den används för att utföra realtidsjobb som skapats av utvecklare i arkiven.
I bilden nedan visas Datatjänster och dess komponentförhållande.
SAP BODS Architecture
Designerfönsterdetalj: Först tittar vi på den första komponenten av SAP datatjänst- Designer
Detalj av varje sektion av datatjänstdesignern är som nedan-
- Verktygsfältet (Används för Öppna, Spara, Tillbaka, Validera, Utför, etc.).
- Projektområde (Innehåller det aktuella projektet, som inkluderar jobb, arbetsflöde och dataflöde. I Datatjänster är alla entiteter objekt.
- Arbetsutrymme (Applikationsfönstrets område där vi definierar, visar och ändrar objekt).
- Lokalt objektbibliotek (Den innehåller lokala förvarsobjekt, såsom transformationer, jobb, arbetsflöde, dataflöde, etc.).
- Verktygspalett (Knappar på verktygspaletten gör att du kan lägga till nya objekt till arbetsytan).
Objekthierarki
Diagrammet nedan visar hierarkiska relationer för nyckelobjekttyperna inom Data Services.
>
Notera:
Arbetsflöden och Villkorlig* är valfria
Föremål som används i SAP Information om datatjänster är enligt nedan –
Objekt | Description |
---|---|
Projekt | Ett projekt är ett objekt på högsta nivån i Designer-fönstret. Projekt ger dig ett sätt att organisera de andra objekten du skapar i Data Services. Endast ett projekt är öppet åt gången (där "öppet" betyder "synligt i projektområdet"). |
Jobb | Ett "jobb" är den minsta arbetsenhet som du kan schemalägga självständigt för utförande. |
Skript | En delmängd av linjer i en procedur. |
Arbetsflöde | Ett "arbetsflöde" är införlivandet av flera dataflöden i ett sammanhängande flöde av arbete för ett helt jobb. Arbetsflöde är valfritt. Arbetsflöde är en procedur.
|
Data flöde | Ett "dataflöde" är den process genom vilken källdata omvandlas till måldata. Ett dataflöde är ett återanvändbart objekt. Det kallas alltid från ett arbetsflöde eller ett jobb.
|
Datalagring | Logisk kanal som kopplar Data Services till käll- och Datastore-måldatabaser.
|
Target | Tabell eller fil där Data Services laddar data från källan. |
Datatjänster exempel genom att ladda data från SAP Källtabell
Allt i Datatjänster är ett objekt. Vi måste separera datalager för varje källa och måldatabas.
Steg för att ladda data från SAP källtabell – SAP BODS har många steg, där vi måste skapa ett datalager för källa och mål och mappa till dem.
- Skapa datalager mellan källa och BODS
- Importera metadata (Strukturer) till BODS.
- Konfigurera importserver
- Importera metadata till HANA-systemet.
- Skapa datalager mellan BODS och HANA.
- Skapa projekt.
- Skapa jobb (batch/realtid)
- Skapa arbetsflöde
- Skapa dataflöde
- Lägg till objekt i Dataflow
- Utför jobbet
- Kontrollera Data Preview i HANA
Steg 1) Skapa Data Store mellan SAP Källa och BODS
- Att ladda data från SAP Källa till SAP HANA igenom SAP BODS, vi behöver ett datalager. Så vi skapar först ett datalager som visas nedan – Projekt -> Nytt – > Datalager
- Ett popup-fönster för Skapa nytt datalager visas, ange detaljer enligt nedan –
- Ange datalagrets namn "ds_ecc".
- Välj datalagringstypnamn som "SAP Ansökningar”.
- Ange databasserverns namn
- Användarnamn och lösenord.
- Klicka på knappen "Ansök".
- Klicka på knappen "OK".
- Data Store kommer att skapas och visa den skapade datastore som nedan-
- Gå till Lokalt objektbibliotek
- Välj fliken DataStore.
- Datalagret "ds_ecc" kommer att visas.
Steg 2) Importera metadata (struktur) till BODS Server.
Vi har skapat ett datalager för ECC till BODS; nu importerar vi metadata från ECC till BODS. För att importera följ stegen nedan –
- Välj Datastore "ds_ecc" och högerklicka.
- Välj alternativet Importera efter namn.
Ett popup-fönster för Importera efter namn kommer att visas. Ange detaljer enligt nedan -
- Välj Typ som tabell.
- Ange namn på tabell som vi vill importera. Här importerar vi KNA1-tabell.
- Klicka på knappen "Importera". KNA1-tabellen kommer att visas under tabellnoden för datakällan "ds_ecc".
Tabellmetadata kommer att importeras, i datastore ds_ecc enligt nedan –
Steg 3) Konfigurera importserver
Hittills har vi importerat tabell till data lagrad "ds_ecc" skapad för ECC till SAP BODS-anslutning. Att importera data till SAP HANA, vi måste konfigurera importservern,
- För att göra detta gå till Snabbvy-> Konfigurera importserver som nedan -
- Ett popup-fönster för Välj system visas, Välj SAP HANA (HDB här) System enligt nedan-
- Klicka på knappen "Nästa". Ett annat popup-fönster för datatjänstuppgifter visas, ange följande detaljer
- SAP BODS serveradress (här BODS:6400 )
- ange SAP BODS Repository Name ( HANAUSER Repository Name )
- Ange ODBC-datakälla (ZTDS_DS).
- Ange standardport för SAP BODS-server(8080).
Klicka på knappen "Slutför".
Steg 4) Importera metadata till HANA System
1. Hittills har vi konfigurerad importserver, nu kommer vi att importera metadata från SAP BODS server.
- Klicka på alternativet Importera i snabbvy.
- Ett popup-fönster för importalternativ kommer att visas. Välj alternativet "Selektiv import av metadata".
Klicka på knappen "Nästa".
2. Ett popup-fönster för "Selektiv import av metadata" kommer att visas, där vi väljer målsystem.
- Välja SAP HANA System (HDB här).
Klicka på knappen "Nästa".
Steg 5) Skapa datalager mellan BODS och HANA
Som vi vet behöver vi i BODS skapa ett separat datalager för källa och mål. Vi har redan skapat ett datalager för källan, nu måste vi skapa ett datalager för målet (mellan BODS och HANA). Så vi skapar ett nytt datalager med namnet "DS_BODS_HANA".
- Gå till Project -> New -> Datastore.
- En skärm för Skapa ny databutik visas enligt nedan.
- Ange Datastore namn (DS_BODS_HANA).
- Ange Datastore-typ som Database.
- Ange Databastyp som SAP HANA.
- Välj Databasversion.
- ange SAP HANA Databasservernamn.
- Ange portnamn för SAP HANA Databas.
- Ange användarnamn och lösenord.
- Markera "Aktivera automatisk dataöverföring".
Klicka på "Apply" och sedan "OK"-knappen.
Datalagret "DS_BODS_HANA" kommer att visas under datalagerfliken i Local Object Library som
Nedan-
- Nu importerar vi tabell i datalagret "DS_BODS_HANA".
- Välj datalager "DS_BODS_HANA" och högerklicka.
- Välj Importera efter namn.
- Ett popup-fönster för Importera efter namn kommer att visas nedan-
- Välj Typ som tabell.
- Ange Namn som KNA1.
- Ägare kommer att visas som Hanauser.
- Klicka på knappen Importera.
Tabell kommer att importeras i "DS_BOD_HANA" datalager, för att se data i tabellen följ stegen nedan -
- Klicka på tabellen "KNA1" i datalagret "DS_BODS_HANA".
- Data kommer att visas I TABELLformat.
Steg 6) Definiera projekt: Projektgrupp och organisera relaterade objekt. Projektet kan innehålla valfritt antal jobb, arbetsflöde och dataflöde.
- Gå till Designer Project-menyn.
- Välj nytt alternativ.
- Välj projektalternativ.
En POP-UP för att skapa nya projekt visas enligt nedan. Ange projektnamn och klicka på knappen Skapa. Det kommer att skapa en projektmapp i vårt fall BODS_DHK.
Steg 7) Definiera jobb: Ett jobb är ett återanvändbart objekt. Den innehåller arbetsflöden och dataflöde. Jobb kan utföras manuellt eller som ett schema. För att utföra BODS-processen måste vi definiera jobbet.
Vi skapar ett jobb som JOB_Kund.
- Välj Projekt (BODS_DHK) skapat i steg 1, högerklicka och välj "Nytt batchjobb".
- Byt namn på det till "JOB_Kund".
Steg 8) Definiera arbetsflöde:
- Välj jobb "JOB_Kund" i projektområdet,
- Klicka på arbetsflödesknappen på verktygspaletten. Klicka på området Black Workspace. En arbetsflödesikon visas i arbetsytan.
- Ändra namnet på arbetsflödet till "WF_Customer".
Klicka på namnet på arbetsflödet, en tom vy för arbetsflödet visas i arbetsytan.
Steg 9) Definiera dataflöde:
- Klicka på Arbetsflöde "WF_Customer".
- Klicka på knappen Dataflöde på verktygspaletten. Klicka på området Black Workspace. En dataflödesikon visas i arbetsytan.
- Ändra namnet på dataflödet som "DF_Customer".
- Dataflödet visas även i projektområdet till vänster under jobbnamn.
Steg 10) Lägg till objekt i dataflöde:
Inuti dataflödet kan vi ge instruktioner för att omvandla källdata till önskad form för måltabellen.
Vi kommer att se objektet nedan -
- Ett objekt för källan.
- Ett objekt för måltabellen.
- Ett objekt för frågetransform. (Frågeomvandling mappar kolumnerna från källa till mål.)Klicka på dataflödet DF_Customer . En tom arbetsyta visas enligt nedan -
- Ange objekt från källan – Gå till Datalagret "ds_ecc" och välj tabell KNA1 och dra och släpp till dataflödestom skärm som nedan-
- Ange objekt för Target- Välj Datalagret "DS_BODS_HANA" från arkivet och välj tabell KNA1.
- Dra och släpp till arbetsytan och välj "Gör Target "alternativ. Det kommer att finnas två tabeller för källa och mål. Här kommer vi att definiera tabellen som källa och mål.
- Frågetransformation – Detta är ett verktyg som används för att hämta data baserat på inmatningsschema för användarspecifikt tillstånd och för att transportera data från källa till mål.
- Välj Query Transform-ikonen från verktygspaletten och dra och släpp den mellan käll- och målobjektet i arbetsytan enligt nedan –
- Länka frågeobjekt till källa.
- Länka frågeobjekt till Target tabell.
- Double Klicka på frågeikonen. Genom detta mappar vi en kolumn från ingångsschema till utmatningsschema.
När vi klickar på Fråga-ikonen visas ett nästa fönster för kartläggning, där vi gör följande steg -
- Källtabell KNA1 är vald.
- Välj all kolumn från källtabellen och högerklicka och välj en karta att mata ut.
- Target Utdata vald som fråga och kolumn kommer att mappas.
5. Spara och validera projektet.
1. Klicka på validera ikonen.
2. Ett popup-fönster för framgång med valideringen visas.
Steg 11) Kör jobb – För att utföra jobbet, följ vägen nedan-
- Välj Project Area-ikonen för att öppna Project, och välj skapat Project.
- Välj Job och högerklicka.
- Välj alternativet Execute för att köra jobb.
- Efter att ha utfört jobb visas ett jobbloggfönster, där alla meddelanden om jobb kommer att visas.
- Det sista meddelandet kommer att vara Job < > är slutfört.
Steg 12) – Validera/checka in data SAP HANA Databas.
- Logga in till SAP HANA databas genom SAP HANA Studio, och välj HANAUSER-schema.
- Välj KNA1-tabell i Tabellnoden.
- Högerklicka på tabell KNA1 och välj Öppna dataförhandsgranskning.
- Tabell (KNA1) Data som laddas av BODS-processer enligt ovan kommer att visas på dataförhandsgranskningsskärmen.