SAP DS (gegevensservices) in HANA
Wat is SAP Datadiensten?
SAP Data services is een ETL-tool die op ondernemingsniveau een oplossing biedt voor gegevensintegratie, transformatie, gegevenskwaliteit, gegevensprofilering en tekstgegevensverwerking van de heterogene bron naar een doeldatabase of datawarehouse.
We kunnen applicaties (job) maken waarin data mapping en transformatie kunnen worden gedaan met behulp van de Designer. (Laatste versie van SAP BODS is 4.2).
Kenmerken van dataservices
- Het biedt hoogwaardige parallelle transformaties.
- Het beschikt over uitgebreide administratieve hulpmiddelen en rapportagetools.
- Het ondersteunt meerdere gebruikers.
- SAP BODEN is zeer flexibel met webservicegebaseerde applicaties.
- Het maakt scripttaal mogelijk met een rijke reeks functies.
- Data Services kunnen worden geïntegreerd met SAP LT Replication Server (SLT), met de Trigger-based technologie. SLT voegt delta-mogelijkheden toe aan elke SAP of niet-SAP brontabel, waarmee gegevens kunnen worden vastgelegd voor wijziging en overdracht van de deltagegevens van de brontabel.
- Gegevensvalidatie met dashboards en procesauditing.
- Beheertool met planningsmogelijkheden en monitoring/dashboards.
- Foutopsporing en ingebouwde profilering en weergave van gegevens.
- SAP BODS-ondersteuning Brede bron en doel.
- Alle toepassingen (bijv SAP).
- Alle databases met bulklading en gegevensregistratie van wijzigingen
- Bestanden: vaste breedte, door komma's gescheiden, COBOL, XML, Excel.
Onderdeel van dataservices
SAP DATA-services hebben de volgende component:
- Ontwerper – Het is een ontwikkelingstool waarmee we een taak kunnen maken, testen en uitvoeren die een datawarehouse vult. Hiermee kan de ontwikkelaar objecten maken en configureren door een pictogram te selecteren in een bron-naar-doelstroomdiagram. gebruikt om een applicatie te maken door workflows en gegevensstromen op te geven. Ga naar om Data Service Designer te openen Startmenu -> Alle programma's -> SAP Data Services (4.2 hier) -> Data Service Designer.
- Taakserver- Het is een applicatie die de dataservicesverwerkingsengine start en dient als interface voor de engine en Data Services Suite.
- Motor- De Data Service-engine voert individuele taken uit die in de applicatie zijn gedefinieerd.
- Opslagplaats- Repository is een database waarin door de ontwerper vooraf gedefinieerde objecten en door de gebruiker gedefinieerde objecten (bron- en doelmetagegevens, transformatieregels) worden opgeslagen. Er zijn twee typen repository:
- Lokale opslagplaats (Gebruikt door Designer en Job Server).
- Centrale opslagplaats (Gebruikt voor het delen van objecten en versiebeheer)
- Toegangsserver- De toegangsserver geeft berichten door tussen webapplicaties, dataservices-jobserver en motoren.
- Beheerder- Webbeheerder biedt browsergebaseerd beheer van bronnen voor gegevensservices, de details zijn als volgt:
- Realtime services configureren, starten en stoppen.
- Het plannen, monitoren en uitvoeren van batchtaken.
- Het gebruik van Job Server, Access Server en Repository configureren.
- Gebruikers beheren.
- Batchtaken en realtime services publiceren via webservices
- Adapters configureren en beheren.
Gegevensdiensten Archistructuur –
De architectuur van Data Services bestaat uit de volgende componenten:
- Centrale repository – het wordt gebruikt voor repositoryconfiguraties voor taakservers, beveiligingsbeheer, versiebeheer en het delen van objecten
- Designer – Gebruikt voor Project maken, Taak, workflow, gegevensstroom en uitvoeren.
- Lokale opslagplaats (hier kunt u wijzigingen aanbrengen en taken starten, workflow, gegevensstroom).
- Taakserver en engine – Het beheert de taken.
- Toegangsserver – Het wordt gebruikt om de realtime taken uit te voeren die door ontwikkelaars in de repository’s zijn gemaakt.
In de onderstaande afbeelding worden Data Services en hun componentrelatie weergegeven.
SAP BODEN Architectuur
Designer raamdetail: Eerst kijken we naar het eerste onderdeel van SAP dataservice-ontwerper
Detail van elke sectie van de dataserviceontwerper is zoals hieronder:
- Werkbalk (Gebruikt voor Openen, Opslaan, Terug, Valideren, Uitvoeren, enz.).
- Projectgebied (Bevat het huidige project, dat Job, Workflow en Dataflow omvat. In Data Services zijn alle entiteiten objecten.
- Werkruimte (Het gebied van het toepassingsvenster waarin we objecten definiëren, weergeven en wijzigen).
- Lokale objectbibliotheek (Het bevat lokale repositoryobjecten, zoals transformaties, taken, workflows, gegevensstromen, enz.).
- Gereedschapspalet (Met de knoppen op het toolpalet kunt u nieuwe objecten aan de werkruimte toevoegen).
Objecthiërarchie
Het onderstaande diagram toont de hiërarchische relaties voor de belangrijkste objecttypen binnen Data Services.
>
Opmerking:
Workflows en Voorwaardelijk* zijn optioneel
Voorwerpen gebruikt in SAP De details van de gegevensservices zijn zoals hieronder:
Objecten | Beschrijving |
---|---|
Project | Een project is een object op het hoogste niveau in het Designer-venster. Projecten bieden u een manier om de andere objecten die u maakt in Data Services te organiseren. Er is slechts één project tegelijk geopend (waarbij “open” betekent “zichtbaar in het projectgebied”). |
Job | Een ‘klus’ is de kleinste werkeenheid die u zelfstandig kunt inplannen voor uitvoering. |
Scripts | Een subset van regels in een procedure. |
Workflow | Een ‘werkstroom’ is de integratie van verschillende gegevensstromen in een samenhangende werkstroom voor een hele taak. Werkstroom is optioneel. Workflow is een procedure.
|
Informatiestroom | Een ‘gegevensstroom’ is het proces waarbij brongegevens worden omgezet in doelgegevens. Een datastroom is een herbruikbaar object. Het wordt altijd aangeroepen vanuit een werkstroom of een taak.
|
DataStore | Logisch kanaal dat Data Services verbindt met bron- en Datastore-doeldatabases.
|
Target | Tabel of bestand waarin Data Services gegevens uit de bron laadt. |
Data Services voorbeeld door gegevens te laden van SAP Brontabel
Alles in Dataservices is een object. We moeten de gegevensopslag scheiden voor elke bron- en doeldatabase.
Stappen voor het laden van gegevens uit SAP brontabel – SAP BODS bestaan uit veel stappen, waarbij we een gegevensopslag voor bron en doel moeten creëren en deze aan hen moeten toewijzen.
- Maak een gegevensopslag tussen bron en BODS
- Importeer de metadata (structuren) naar BODS.
- Configureer importserver
- Importeer de metagegevens naar het HANA-systeem.
- Maak een gegevensopslag tussen BODS en HANA.
- Project maken.
- Taak maken (batch/realtime)
- Creëer een werkstroom
- Creëer een gegevensstroom
- Object toevoegen aan gegevensstroom
- Voer de taak uit
- Controleer de gegevenspreview in HANA
Stap 1) Maak een gegevensopslag tussen SAP Bron en BODS
- Gegevens laden van SAP Bron naar SAP HANA door SAP BODS, we hebben een gegevensopslag nodig. We maken dus eerst een gegevensarchief, zoals hieronder weergegeven – Project -> Nieuw – > Gegevensarchief
- Er verschijnt een pop-up voor Nieuwe gegevensopslag maken. Voer de details in zoals hieronder:
- Voer de naam van de gegevensopslag ‘ds_ecc’ in.
- Selecteer de naam van het gegevensopslagtype als “SAP toepassingen".
- Voer de naam van de databaseserver in
- Gebruikersnaam en wachtwoord.
- Klik op de knop "Toepassen".
- Klik op de knop “OK”.
- Data Store wordt aangemaakt en bekijk de aangemaakte datastore zoals hieronder:
- Ga naar Lokale objectbibliotheek
- Selecteer het tabblad Gegevensopslag.
- Gegevensopslag “ds_ecc” wordt weergegeven.
Stap 2) Importeer metadata (structuur) naar BODS-server.
We hebben een dataopslag gemaakt voor ECC naar BODS; nu importeren we metadata van ECC in BODS. Om te importeren volgt u de onderstaande stappen:
- Selecteer Datastore “ds_ecc” en klik met de rechtermuisknop.
- Selecteer de optie Importeren op naam.
Er wordt een pop-up voor Importeren op naam weergegeven. Voer de details in zoals hieronder:
- Selecteer Type als tabel.
- Voer de naam van de tabel in die we willen importeren. Hier importeren we de KNA1-tabel.
- Klik op de knop "Importeren". De KNA1-tabel verschijnt onder het tabelknooppunt van de gegevensbron "ds_ecc".
Tabelmetagegevens worden geïmporteerd in datastore ds_ecc, zoals hieronder:
Stap 3) Configureer importserver
Tot nu toe hebben we een tabel geïmporteerd in de gegevens die zijn opgeslagen “ds_ecc”, gemaakt voor ECC SAP BODS-verbinding. Om gegevens te importeren in SAP HANA, we moeten de importserver configureren,
- Ga hiervoor naar Snelle weergave -> Importserver configureren zoals hieronder -
- Er verschijnt een pop-up voor Select System, Select SAP HANA (HDB hier) Systeem zoals hieronder-
- Klik op de knop "Volgende". Er verschijnt een andere pop-up voor de gegevensservice-referentie, voer de volgende gegevens in
- SAP BODS-serveradres (hier BODS:6400 )
- Enter SAP BODS-repositorynaam (HANAUSER-repositorynaam)
- Voer de ODBC-gegevensbron (ZTDS_DS) in.
- Voer Standaardpoort in voor SAP BODS-server (8080).
Klik op de knop “Voltooien”.
Stap 4) Importeer de metagegevens naar het HANA-systeem
1. Tot nu toe hebben we de importserver geconfigureerd, nu zullen we metadata importeren SAP BODS-server.
- Klik op de optie Importeren in Snelle weergave.
- Er wordt een pop-up voor de Import-optie weergegeven. Selecteer de optie "Selectieve import van metagegevens".
Klik op de knop "Volgende".
2. Er wordt een pop-up voor “Selectieve import van metagegevens” weergegeven, waarin we het doelsysteem selecteren.
- kies SAP HANA-systeem (HDB hier).
Klik op de knop "Volgende".
Stap 5) Creëer een gegevensopslag tussen BODS en HANA
Zoals we weten, moeten we in BODS een aparte datastore creëren voor bron en doel. We hebben al een gegevensarchief voor de bron gemaakt, nu moeten we een gegevensarchief voor het doel maken (tussen BODS en HANA). We maken dus een nieuwe gegevensopslag met de naam "DS_BODS_HANA".
- Ga naar Project -> Nieuw -> Datastore.
- Er verschijnt een scherm voor Nieuwe Datastore aanmaken, zoals hieronder.
- Voer de naam van de gegevensopslag in (DS_BODS_HANA).
- Voer het type Datastore in als Database.
- Voer Databasetype in als SAP HANA.
- Selecteer Databaseversie.
- Enter SAP HANA-databaseservernaam.
- Voer de poortnaam in voor SAP HANA-database.
- Voer gebruikersnaam en wachtwoord in.
- Vink ‘Automatische gegevensoverdracht inschakelen’ aan.
Klik op "Toepassen" en vervolgens op de knop "OK".
Gegevensopslag "DS_BODS_HANA" wordt weergegeven onder het tabblad Gegevensopslag van de lokale objectbibliotheek als
Onderstaand-
- Nu importeren we de tabel in gegevensopslag “DS_BODS_HANA”.
- Selecteer gegevensopslag “DS_BODS_HANA” en klik met de rechtermuisknop.
- Selecteer Importeren op naam.
- Er verschijnt een pop-up voor Importeren op naam zoals hieronder:
- Selecteer Type als tabel.
- Voer Naam in als KNA1.
- Eigenaar wordt weergegeven als Hanauser.
- Klik op de knop Importeren.
De tabel wordt geïmporteerd in de datastore "DS_BOD_HANA". Om gegevens in de tabel te bekijken, volgt u de onderstaande stappen:
- Klik op tabel “KNA1” in dataopslag “DS_BODS_HANA”.
- Gegevens worden IN TABELFORMAAT weergegeven.
Stap 6) Project definiëren: Projectgroep en organisatie gerelateerde objecten. Het project kan een willekeurig aantal taken, workflows en gegevensstromen bevatten.
- Ga naar het Designer Project-menu.
- Selecteer nieuwe optie.
- Selecteer Projectoptie.
Er verschijnt een POP-UP voor het maken van nieuwe projecten, zoals hieronder. Voer de projectnaam in en klik op de knop Maken. Er wordt een projectmap aangemaakt in ons geval BODS_DHK.
Stap 7) Taak definiëren: Een Job is een herbruikbaar object. Het bevat workflows en gegevensstromen. Taken kunnen handmatig of volgens een schema worden uitgevoerd. Om het BODS-proces uit te voeren, moeten we de taak definiëren.
We creëren een vacature als JOB_Customer.
- Selecteer Project (BODS_DHK) gemaakt in stap 1, klik met de rechtermuisknop en selecteer “Nieuwe batchtaak”.
- Hernoem het naar “JOB_Customer”.
Stap 8) Definieer de workflow:
- Selecteer vacature “JOB_Customer” in het projectgebied,
- Klik op de workflowknop op het toolpalet. Klik op het gebied Zwarte werkruimte. Er verschijnt een workflowpictogram in de werkruimte.
- Wijzig de naam van de workflow in “WF_Customer”.
Klik op de naam van de workflow. Er verschijnt een lege weergave voor de workflow in de werkruimte.
Stap 9) Gegevensstroom definiëren:
- Klik op Werkstroom “WF_Customer”.
- Klik op de knop Dataflow op het toolpalet. Klik op het gebied Zwarte werkruimte. Er verschijnt een Dataflow-pictogram in de werkruimte.
- Wijzig de naam van de gegevensstroom in “DF_Customer”.
- De Dataflow verschijnt ook in het projectgebied aan de linkerkant onder de taaknaam.
Stap 10) Object toevoegen aan Dataflow:
Binnen de gegevensstroom kunnen we instructies geven om brongegevens om te zetten in de gewenste vorm voor de doeltabel.
We zullen hieronder het object zien -
- Een object voor de bron.
- Een object voor de doeltabel.
- Een object voor Query-transformatie. (Querytransformatie brengt de kolommen in kaart van bron naar doel.) Klik op de gegevensstroom DF_Customer . Er verschijnt een lege werkruimte zoals hieronder:
- Specificeer object uit bron – Ga naar gegevensopslag "ds_ecc" en selecteer tabel KNA1 en sleep en zet neer naar het lege scherm voor de gegevensstroom, zoals hieronder.
- Object opgeven voor Target- Selecteer Gegevensarchief “DS_BODS_HANA” uit de repository en selecteer tabel KNA1.
- Sleep naar de werkruimte en selecteer 'Make Target “optie. Er zullen twee tabellen zijn voor bron en doel. Hier zullen we de tabel definiëren als bron en doel.
- Query-transformatie – Dit is een hulpmiddel dat wordt gebruikt om gegevens op te halen op basis van een invoerschema voor gebruikersspecifieke omstandigheden en om gegevens van bron naar doel te transporteren.
- Selecteer het pictogram Querytransformatie in het gereedschapspalet en sleep het tussen bron- en doelobject in de werkruimte, zoals hieronder:
- Koppel Query-object aan Bron.
- Queryobject koppelen aan Target tafel.
- Double Klik op het querypictogram. Hiermee brengen we een kolom in kaart van invoerschema naar uitvoerschema.
Wanneer we op het Query-pictogram klikken, verschijnt er een volgend venster voor toewijzing, waarin we de volgende stappen uitvoeren:
- Brontabel KNA1 is geselecteerd.
- Selecteer alle kolommen uit de brontabel, klik met de rechtermuisknop en selecteer een kaart om uit te voeren.
- Target Uitvoer geselecteerd als Query en kolom worden toegewezen.
5. Project opslaan en valideren.
1. Klik op het valideerpictogram.
2. Er verschijnt een pop-up voor succesvolle validatie.
Stap 11) Taak uitvoeren – Om Job uit te voeren, volgt u het onderstaande pad:
- Selecteer het pictogram Projectgebied om Project te openen en selecteer het aangemaakte project.
- Selecteer Taak en klik met de rechtermuisknop.
- Selecteer de optie Uitvoeren om de taak uit te voeren.
- Nadat de taak is uitgevoerd, wordt een taaklogboekvenster weergegeven, waarin alle berichten met betrekking tot de taak worden weergegeven.
- Het laatste bericht is: Taak < > is succesvol voltooid.
Stap 12) – Valideer/check gegevens in SAP HANA-database.
- Log in op SAP HANA-database door SAP HANA Studioen selecteer HANAUSER-schema.
- Selecteer KNA1-tabel in Tabelknooppunt.
- Klik met de rechtermuisknop op tabel KNA1 en selecteer Open Data Preview.
- Tabel (KNA1) Gegevens die door BODS-processen zoals hierboven zijn geladen, worden weergegeven in het gegevensvoorbeeldscherm.