SAP DS (Datendienste) in HANA
Was ist SAP Datendienste?
SAP Data Services ist ein ETL-Tool, das eine einheitliche Lösung auf Unternehmensebene für Datenintegration, Transformation, Datenqualität, Datenprofilierung und Textdatenverarbeitung aus einer heterogenen Quelle in eine Zieldatenbank oder ein Data Warehouse bietet.
Wir können Anwendungen (Jobs) erstellen, in denen Datenmapping und -transformation mithilfe des Designers durchgeführt werden können. (Neueste Version von SAP Der BODS-Wert liegt bei 4.2).
Merkmale von Datendiensten
- Es bietet leistungsstarke parallele Transformationen.
- Es verfügt über umfassende Verwaltungstools und ein Berichtstool.
- Es unterstützt Mehrbenutzer.
- SAP KÖRPER ist sehr flexibel mit Web-Service-basierten Anwendungen.
- Es ermöglicht eine Skriptsprache mit umfangreichen Funktionen.
- Data Services können integriert werden mit SAP LT Replication Server (SLT) mit der Trigger-basierten Technologie. SLT fügt jedem SAP oder nichtSAP Quelltabelle, die die Verwendung der Datenerfassung zum Ändern und Übertragen der Deltadaten der Quelltabelle ermöglicht.
- Datenvalidierung mit Dashboards und Prozessaudits.
- Verwaltungstool mit Planungsfunktionen und Überwachung/Dashboards.
- Debuggen und integriertes Profiling und Anzeigen von Daten.
- SAP BODS unterstützen breite Quellen und Ziele.
- Alle Anwendungen (zB SAP).
- Alle Datenbanken mit Massenlade- und Änderungsdatenerfassung
- Dateien: feste Breite, durch Kommas getrennt, COBOL, XML, Excel.
Bestandteil von Data Services
SAP DATA-Dienste haben die folgenden Komponenten –
- Designer - Es handelt sich um ein Entwicklungstool, mit dem wir einen Job erstellen, testen und ausführen können, der ein Data Warehouse füllt. Es ermöglicht dem Entwickler, Objekte zu erstellen und diese zu konfigurieren, indem er ein Symbol in einem Quelle-zu-Ziel-Flussdiagramm auswählt. Das ist möglich Wird zum Erstellen einer Anwendung durch Festlegen von Arbeitsabläufen und Datenflüssen verwendet. Um den Data Service Designer zu öffnen, gehen Sie zu Startmenü -> Alle Programme -> SAP Datendienste (hier 4.2) -> Datendienst-Designer.
- Jobserver- Dabei handelt es sich um eine Anwendung, die die Datenservice-Verarbeitungs-Engine startet und als Schnittstelle zur Engine und zur Data Services Suite dient.
- Motor- Die Data Service Engine führt einzelne Jobs aus, die in der Anwendung definiert sind.
- Repository- Repository ist eine Datenbank, die vom Designer vordefinierte Objekte und benutzerdefinierte Objekte (Quell- und Zielmetadaten, Transformationsregeln) speichert. Es gibt zwei Arten von Repositorys:
- Lokales Repository (Wird von Designer und Jobserver verwendet).
- Zentrales Repository (Wird zur Objektfreigabe und Versionskontrolle verwendet)
- Zugriffsserver- Der Zugriffsserver leitet Nachrichten zwischen Webanwendungen, Datendienst-Jobservern und Engines weiter.
- Administrator- Web Administrator bietet eine browserbasierte Verwaltung von Datendienstressourcen. Die Einzelheiten sind wie folgt:
- Konfigurieren, Starten und Stoppen von Echtzeitdiensten.
- Planen, Überwachen und Ausführen von Batch-Jobs.
- Konfigurieren der Jobserver-, Zugriffsserver- und Repository-Nutzung.
- Benutzer verwalten.
- Veröffentlichen von Batch-Jobs und Echtzeitdiensten über Webdienste
- Konfigurieren und Verwalten von Adaptern.
Datendienste Architektur –
Die Data Services-Architektur verfügt über die folgenden Komponenten:
- Zentrales Repository – wird für Repository-Konfigurationen auf Jobservern, Sicherheitsmanagement, Versionskontrolle und Objektfreigabe verwendet
- Designer – Wird zum Erstellen von Projekten, Jobs, Workflows, Datenflüssen und Ausführungen verwendet.
- Lokales Repository (hier können Sie Änderungs- und Startjobs, Workflows und Datenflüsse erstellen).
- Jobserver und Engine – verwaltet die Jobs.
- Zugriffsserver – Er wird verwendet, um die von Entwicklern in den Repositorys erstellten Echtzeitjobs auszuführen.
Im Bild unten wird die Beziehung zwischen Datendiensten und deren Komponenten dargestellt.
SAP KÖRPER Architektur
Detail des Designerfensters: Zuerst betrachten wir die erste Komponente von SAP Datendienst-Designer
Einzelheiten zu jedem Abschnitt des Datendienst-Designers sind wie folgt:
- Symbolleiste (Wird zum Öffnen, Speichern, Zurücksetzen, Validieren, Ausführen usw. verwendet).
- Projektbereich (Enthält das aktuelle Projekt, das Job, Workflow und Datenfluss umfasst. In Data Services sind alle Entitäten Objekte.
- Arbeitsplatz (Der Anwendungsfensterbereich, in dem wir Objekte definieren, anzeigen und ändern).
- Lokale Objektbibliothek (Es enthält lokale Repository-Objekte wie Transformationen, Jobs, Workflows, Datenflüsse usw.).
- Werkzeugpalette (Mit den Schaltflächen in der Werkzeugpalette können Sie dem Arbeitsbereich neue Objekte hinzufügen.)
Objekthierarchie
Das folgende Diagramm zeigt hierarchische Beziehungen für die wichtigsten Objekttypen innerhalb von Data Services.
>
Hinweis:
Workflows und Bedingung* sind optional
Objekte, die in SAP Einzelheiten zu den Datendiensten sind wie folgt:
Objekte | Beschreibung |
---|---|
PROJEKT | Ein Projekt ist ein Objekt der höchsten Ebene im Designer-Fenster. Projekte bieten Ihnen eine Möglichkeit, die anderen Objekte zu organisieren, die Sie in Data Services erstellen. Es ist jeweils nur ein Projekt geöffnet (wobei „offen“ „im Projektbereich sichtbar“ bedeutet). |
Job | Ein „Job“ ist die kleinste Arbeitseinheit, die Sie unabhängig zur Ausführung einplanen können. |
Scripts | Eine Teilmenge von Zeilen in einer Prozedur. |
Arbeitsablauf | Ein „Workflow“ ist die Integration mehrerer Datenflüsse in einen kohärenten Arbeitsfluss für einen gesamten Auftrag. Der Workflow ist optional. Workflow ist ein Vorgang.
|
Datenfluss | Ein „Datenfluss“ ist der Prozess, durch den Quelldaten in Zieldaten umgewandelt werden. Ein Datenfluss ist ein wiederverwendbares Objekt. Der Aufruf erfolgt immer aus einem Workflow oder Job.
|
Datenspeicher | Logischer Kanal, der Data Services mit Quell- und Datastore-Zieldatenbanken verbindet.
|
Target | Tabelle oder Datei, in die Data Services Daten aus der Quelle lädt. |
Data Services-Beispiel durch Laden von Daten aus SAP Quelltabelle
Alles in Datendiensten ist ein Objekt. Wir müssen den Datenspeicher für jede Quell- und Zieldatenbank trennen.
Schritte zum Laden von Daten aus SAP Quelltabelle – SAP BODS umfassen viele Schritte, in denen wir einen Datenspeicher für Quelle und Ziel erstellen und diese zuordnen müssen.
- Erstellen Sie einen Datenspeicher zwischen Quelle und BODS
- Importieren Sie die Metadaten (Strukturen) in BODS.
- Konfigurieren Sie den Importserver
- Importieren Sie die Metadaten in das HANA-System.
- Erstellen Sie einen Datenspeicher zwischen BODS und HANA.
- Projekt erstellen.
- Job erstellen (Batch/Echtzeit)
- Erstellen Sie einen Arbeitsablauf
- Datenfluss erstellen
- Objekt im Datenfluss hinzufügen
- Führen Sie den Job aus
- Überprüfen Sie die Datenvorschau in HANA
Schritt 1) Datenspeicher erstellen zwischen SAP Quelle und BODS
- So laden Sie Daten von SAP Quelle zu SAP HANA durch SAP BODS, wir brauchen einen Datenspeicher. Also erstellen wir zuerst einen Datenspeicher wie unten gezeigt – Projekt -> Neu – > Datenspeicher
- Es erscheint ein Popup-Fenster zum Erstellen eines neuen Datenspeichers. Geben Sie die Details wie folgt ein:
- Geben Sie den Datenspeichernamen „ds_ecc“ ein.
- Wählen Sie den Datenspeichertypnamen als „SAP Bewerbungen“.
- Geben Sie den Namen des Datenbankservers ein
- Benutzername und Passwort.
- Klicken Sie auf die Schaltfläche „Übernehmen“.
- Klicken Sie auf die Schaltfläche „OK“.
- Der Datenspeicher wird erstellt und der erstellte Datenspeicher wird wie folgt angezeigt:
- Gehen Sie zur lokalen Objektbibliothek
- Wählen Sie die Registerkarte „DataStore“.
- Der Datenspeicher „ds_ecc“ wird angezeigt.
Schritt 2) Importieren Sie Metadaten (Struktur) in den BODS-Server.
Wir haben einen Datenspeicher für ECC to BODS erstellt; Jetzt importieren wir Metadaten von ECC in BODS. Führen Sie zum Importieren die folgenden Schritte aus:
- Wählen Sie den Datenspeicher „ds_ecc“ und klicken Sie mit der rechten Maustaste.
- Wählen Sie die Option „Nach Namen importieren“.
Ein Popup für den Import nach Name wird angezeigt. Geben Sie die Details wie folgt ein –
- Wählen Sie „Typ als Tabelle“ aus.
- Geben Sie den Namen der Tabelle ein, die wir importieren möchten. Hier importieren wir die KNA1-Tabelle.
- Klicken Sie auf die Schaltfläche „Importieren“. Die Tabelle KNA1 wird unter dem Tabellenknoten der Datenquelle „ds_ecc“ angezeigt.
Tabellenmetadaten werden wie folgt in den Datenspeicher ds_ecc importiert:
Schritt 3) Konfigurieren Sie den Importserver
Bisher haben wir die Tabelle in den Datenspeicher „ds_ecc“ importiert, der für ECC erstellt wurde, um SAP BODS-Verbindung. Zum Importieren von Daten in SAP HANA, wir müssen den Importserver konfigurieren,
- Um dies zu tun unterwegs Schnellansicht -> Importserver konfigurieren wie nachstehend -
- Ein Popup für Select System wird angezeigt, wählen Sie SAP HANA (hier HDB) System wie unten-
- Klicken Sie auf die Schaltfläche „Weiter“. Ein weiteres Popup für die Datendienstanmeldeinformationen wird angezeigt. Geben Sie die folgenden Details ein
- SAP BODS-Serveradresse (hier BODS:6400)
- Enter SAP BODS-Repository-Name (HANAUSER-Repository-Name)
- Geben Sie die ODBC-Datenquelle (ZTDS_DS) ein.
- Geben Sie den Standardport ein für SAP BODS-Server (8080).
Klicken Sie auf die Schaltfläche „Fertig stellen“.
Schritt 4) Importieren Sie die Metadaten in das HANA-System
1. Bis jetzt haben wir den Importserver konfiguriert, jetzt importieren wir Metadaten von SAP BODS-Server.
- Klicken Sie in der Schnellansicht auf die Option „Importieren“.
- Ein Popup mit der Importoption wird angezeigt. Wählen Sie die Option „Selektiver Import von Metadaten“.
Klicken Sie auf die Schaltfläche „Weiter“.
2. Ein Popup zum „Selektiven Importieren von Metadaten“ wird angezeigt, in dem wir das Zielsystem auswählen.
- Select SAP HANA-System (hier HDB).
Klicken Sie auf die Schaltfläche „Weiter“.
Schritt 5) Erstellen Sie einen Datenspeicher zwischen BODS und HANA
Wie wir wissen, müssen wir in BODS einen separaten Datenspeicher für Quelle und Ziel erstellen. Wir haben bereits einen Datenspeicher für die Quelle erstellt, jetzt müssen wir einen Datenspeicher für das Ziel (zwischen BODS und HANA) erstellen. Also erstellen wir einen neuen Datenspeicher mit dem Namen „DS_BODS_HANA“.
- Gehen Sie zu Projekt -> Neu -> Datenspeicher.
- Ein Bildschirm zum Erstellen eines neuen Datenspeichers wird wie folgt angezeigt.
- Geben Sie den Datenspeichernamen (DS_BODS_HANA) ein.
- Geben Sie als Datenspeichertyp „Datenbank“ ein.
- Geben Sie den Datenbanktyp ein als SAP HANA.
- Wählen Sie Datenbankversion aus.
- Enter SAP Name des HANA-Datenbankservers.
- Geben Sie den Portnamen ein für SAP HANA-Datenbank.
- Geben Sie Benutzernamen und Passwort ein.
- Setzen Sie ein Häkchen bei „Automatische Datenübertragung aktivieren“.
Klicken Sie auf „Übernehmen“ und dann auf die Schaltfläche „OK“.
Der Datenspeicher „DS_BODS_HANA“ wird unter der Registerkarte „Datenspeicher“ der lokalen Objektbibliothek als angezeigt
Unter-
- Jetzt importieren wir die Tabelle im Datenspeicher „DS_BODS_HANA“.
- Wählen Sie den Datenspeicher „DS_BODS_HANA“ und klicken Sie mit der rechten Maustaste.
- Wählen Sie „Nach Namen importieren“ aus.
- Ein Popup-Fenster zum Importieren nach Namen wird wie folgt angezeigt:
- Wählen Sie „Typ als Tabelle“ aus.
- Geben Sie als Namen KNA1 ein.
- Als Besitzer wird Hanauser angezeigt.
- Klicken Sie auf die Schaltfläche „Importieren“.
Die Tabelle wird in den Datenspeicher „DS_BOD_HANA“ importiert. Um Daten in der Tabelle anzuzeigen, führen Sie die folgenden Schritte aus:
- Klicken Sie im Datenspeicher „DS_BODS_HANA“ auf die Tabelle „KNA1“.
- Die Daten werden im Tabellenformat angezeigt.
Schritt 6) Projekt definieren: Projektgruppe und Organisation verwandte Objekte. Das Projekt kann eine beliebige Anzahl von Jobs, Workflows und Datenflüssen enthalten.
- Gehen Sie zum Menü „Designer-Projekt“.
- Wählen Sie eine neue Option.
- Wählen Sie die Option „Projekt“.
Ein POP-UP für die Erstellung eines neuen Projekts wird wie folgt angezeigt. Geben Sie den Projektnamen ein und klicken Sie auf die Schaltfläche „Erstellen“. Es wird ein Projektordner erstellt, in unserem Fall BODS_DHK.
Schritt 7) Job definieren: Ein Job ist ein wiederverwendbares Objekt. Es enthält Workflows und Datenflüsse. Jobs können manuell oder als Zeitplan ausgeführt werden. Um den BODS-Prozess auszuführen, müssen wir den Job definieren.
Wir erstellen einen Job als JOB_Customer.
- Wählen Sie das in Schritt 1 erstellte Projekt (BODS_DHK) aus, klicken Sie mit der rechten Maustaste und wählen Sie „Neuer Batch-Job“.
- Benennen Sie es in „JOB_Customer“ um.
Schritt 8) Workflow definieren:
- Wählen Sie im Projektbereich den Job „JOB_Customer“ aus.
- Klicken Sie in der Werkzeugpalette auf die Schaltfläche „Workflow“. Klicken Sie auf den Bereich „Schwarzer Arbeitsbereich“. Im Arbeitsbereich wird ein Workflow-Symbol angezeigt.
- Ändern Sie den Namen des Workflows in „WF_Customer“.
Klicken Sie auf den Namen des Workflows. Im Arbeitsbereich wird eine leere Ansicht für den Workflow angezeigt.
Schritt 9) Datenfluss definieren:
- Klicken Sie auf Workflow „WF_Customer“.
- Klicken Sie in der Werkzeugpalette auf die Schaltfläche „Datenfluss“. Klicken Sie auf den Bereich „Schwarzer Arbeitsbereich“. Im Arbeitsbereich wird ein Dataflow-Symbol angezeigt.
- Ändern Sie den Namen des Datenflusses in „DF_Customer“.
- Der Datenfluss erscheint auch im Projektbereich links unter Jobname.
Schritt 10) Objekt im Datenfluss hinzufügen:
Innerhalb des Datenflusses können wir Anweisungen bereitstellen, um Quelldaten in die gewünschte Form für die Zieltabelle umzuwandeln.
Wir werden das folgende Objekt sehen –
- Ein Objekt für die Quelle.
- Ein Objekt für die Zieltabelle.
- Ein Objekt für die Abfragetransformation. (Die Abfragetransformation ordnet die Spalten von der Quelle dem Ziel zu.)Klicken Sie auf dem Datenfluss DF_Customer . Ein leerer Arbeitsbereich wird wie folgt angezeigt:
- Objekt aus Quelle angeben – Gehen Sie zum Datenspeicher „ds_ecc“, wählen Sie die Tabelle KNA1 aus und ziehen Sie sie per Drag & Drop auf den leeren Bildschirm des Datenflusses, wie unten dargestellt.
- Objekt angeben für Target- Wählen Sie den Datenspeicher „DS_BODS_HANA“ aus dem Repository und wählen Sie die Tabelle KNA1 aus.
- Ziehen Sie es per Drag & Drop in den Arbeitsbereich und wählen Sie „Make Target „Option. Es wird zwei Tabellen für Quelle und Ziel geben. Hier definieren wir die Tabelle als Quelle und Ziel.
- Abfragetransformation – Hierbei handelt es sich um ein Tool zum Abrufen von Daten basierend auf einem Eingabeschema für benutzerspezifische Bedingungen und zum Transport von Daten von der Quelle zum Ziel.
- Wählen Sie das Symbol „Abfragetransformation“ aus der Werkzeugpalette aus und ziehen Sie es per Drag-and-Drop zwischen Quell- und Zielobjekt im Arbeitsbereich, wie unten dargestellt:
- Abfrageobjekt mit Quelle verknüpfen.
- Verknüpfung des Abfrageobjekts mit Target Tabelle.
- Double Klicken Sie auf das Abfragesymbol. Auf diese Weise ordnen wir eine Spalte vom Eingabeschema dem Ausgabeschema zu.
Wenn wir auf das Abfragesymbol klicken, wird ein weiteres Fenster zur Zuordnung angezeigt, in dem wir die folgenden Schritte ausführen –
- Quelltabelle KNA1 ist ausgewählt.
- Wählen Sie alle Spalten aus der Quelltabelle aus, klicken Sie mit der rechten Maustaste und wählen Sie eine Karte zur Ausgabe aus.
- Target Ausgabe als Abfrage ausgewählt und Spalte wird zugeordnet.
5. Projekt speichern und validieren.
1. Klicken Sie auf das Validierungssymbol.
2. Ein Popup-Fenster mit der Meldung „Validierung erfolgreich“ wird angezeigt.
Schritt 11) Job ausführen – Um den Job auszuführen, folgen Sie dem folgenden Pfad:
- Wählen Sie das Symbol „Projektbereich“, um das Projekt zu öffnen, und wählen Sie das erstellte Projekt aus.
- Wählen Sie Job aus und klicken Sie mit der rechten Maustaste.
- Wählen Sie die Option „Ausführen“, um den Job auszuführen.
- Nach der Ausführung des Jobs wird ein Job-Protokollfenster angezeigt, in dem alle Nachrichten zum Job angezeigt werden.
- Die letzte Meldung lautet: Job < > wurde erfolgreich abgeschlossen.
Schritt 12) – Daten validieren / prüfen in SAP HANA-Datenbank.
- Einloggen um SAP HANA-Datenbank durch SAP HANA Studiound wählen Sie das HANAUSER-Schema aus.
- Wählen Sie im Tabellenknoten die Tabelle KNA1 aus.
- Klicken Sie mit der rechten Maustaste auf die Tabelle KNA1 und wählen Sie „Datenvorschau öffnen“.
- Tabelle (KNA1) Die von BODS-Prozessen wie oben geladenen Daten werden im Datenvorschaubildschirm angezeigt.