SAP DS (Data Services) i HANA
Hva er SAP Datatjenester?
SAP Datatjenester er et ETL-verktøy som gir en enkelt bedriftsnivåløsning for dataintegrasjon, transformasjon, datakvalitet, dataprofilering og tekstdatabehandling fra den heterogene kilden til en måldatabase eller datavarehus.
Vi kan lage applikasjoner (jobb) der datakartlegging og transformasjon kan gjøres ved å bruke Designeren. (Siste versjon av SAP BODS er 4.2).
Funksjoner ved datatjenester
- Det gir parallelle transformasjoner med høy ytelse.
- Den har omfattende administrative verktøy og rapporteringsverktøy.
- Den støtter flerbrukere.
- SAP BODS er svært fleksibel med web-tjenestebasert applikasjon.
- Det tillater skriptspråk med rike sett med funksjoner.
- Datatjenester kan integreres med SAP LT Replication Server (SLT) , med den triggerbaserte teknologien. SLT legger til delta-funksjoner til alle SAP eller ikke-SAP kildetabell, som gjør det mulig å bruke datafangst for endring og overføring av deltadataene til kildetabellen.
- Datavalidering med dashboard og prosessrevisjon.
- Administrasjonsverktøy med planleggingsmuligheter og overvåking/dashboard.
- Feilsøking og innebygd profilering og visning av data.
- SAP BODS-støtte Bred kilde og mål.
- Alle applikasjoner (f SAP).
- Eventuelle databaser med bulklasting og endringer i datafangst
- Filer: fast bredde, kommadelt, COBOL, XML, Excel.
Komponent av datatjenester
SAP DATA-tjenester har under komponent –
- Designere – Det er et utviklingsverktøy som vi kan lage, teste og utføre en jobb som fyller et datavarehus. Det lar utvikleren lage objekter og konfigurere dem ved å velge et ikon i et kilde-til-mål flytdiagram. brukes til å lage en applikasjon ved å spesifisere arbeidsflyter og dataflyter. For å åpne Data Service Designer gå til Startmeny -> Alle programmer -> SAP Datatjenester (4.2 her) -> Datatjenestedesigner.
- Jobbserver- Det er en applikasjon som starter datatjenestebehandlingsmotoren og fungerer som et grensesnitt til motoren og Data Services Suite.
- Motor- Data Service-motoren utfører individuelle jobber som er definert i applikasjonen.
- Depot- Repository er en database som lagrer designer forhåndsdefinerte objekter og brukerdefinerte objekter (kilde- og målmetadata, transformasjonsregler). Repository er av to typer –
- Lokalt depot (Brukes av Designer og Job Server).
- Sentrallager (Brukes for objektdeling og versjonskontroll)
- Access Server- Access server sender meldinger mellom webapplikasjoner, datatjenester jobbserver og motorer.
- Administrator- Web Administrator gir nettleserbasert administrasjon av datatjenester ressurser detaljer er som nedenfor -
- Konfigurere, starte og stoppe sanntidstjenester.
- Planlegging, overvåking og utførelse av batchjobber.
- Konfigurering av jobbserver, tilgangsserver og lagringsplassbruk.
- Administrere brukere.
- Publisering av batchjobber og sanntidstjenester via webtjenester
- Konfigurere og administrere adaptere.
Datatjenester Archilære –
Data Services-arkitekturen har følgende komponent-
- Central Repository – det brukes til repository-konfigurasjoner til jobbservere, sikkerhetsadministrasjon, versjonskontroll og objektdeling
- Designer – Brukes til å opprette prosjekt, jobb, arbeidsflyt, dataflyt og kjøring.
- Lokalt depot (her kan du opprette endrings- og startjobber, arbeidsflyt, dataflyt).
- Jobbserver og motor – Den administrerer jobbene.
- Access Server – Den brukes til å utføre sanntidsjobbene som er opprettet av utviklere i depotene.
På bildet nedenfor er datatjenester og komponentforholdet vist.
SAP BODS Architecture
Designer Window Detail: Først ser vi på den første komponenten av SAP datatjeneste- Designer
Detaljene for hver del av datatjenestedesigneren er som nedenfor-
- Verktøylinje (Brukes for Åpne, Lagre, Tilbake, Validere, Utfør osv.).
- Prosjektområde (Inneholder det gjeldende prosjektet, som inkluderer jobb, arbeidsflyt og dataflyt. I Datatjenester er alle enheter objekter.
- Arbeidsplass (Applikasjonsvinduområdet der vi definerer, viser og endrer objekter).
- Lokalt objektbibliotek (Den inneholder lokale depotobjekter, for eksempel transformasjoner, jobb, arbeidsflyt, dataflyt, etc.).
- Verktøypalett (Knapper på verktøypaletten lar deg legge til nye objekter i arbeidsområdet).
Objekthierarki
Diagrammet nedenfor viser hierarkiske relasjoner for nøkkelobjekttypene i Data Services.
>
OBS:
Arbeidsflyter og Betinget* er valgfrie
Gjenstander brukt i SAP Datatjenestedetaljer er som nedenfor –
Objekter | Tekniske beskrivelser |
---|---|
Prosjekt | Et prosjekt er et objekt på høyeste nivå i Designer-vinduet. Prosjekter gir deg en måte å organisere de andre objektene du oppretter i Data Services. Bare ett prosjekt er åpent om gangen (der "åpen" betyr "synlig i prosjektområdet"). |
Jobb | En "jobb" er den minste arbeidsenheten du kan planlegge uavhengig for utførelse. |
scripts | Et undersett av linjer i en prosedyre. |
Arbeidsflyt | En "arbeidsflyt" er inkorporering av flere datastrømmer i en sammenhengende arbeidsflyt for en hel jobb. Arbeidsflyt er valgfritt. Arbeidsflyt er en prosedyre.
|
Dataflyt | En "dataflyt" er prosessen der kildedata transformeres til måldata. En dataflyt er et gjenbrukbart objekt. Det kalles alltid fra en arbeidsflyt eller en jobb.
|
Datastore | Logisk kanal som kobler Data Services til kilde- og Datastore-måldatabaser.
|
Target | Tabell eller fil der datatjenester laster inn data fra kilden. |
Datatjenester eksempel ved å laste inn data fra SAP Kildetabell
Alt i Datatjenester er et objekt. Vi må skille datalager for hver kilde og måldatabase.
Trinn for å laste data fra SAP kildetabell – SAP BODS har mange trinn, der vi må lage et datalager for kilde og mål og kartlegge dem.
- Opprett datalager mellom kilde og BODS
- Importer metadataene (Strukturer) til BODS.
- Konfigurer importserver
- Importer metadataene til HANA-systemet.
- Opprett datalager mellom BODS og HANA.
- Opprett prosjekt.
- Opprett jobb (batch/sanntid)
- Lag arbeidsflyt
- Opprett dataflyt
- Legg til objekt i dataflyt
- Utfør jobben
- Sjekk dataforhåndsvisningen i HANA
Trinn 1) Opprett datalager mellom SAP Kilde og BODS
- For å laste data fra SAP Kilde til SAP HANA gjennom SAP BODS, vi trenger et datalager. Så vi oppretter først et datalager som vist nedenfor –Prosjekt -> Nytt –> Datalager
- En pop-up for Opprett nytt datalager vises, skriv inn detalj som nedenfor –
- Skriv inn datalagernavnet "ds_ecc".
- Velg datalagertypenavn som "SAP Applikasjoner".
- Skriv inn databaseservernavnet
- Brukernavn og passord.
- Klikk på "Bruk"-knappen.
- Klikk på "OK"-knappen.
- Datalageret vil bli opprettet og se det opprettede datalageret som nedenfor-
- Gå til Local Object Library
- Velg kategorien DataStore.
- Datalageret "ds_ecc" vil vises.
Trinn 2) Importer metadata (struktur) til BODS Server.
Vi har opprettet et datalager for ECC til BODS; nå importerer vi metadata fra ECC til BODS. For å importere følg trinnene nedenfor -
- Velg Datastore "ds_ecc" og høyreklikk.
- Velg alternativet Importer etter navn.
Et popup-vindu for Importer etter navn vil vises. Skriv inn detalj som nedenfor -
- Velg Type som en tabell.
- Skriv inn navnet på tabellen som vi vil importere. Her importerer vi KNA1-tabell.
- Klikk på "Importer"-knappen. KNA1-tabellen vil vises under tabellnoden til "ds_ecc"-datakilden.
Tabellmetadata vil bli importert, i datalageret ds_ecc som nedenfor –
Trinn 3) Konfigurer importserver
Til nå har vi importert tabell til data lagret "ds_ecc" opprettet for ECC til SAP BODS-tilkobling. For å importere data til SAP HANNA, vi må konfigurere importserveren,
- For å gjøre dette, gå til Hurtigvisning-> Konfigurer importserver som nedenfor -
- En pop-up for Velg system vil vises, Velg SAP HANA (HDB her) System som nedenfor-
- Klikk på "Neste"-knappen. En annen pop-up for påloggingsinformasjon for datatjenesten vises, skriv inn følgende detaljer
- SAP BODS serveradresse (her BODS:6400 )
- Enter SAP BODS Repository Name ( HANAUSER Repository Name )
- Skriv inn ODBC-datakilde (ZTDS_DS).
- Angi standard port for SAP BODS-server(8080).
Klikk på "Fullfør"-knappen.
Trinn 4) Importer metadataene til HANA System
1. Til nå har vi konfigurert importserver, nå vil vi importere metadata fra SAP BODS server.
- Klikk på Import-alternativet i Hurtigvisning.
- Et popup-vindu for import vil vises. Velg alternativet "Selektiv import av metadata".
Klikk på "Neste"-knappen.
2. En pop-up for "Selektiv import av metadata" vil vises, der vi velger målsystem.
- Velg SAP HANA System (HDB her).
Klikk på "Neste"-knappen.
Trinn 5) Opprett datalager mellom BODS og HANA
Som vi vet, i BODS må vi lage et eget datalager for kilde og mål. Vi har allerede opprettet et datalager for kilden, nå må vi lage et datalager for målet (mellom BODS og HANA). Så vi oppretter et nytt datalager med navnet "DS_BODS_HANA".
- Gå til Project -> New -> Datastore.
- Et skjermbilde for Opprett nytt datalager vil vises som nedenfor.
- Skriv inn datalagernavn (DS_BODS_HANA).
- Skriv inn Datalagertype som Database.
- Skriv inn Databasetype som SAP HANA.
- Velg databaseversjon.
- Enter SAP HANA-databaseservernavn.
- Skriv inn portnavn for SAP HANA-databasen.
- Skriv inn brukernavn og passord.
- Kryss av for "Aktiver automatisk dataoverføring".
Klikk på "Bruk" og deretter "OK"-knappen.
Datalageret "DS_BODS_HANA" vil bli vist under datalagerfanen i Local Object Library som
Under-
- Nå importerer vi tabell i datalageret "DS_BODS_HANA".
- Velg datalager "DS_BODS_HANA" og høyreklikk.
- Velg Importer etter navn.
- En popup for Importer etter navn vil vises som nedenfor-
- Velg Type som tabell.
- Skriv inn Navn som KNA1.
- Eier vil bli vist som Hanauser.
- Klikk på Import-knappen.
Tabell vil bli importert i "DS_BOD_HANA" datalager, for å se data i tabellen følg trinnene nedenfor -
- Klikk på tabellen "KNA1" i datalageret "DS_BODS_HANA".
- Data vil bli vist I TABULAR-format.
Trinn 6) Definer prosjekt: Prosjektgruppe og organisere relaterte objekter. Prosjektet kan inneholde et hvilket som helst antall jobber, arbeidsflyt og dataflyt.
- Gå til Designer Project-menyen.
- Velg nytt alternativ.
- Velg alternativet Prosjekt.
En POP-UP for opprettelse av nye prosjekter vises som nedenfor. Skriv inn prosjektnavn og klikk på Opprett-knappen. Det vil opprette en prosjektmappe i vårt tilfelle BODS_DHK.
Trinn 7) Definer jobb: En jobb er et gjenbrukbart objekt. Den inneholder arbeidsflyter og dataflyt. Jobber kan utføres manuelt eller som en tidsplan. For å utføre BODS-prosessen må vi definere jobben.
Vi oppretter en jobb som JOB_Kunde.
- Velg Prosjekt (BODS_DHK) opprettet i trinn 1, høyreklikk og velg "Ny batchjobb".
- Gi det nytt navn til "JOB_Kunde".
Trinn 8) Definer arbeidsflyt:
- Velg jobb "JOB_Kunde" i prosjektområdet,
- Klikk på arbeidsflytknappen på verktøypaletten. Klikk på området Black Workspace. Et arbeidsflytikon vil vises i arbeidsområdet.
- Endre navnet på arbeidsflyten som "WF_Customer".
Klikk på navnet på arbeidsflyten, en tom visning for arbeidsflyten vises i arbeidsområdet.
Trinn 9) Definer dataflyt:
- Klikk på arbeidsflyt "WF_Customer".
- Klikk på Dataflyt-knappen på verktøypaletten. Klikk på området Black Workspace. Et dataflytikon vil vises i arbeidsområdet.
- Endre navnet på dataflyten som "DF_Customer".
- Dataflyten vises også i prosjektområdet til venstre under jobbnavn.
Trinn 10) Legg til objekt i dataflyt:
Innenfor dataflyt kan vi gi instruksjoner for å transformere kildedata til ønsket form for måltabellen.
Vi vil se objektet nedenfor -
- Et objekt for kilden.
- Et objekt for måltabellen.
- Et objekt for Query-transformasjon. (Spørringstransformasjon kartlegger kolonnene fra kilde til mål.)Klikk på dataflyten DF_Customer . Et tomt arbeidsområde vil vises som nedenfor -
- Spesifiser objekt fra kilde – Gå til Datalager “ds_ecc” og velg tabell KNA1 og dra og slipp til dataflyt blank skjerm som under skjermen-
- Spesifiser objekt for Target- Velg Datalager "DS_BODS_HANA" fra depotet og velg tabell KNA1.
- Dra og slipp til arbeidsområdet og velg "Lag Target "alternativ. Det vil være to tabeller for kilde og mål. Her vil vi definere tabellen som kilde og mål.
- Spørringstransformasjon – Dette er et verktøy som brukes til å hente data basert på inndataskjema for brukerspesifikk tilstand og for transport av data fra kilde til mål.
- Velg Query Transform-ikonet fra verktøypaletten, og dra og slipp det mellom kilden og målobjektet i arbeidsområdet som nedenfor –
- Koble spørringsobjektet til kilden.
- Koble søkeobjekt til Target tabellen.
- Double Klikk på spørringsikonet. Ved dette kartlegger vi en kolonne fra inngangsskjema til utgangsskjema.
Når vi klikker på Query-ikonet, vises et neste vindu for kartlegging, der vi gjør følgende trinn -
- Kildetabell KNA1 er valgt.
- Velg alle kolonner fra kildetabellen og høyreklikk og velg et kart som skal skrives ut.
- Target Utdata valgt som spørring, og kolonne vil bli kartlagt.
5. Lagre og valider prosjektet.
1. Klikk på valider-ikonet.
2. Et popup-vindu for vellykket validering vises.
Trinn 11) Utfør jobb – For å utføre jobben, følg banen nedenfor-
- Velg Project Area-ikonet for å åpne Project, og velg opprettet Project.
- Velg Job og høyreklikk.
- Velg alternativet Utfør for å utføre jobb.
- Etter å ha utført jobb, vises et jobbloggvindu, der alle meldinger om jobb vises.
- Den siste meldingen vil være Job < > er fullført.
Trinn 12) – Valider/sjekk data inn SAP HANA-databasen.
- Logg inn for å SAP HANA database gjennom SAP HANA Studio, og velg HANAUSER-skjema.
- Velg KNA1-tabell i Tabellnoden.
- Høyreklikk på tabell KNA1 og velg Open Data Preview.
- Tabell (KNA1) Data lastet av BODS-prosesser som ovenfor vil bli vist i dataforhåndsvisningsskjermen.