SAP HANA ArchiTektur, Landschaft, Dimensionierung: Vollständiges Tutorial
SAP Die HANA-Datenbank ist eine hauptspeicherzentrierte Datenverwaltungsplattform. SAP Die HANA-Datenbank läuft auf SUSE Linux Enterprises Server und baut auf C++ Sprache.
SAP Die HANA-Datenbank kann auf mehrere Maschinen verteilt werden.
SAP Die Vorteile von HANA sind wie folgt:
- SAP HANA ist nützlich, da es sehr schnell ist, da alle Daten in den Arbeitsspeicher geladen werden und keine Daten von der Festplatte geladen werden müssen.
- SAP HANA kann für OLAP- (Online-Analyse) und OLTP-Zwecke (Online-Transaktionen) auf einer einzigen Datenbank verwendet werden.
SAP HANA-Datenbank besteht aus einer Reihe von In-Memory-Verarbeitungs-Engines. Die Berechnungs-Engine ist die wichtigste In-Memory-Verarbeitungs-Engine in SAP HANA. Es funktioniert mit anderen Verarbeitungs-Engines wie der relationalen Datenbank-Engine (Zeilen- und Spalten-Engine), der OLAP-Engine usw.
Die relationale Datenbanktabelle befindet sich im Spalten- oder Zeilenspeicher.
Es gibt zwei Speichertypen für SAP HANA-Tabelle.
- Speicherung vom Zeilentyp (für Zeilentabelle).
- Spaltenspeicher (für Spaltentabelle).
Textdaten und Graphdaten befinden sich in der Text Engine bzw. Graph Engine. Es gibt noch einige weitere Engines in SAP HANA-Datenbank. Die Daten dürfen in diesen Engines gespeichert werden, solange genügend Speicherplatz verfügbar ist.
SAP HANA Architektur
Die Daten werden durch verschiedene Kompressionsverfahren (z. B. Wörterbuchkodierung, Lauflängenkodierung, Sparse-Kodierung, Cluster-Kodierung, indirekte Kodierung) komprimiert in SAP HANA-Spaltenspeicher.
Wenn das Hauptspeicherlimit erreicht ist in SAP HANA, alle nicht verwendeten Datenbankobjekte (Tabelle, Ansicht usw.) werden aus dem Hauptspeicher entladen und auf der Festplatte gespeichert.
Diese Objektnamen werden durch die Anwendungssemantik definiert und bei erneutem Bedarf von der Festplatte in den Hauptspeicher geladen. Unter normalen Umständen SAP Die HANA-Datenbank verwaltet das Entladen und Laden von Daten automatisch.
Der Benutzer kann jedoch Daten aus einzelnen Tabellen manuell laden und entladen, indem er eine Tabelle in auswählt SAP HANA-Studio im jeweiligen Schema, indem Sie mit der rechten Maustaste klicken und die Option „Entladen/Laden“ auswählen.
SAP HANA Server besteht aus
- SAP HANA-Indexserver SAP Der Hauptserver der HANA-Datenbank ist ein Indexserver. Einzelheiten zu jedem Server sind wie folgt:
- Es ist das Wichtigste SAP HANA-Datenbankkomponente
- Es enthält eigentliche Datenspeicher und die Engine zur Verarbeitung der Daten.
- Der Indexserver verarbeitet eingehende Daten SQL oder MDX-Anweisung.
Unten sehen Sie die Architektur des Indexservers.
SAP Übersicht über den HANA-Indexserver
- Präprozessorserver
Dieser Server wird in der Textanalyse verwendet und extrahiert Daten aus einem Text, wenn die Suchfunktion verwendet wird.
- Name Server
Dieser Server enthält alle Informationen über die Systemlandschaft. Bei verteilten Servern enthält der Nameserver Informationen zu jeder ausgeführten Komponente und zum Speicherort der Daten auf dem Server. Dieser Server enthält Informationen über den Server, auf dem Daten vorhanden sind.
- Statistikserver
Der Statistikserver ist verantwortlich für die Erfassung von Daten über Status, Ressourcenzuweisung/-verbrauch und Leistung von SAP HANA-System.
- XS-Server
XS Server enthält XS Engine. Es ermöglicht externen Anwendungen und Entwicklern die Nutzung SAP HANA-Datenbank über den XS Engine-Client. Die externe Client-Anwendung kann HTTP verwenden, um Daten über die XS Engine an den HTTP-Server zu übertragen.
SAP HANA-Landschaft
„HANA“ bedeutet Hochleistungs-Analysegerät ist eine Kombination aus Hardware- und Softwareplattform.
- Aufgrund von Änderungen in der Computerarchitektur steht der leistungsstärkere Computer hinsichtlich CPU, RAM und Festplatte zur Verfügung.
- SAP HANA ist die Lösung für Leistungsengpässe, da alle Daten im Hauptspeicher gespeichert werden und keine Daten häufig vom Festplatten-E/A in den Hauptspeicher übertragen werden müssen.
Hier sind SAP HANA-Innovation im Bereich Hardware/Software.
Es gibt zwei Arten von relationalen Datenspeichern in SAP HANA: Row Store und Column Store.
Reihenspeicher
- Es ist dasselbe wie bei einer herkömmlichen Datenbank, z. B. (Oracle, SQL Server). Der einzige Unterschied besteht darin, dass alle Daten im Zeilenspeicherbereich im Speicher von SAP HANA, im Gegensatz zu einer herkömmlichen Datenbank, bei der die Daten auf der Festplatte gespeichert werden.
Column Store
- Column Store ist der Teil des SAP HANA-Datenbank und verwaltet Daten spaltenweise in SAP HANA-Speicher. Spaltentabellen werden im Column Store-Bereich gespeichert. Der Column Store bietet eine gute Leistung für Schreibvorgänge und optimiert gleichzeitig den Lesevorgang.
Leistung von Lese- und Schreibvorgängen mit den folgenden beiden Datenstrukturen optimiert.
Hauptspeicher
Der Hauptspeicher enthält den Hauptteil der Daten. Im Hauptspeicher geeignete Datenkomprimierungsmethode (Wörterbuchkodierung, Cluster (Kodierung, Sparse-Kodierung, Lauflängenkodierung usw.) wird zum Komprimieren von Daten angewendet, um Speicherplatz zu sparen und Suchvorgänge zu beschleunigen.
- Im Hauptspeicher sind Schreibvorgänge auf komprimierte Daten kostspielig, daher ändern Schreibvorgänge komprimierte Daten im Hauptspeicher nicht direkt. Stattdessen werden alle Änderungen in einen separaten Bereich im Spaltenspeicher geschrieben, der als „Delta Lagerung."
- Delta Der Speicher ist für Schreibvorgänge optimiert und verwendet normale Komprimierung. Schreibvorgänge sind auf dem Hauptspeicher nicht zulässig, auf dem Deltaspeicher jedoch schon. Lesevorgänge sind auf beiden Speichern zulässig.
Wir können Daten manuell mit der Option „In Speicher laden“ in den Hauptspeicher laden und Daten mit der Option „Aus Speicher entladen“ aus dem Hauptspeicher entladen, wie unten gezeigt.
Delta Lagerung
Delta Der Speicher wird für einen Schreibvorgang verwendet und verwendet eine grundlegende Komprimierung. Alle nicht festgeschriebenen Änderungen in Spaltentabellendaten werden im Delta-Speicher gespeichert.
Wenn wir diese Änderungen in den Hauptspeicher verschieben möchten, verwenden wir die „Delta-Merge-Operation“ von SAP HANA Studio wie unten –
- Der Zweck der Delta-Merge-Operation besteht darin, Änderungen, die im Delta-Speicher gesammelt werden, in den Hauptspeicher zu verschieben.
- Nach dem Auftritt Delta Zusammenführungsvorgang für die SAP-Spaltentabelle, der Inhalt des Hauptspeichers wird auf der Festplatte gespeichert und die Komprimierung neu berechnet.
Prozess des Verschiebens von Daten von Delta zum Hauptspeicher während der Deltazusammenführung
Es gibt einen Pufferspeicher (L1-Delta), was Zeilenspeicher ist. Also in SAP HANA, Spaltentabelle verhält sich aufgrund von L1-Delta wie Zeilenspeicher.
- Der Benutzer führt eine Aktualisierungs-/Einfügeabfrage für die Tabelle aus (Physical Operator sind SQL-Anweisungen.).
- Die Daten gehen zuerst zu L1. Wenn L1 Daten weiter verschiebt (L1 – nicht festgeschriebene Daten)
- Anschließend gehen die Daten in den spaltenorientierten L2-Delta-Puffer. (L2 – festgeschriebene Daten)
- Wenn der L2-Delta-Prozess abgeschlossen ist, werden die Daten in den Hauptspeicher übertragen.
Daher ist der Spaltenspeicher aufgrund von L1 sowohl schreiboptimiert als auch leseoptimiert.Delta bzw. Hauptspeicher. L1-Delta enthält alle nicht festgeschriebenen Daten. Festgeschriebene Daten werden über L2 in den Hauptspeicher verschoben.Delta. Vom Hauptspeicher gelangen die Daten zur Persistenzschicht (der hier angezeigte Pfeil ist ein physischer Operator, der eine SQL-Anweisung im Column Store sendet). Nach der Verarbeitung der SQL-Anweisung im Column Store gelangen die Daten zur Persistenzschicht.
Im Folgenden finden Sie beispielsweise eine zeilenbasierte Tabelle.
Tabellendaten werden im linearen Format auf der Festplatte gespeichert. Nachfolgend finden Sie das Format, in dem Daten für Zeilen- und Spaltentabellen auf der Festplatte gespeichert werden:
In SAP HANA-Speicher, diese Tabelle wird im Row Store auf der Festplatte im Format gespeichert –
Und in Column werden die Daten auf der Festplatte gespeichert als –
Daten werden spaltenweise im linearen Format auf der Festplatte gespeichert. Daten können mit der Komprimierungstechnik komprimiert werden.
Der Spaltenspeicher hat also den Vorteil, dass er Speicher spart.
SAP HANA-Dimensionierung
Sizing ist ein Begriff, der verwendet wird, um die Hardware-Anforderungen für SAP HANA-System, wie RAM, Festplatte und CPU usw.
Die wichtigste Dimensionierungskomponente ist der Arbeitsspeicher und die zweite wichtige Dimensionierungskomponente ist die CPU. Die dritte Hauptkomponente ist eine Festplatte, deren Größe jedoch vollständig vom Arbeitsspeicher und der CPU abhängt.
In SAP Eine der wichtigsten Aufgaben bei der HANA-Implementierung besteht darin, die richtige Servergröße entsprechend den Geschäftsanforderungen zu bestimmen.
SAP HANA DB unterscheidet sich in der Größe von normalen DBMS bezüglich -
- Hauptspeicherbedarf für SAP HANA ( Die Speichergröße wird durch Metadaten und Transaktionsdaten in SAP HANA)
- CPU-Anforderung für SAP HANA (die prognostizierte CPU ist eine Schätzung, nicht genau).
- Speicherplatzbedarf für SAP HANA (wird für die Datenpersistenz und zum Protokollieren von Daten berechnet)
Die CPU des Anwendungsservers und der Arbeitsspeicher des Anwendungsservers bleiben unverändert.
Zur Größenberechnung SAP hat verschiedene Richtlinien und Methoden zur Berechnung der richtigen Größe bereitgestellt.
Wir können die folgende Methode verwenden:
- Dimensionierung mit ABAP-Report.
- Dimensionierung mit DB-Skript.
- Größenbestimmung mit dem Quicksizer Tool.
Mit dem Quicksizer-Tool werden die Anforderungen im folgenden Format angezeigt: