Was ist Data Mart im Data Warehouse? Typen und Beispiele

Was ist DataMart?

A Datenmarkt konzentriert sich auf einen einzelnen Funktionsbereich einer Organisation und enthält eine Teilmenge der in einem Data Warehouse gespeicherten Daten. Ein Data Mart ist eine komprimierte Version des Data Warehouse und ist für die Verwendung durch eine bestimmte Abteilung, Einheit oder Gruppe von Benutzern in einer Organisation konzipiert. ZB Marketing, Vertrieb, HR oder Finanzen. Es wird oft von einer einzelnen Abteilung in einer Organisation kontrolliert.

Data Mart bezieht im Vergleich zu einem Data Warehouse normalerweise nur Daten aus wenigen Quellen. Data Marts sind klein und flexibler als ein Datawarehouse.

Warum brauchen wir Data Mart?

  • Data Mart trägt durch die Reduzierung des Datenvolumens dazu bei, die Reaktionszeit des Benutzers zu verbessern
  • Es bietet einfachen Zugriff auf häufig angeforderte Daten.
  • Data Marts sind im Vergleich zu Unternehmens-Datawarehouses einfacher zu implementieren. Gleichzeitig sind die Kosten für die Implementierung von Data Mart im Vergleich zur Implementierung eines vollständigen Data Warehouse sicherlich geringer.
  • Im Vergleich zum Data Warehouse ist ein Datamart agil. Im Falle einer Modelländerung kann der Datamart aufgrund seiner geringeren Größe schneller erstellt werden.
  • Ein Datamart wird von einem einzelnen Fachexperten definiert. Im Gegenteil, Data Warehouse wird von interdisziplinären KMU aus verschiedenen Bereichen definiert. Daher ist Data Mart im Vergleich zu Datawarehouse offener für Veränderungen.
  • Die Daten sind partitioniert und ermöglichen sehr detaillierte Zugriffskontrollrechte.
  • Daten können segmentiert und auf verschiedenen Hardware-/Softwareplattformen gespeichert werden.

Arten von Data Mart

Es gibt drei Haupttypen von Data Mart:

  1. Abhängig: Abhängige Data Marts werden erstellt, indem Daten direkt aus operativen, externen oder beiden Quellen bezogen werden.
  2. Unabhängig: Es wird ein unabhängiger Data Mart erstellt, ohne dass ein zentrales Data Warehouse verwendet werden muss.
  3. Hybrid: Diese Art von Data Marts kann Daten aus Data Warehouses oder operativen Systemen übernehmen.

Abhängiger Data Mart

Ein abhängiger Data Mart ermöglicht die Beschaffung von Unternehmensdaten aus einem einzigen Data Warehouse. Es handelt sich um eines der Data-Mart-Beispiele, das den Vorteil der Zentralisierung bietet. Wenn Sie einen oder mehrere physische Data Marts entwickeln müssen, müssen Sie diese als abhängige Data Marts konfigurieren.

Abhängige Data Marts im Data Warehouse können auf zwei verschiedene Arten erstellt werden. Entweder dort, wo ein Benutzer je nach Bedarf sowohl auf den Data Mart als auch auf das Data Warehouse zugreifen kann, oder wo der Zugriff nur auf den Data Mart beschränkt ist. Der zweite Ansatz ist nicht optimal, da er manchmal als Datenschrottplatz bezeichnet wird. Auf dem Datenschrottplatz stammen alle Daten aus einer gemeinsamen Quelle, werden jedoch verschrottet und größtenteils im Müll landen.

Abhängiger Data Mart
Abhängiger Data Mart

Unabhängiger Data Mart

Es entsteht ein unabhängiger Data Mart ohne den Einsatz eines zentralen Data Warehouse. Diese Art von Data Mart ist eine ideale Option für kleinere Gruppen innerhalb einer Organisation.

Ein unabhängiger Data Mart hat weder eine Beziehung zum Enterprise Data Warehouse noch zu einem anderen Data Mart. Beim Independent Data Mart werden die Daten separat eingegeben und ihre Analysen ebenfalls autonom durchgeführt.

Die Implementierung unabhängiger Data Marts steht im Widerspruch zur Motivation für den Aufbau eines Data Warehouse. Zunächst benötigen Sie einen konsistenten, zentralen Speicher für Unternehmensdaten, der von mehreren Benutzern mit unterschiedlichen Interessen analysiert werden kann, die sehr unterschiedliche Informationen wünschen.

Unabhängiger Data Mart

Unabhängiger Data Mart

Hybrider Datenmarkt

Ein Hybrid-Data-Mart kombiniert Eingaben aus anderen Quellen als dem Data Warehouse. Dies kann hilfreich sein, wenn Sie eine Ad-hoc-Integration wünschen, beispielsweise nachdem eine neue Gruppe oder ein neues Produkt zur Organisation hinzugefügt wurde.

Es ist das beste Data-Mart-Beispiel, das für mehrere Datenbankumgebungen geeignet ist und eine schnelle Implementierung für jedes Unternehmen ermöglicht. Außerdem ist der Datenbereinigungsaufwand am geringsten. Hybrid Data Mart unterstützt auch große Speicherstrukturen und eignet sich am besten für flexible kleinere datenzentrierte Anwendungen.

Hybrider Datenmarkt

Hybrider Datenmarkt

Schritte zur Implementierung eines Datamarts

Schritte zur Implementierung eines Datamarts

Die Implementierung eines Data Mart ist ein lohnendes, aber komplexes Verfahren. Hier sind die detaillierten Schritte zur Implementierung eines Data Mart:

Entwerfen

Das Entwerfen ist die erste Phase der Data-Mart-Implementierung. Es umfasst alle Aufgaben von der Initiierung der Anfrage für einen Data Mart bis zum Sammeln von Informationen über die Anforderungen. Abschließend erstellen wir das logische und physische Data-Mart-Design.

Der Entwurfsschritt umfasst die folgenden Aufgaben:

  • Erfassen der geschäftlichen und technischen Anforderungen und Identifizieren von Datenquellen.
  • Auswahl der geeigneten Datenteilmenge.
  • Entwerfen der logischen und physischen Struktur des Data Mart.

Daten können anhand der folgenden Kriterien partitioniert werden:

  • Datum
  • Geschäfts- oder Funktionseinheit
  • Geografie
  • Jede Kombination der oben genannten

Daten können auf Anwendungs- oder DBMS-Ebene partitioniert werden. Es wird jedoch empfohlen, die Partitionierung auf Anwendungsebene durchzuführen, da dadurch jedes Jahr unterschiedliche Datenmodelle mit der Änderung der Geschäftsumgebung möglich sind.

Welche Produkte und Technologien benötigen Sie?

Ein einfacher Stift und Papier würden ausreichen. Obwohl Tools, die Ihnen beim Erstellen von UML oder helfen ER-Diagramm würde auch Metadaten in Ihre logischen und physischen Designs einbinden.

Konstruieren

Dies ist die zweite Phase der Umsetzung. Es geht um die Erstellung der physische Datenbank und die logischen Strukturen.

Dieser Schritt umfasst die folgenden Aufgaben:

  • Implementierung der in der früheren Phase entworfenen physischen Datenbank. Beispielsweise werden Datenbankschemaobjekte wie Tabellen, Indizes, Ansichten usw. erstellt.

Welche Produkte und Technologien benötigen Sie?

Du brauchst ein Relationales Datenbank Management System einen Data Mart aufbauen. RDBMS verfügen über mehrere Funktionen, die für den Erfolg eines Data Mart erforderlich sind.

  • Speicherverwaltung: Ein RDBMS speichert und verwaltet die Daten zum Erstellen, Hinzufügen und Löschen von Daten.
  • Schneller Datenzugriff: Mit einer SQL-Abfrage können Sie basierend auf bestimmten Bedingungen/Filtern einfach auf Daten zugreifen.
  • Datenschutz: Das RDBMS-System bietet auch eine Möglichkeit zur Wiederherstellung nach Systemausfällen wie Stromausfällen. Es ermöglicht auch die Wiederherstellung von Daten aus diesen Sicherungen, falls die Festplatte ausfällt.
  • Mehrbenutzerunterstützung: Das Datenverwaltungssystem bietet gleichzeitigen Zugriff, die Möglichkeit für mehrere Benutzer, auf Daten zuzugreifen und diese zu ändern, ohne die von einem anderen Benutzer vorgenommenen Änderungen zu beeinträchtigen oder zu überschreiben.
  • Sicherheit: Das RDMS-System bietet außerdem eine Möglichkeit, den Zugriff von Benutzern auf Objekte und bestimmte Arten von Vorgängen zu regeln.

Bevölkerungszahl

In der dritten Phase werden die Daten im Data Mart befüllt.

Der Auffüllungsschritt umfasst die folgenden Aufgaben:

  • Zuordnung von Quelldaten zu Zieldaten
  • Extraktion von Quelldaten
  • Bereinigungs- und Transformationsvorgänge an den Daten
  • Laden von Daten in den Data Mart
  • Metadaten erstellen und speichern

Welche Produkte und Technologien benötigen Sie?

Sie erledigen diese Bevölkerungsaufgaben mit einem ETL-Tool (Extract Transform Load).. Mit diesem Tool können Sie die Datenquellen betrachten, eine Quelle-zu-Ziel-Zuordnung durchführen, die Daten extrahieren, transformieren, bereinigen und wieder in den Data Mart laden.

Dabei erstellt das Tool auch einige Metadaten, beispielsweise über die Herkunft der Daten, ihre Aktualität, die Art der an den Daten vorgenommenen Änderungen und den Grad der Zusammenfassung.

Zugriff auf

Der Zugriff ist ein vierter Schritt, bei dem es darum geht, die Daten zu nutzen: die Daten abzufragen, Berichte und Diagramme zu erstellen und sie zu veröffentlichen. Endbenutzer senden Abfragen an die Datenbank und zeigen die Ergebnisse der Abfragen an

Der Zugriffsschritt muss die folgenden Aufgaben ausführen:

  • Richten Sie eine Metaebene ein, die Datenbankstrukturen und Objektnamen in Geschäftsbegriffe übersetzt. Dies erleichtert technisch nicht versierten Benutzern den einfachen Zugriff auf den Data Mart.
  • Datenbankstrukturen einrichten und pflegen.
  • Richten Sie bei Bedarf API und Schnittstellen ein

Welche Produkte und Technologien benötigen Sie?

Sie können über die Befehlszeile oder die GUI auf den Data Mart zugreifen. Die GUI wird bevorzugt, da sie im Vergleich zur Befehlszeile einfach Diagramme erstellen kann und benutzerfreundlich ist.

Management

Dies ist der letzte Schritt des Data-Mart-Implementierungsprozesses. Dieser Schritt umfasst Verwaltungsaufgaben wie:

  • Laufende Benutzerzugriffsverwaltung.
  • Systemoptimierungen und Feinabstimmungen zur Erzielung der verbesserten Leistung.
  • Hinzufügen und Verwalten neuer Daten zum Data Mart.
  • Planen Sie Wiederherstellungsszenarien und stellen Sie die Systemverfügbarkeit sicher, falls das System ausfällt.

Welche Produkte und Technologien benötigen Sie?

Sie können die GUI oder die Befehlszeile für die Data-Mart-Verwaltung verwenden.

Best Practices für die Implementierung von Data Marts

Im Folgenden finden Sie die Best Practices, die Sie bei der Data-Mart-Implementierung befolgen müssen:

  • Die Quelle eines Data Marts sollte nach Abteilungen strukturiert sein
  • Der Implementierungszyklus eines Data Mart sollte in kurzen Zeiträumen gemessen werden, also in Wochen statt in Monaten oder Jahren.
  • Da die Data-Mart-Implementierung komplex sein kann, ist es wichtig, alle Beteiligten in die Planungs- und Entwurfsphase einzubeziehen.
  • Die Kosten für Data Mart-Hardware/-Software, Netzwerk und Implementierung sollten in Ihrem Plan genau budgetiert werden
  • Auch wenn der Data Mart auf derselben Hardware erstellt wird, benötigen sie möglicherweise eine andere Software, um Benutzeranfragen zu bearbeiten. Für eine schnelle Reaktion des Benutzers sollten zusätzliche Anforderungen an die Verarbeitungsleistung und den Festplattenspeicher bewertet werden
  • Ein Data Mart kann sich an einem anderen Ort als das Data Warehouse befinden. Deshalb ist es wichtig sicherzustellen, dass sie über genügend Netzwerkkapazität verfügen, um die Datenmengen zu bewältigen, die für die Datenübertragung an den Data Mart erforderlich sind.
  • Bei den Implementierungskosten sollte die für den Datamart-Ladevorgang benötigte Zeit berücksichtigt werden. Die Ladezeit erhöht sich mit zunehmender Komplexität der Transformationen.

Vor- und Nachteile eines Data Mart

Vorteile

  • Data Marts enthalten eine Teilmenge unternehmensweiter Daten. Diese Daten sind für eine bestimmte Personengruppe in einer Organisation wertvoll.
  • Es handelt sich um kostengünstige Alternativen zu a Data Warehouse, deren Bau hohe Kosten verursachen kann.
  • Data Mart ermöglicht einen schnelleren Zugriff auf Daten.
  • Data Mart ist einfach zu bedienen, da es speziell auf die Bedürfnisse seiner Benutzer zugeschnitten ist. Somit kann ein Data Mart Geschäftsprozesse beschleunigen.
  • Data Marts benötigen im Vergleich zu Data Warehouse-Systemen weniger Implementierungszeit. Die Implementierung von Data Mart ist schneller, da Sie nur die einzige Teilmenge der Daten konzentrieren müssen.
  • Es enthält historische Daten, die es dem Analysten ermöglichen, Datentrends zu bestimmen.

Nachteile

  • Oftmals erstellen Unternehmen zu viele unterschiedliche und voneinander unabhängige Data Marts ohne großen Nutzen. Die Aufrechterhaltung kann zu einer großen Hürde werden.
  • Data Mart kann nicht unternehmensweit bereitstellen Datenanalyse da ihr Datensatz begrenzt ist.

Zusammenfassung

  • Definieren Sie Data Mart: Ein Data Mart ist als eine Teilmenge des Data Warehouse definiert, die sich auf einen einzelnen Funktionsbereich einer Organisation konzentriert.
  • Data Mart trägt dazu bei, die Reaktionszeit des Benutzers zu verbessern, indem das Datenvolumen reduziert wird.
  • Es gibt drei Arten von Data Mart: 1) abhängig, 2) unabhängig und 3) hybrid
  • Wichtige Implementierungsschritte von Data Mart sind 1) Entwerfen, 2) Konstruieren, 3) Befüllen, 4) Zugriff und 5) Verwalten
  • Der Implementierungszyklus eines Data Mart sollte in kurzen Zeiträumen gemessen werden, also in Wochen statt in Monaten oder Jahren.
  • Data Mart ist eine kostengünstige Alternative zu einem Data Warehouse, dessen Aufbau hohe Kosten verursachen kann.
  • Data Mart kann keine unternehmensweite Datenanalyse anbieten, da der Datensatz begrenzt ist.