Was ist Data Mart im Data Warehouse? Typen und Beispiele

Was ist DataMart?

A Datenmarkt konzentriert sich auf einen einzelnen Funktionsbereich einer Organisation und enthรคlt eine Teilmenge der in einem Data Warehouse gespeicherten Daten. Ein Data Mart ist eine komprimierte Version des Data Warehouse und ist fรผr die Verwendung durch eine bestimmte Abteilung, Einheit oder Gruppe von Benutzern in einer Organisation konzipiert. ZB Marketing, Vertrieb, HR oder Finanzen. Es wird oft von einer einzelnen Abteilung in einer Organisation kontrolliert.

Data Mart bezieht im Vergleich zu einem Data Warehouse normalerweise nur Daten aus wenigen Quellen. Data Marts sind klein und flexibler als ein Datawarehouse.

Warum brauchen wir Data Mart?

  • Data Mart trรคgt durch die Reduzierung des Datenvolumens dazu bei, die Reaktionszeit des Benutzers zu verbessern
  • Es bietet einfachen Zugriff auf hรคufig angeforderte Daten.
  • Data Marts sind im Vergleich zu Unternehmens-Datawarehouses einfacher zu implementieren. Gleichzeitig sind die Kosten fรผr die Implementierung von Data Mart im Vergleich zur Implementierung eines vollstรคndigen Data Warehouse sicherlich geringer.
  • Im Vergleich zum Data Warehouse ist ein Datamart agil. Im Falle einer Modellรคnderung kann der Datamart aufgrund seiner geringeren GrรถรŸe schneller erstellt werden.
  • Ein Datamart wird von einem einzelnen Fachexperten definiert. Im Gegenteil, Data Warehouse wird von interdisziplinรคren KMU aus verschiedenen Bereichen definiert. Daher ist Data Mart im Vergleich zu Datawarehouse offener fรผr Verรคnderungen.
  • Die Daten sind partitioniert und ermรถglichen sehr detaillierte Zugriffskontrollrechte.
  • Daten kรถnnen segmentiert und auf verschiedenen Hardware-/Softwareplattformen gespeichert werden.

Arten von Data Mart

Es gibt drei Haupttypen von Data Mart:

  1. Abhรคngig: Abhรคngige Data Marts werden erstellt, indem Daten direkt aus operativen, externen oder beiden Quellen bezogen werden.
  2. Unabhรคngig: Es wird ein unabhรคngiger Data Mart erstellt, ohne dass ein zentrales Data Warehouse verwendet werden muss.
  3. Hybrid: Diese Art von Data Marts kann Daten aus Data Warehouses oder operativen Systemen รผbernehmen.

Abhรคngiger Data Mart

Ein abhรคngiger Data Mart ermรถglicht die Beschaffung von Unternehmensdaten aus einem einzigen Data Warehouse. Es handelt sich um eines der Data-Mart-Beispiele, das den Vorteil der Zentralisierung bietet. Wenn Sie einen oder mehrere physische Data Marts entwickeln mรผssen, mรผssen Sie diese als abhรคngige Data Marts konfigurieren.

Abhรคngige Data Marts im Data Warehouse kรถnnen auf zwei verschiedene Arten erstellt werden. Entweder dort, wo ein Benutzer je nach Bedarf sowohl auf den Data Mart als auch auf das Data Warehouse zugreifen kann, oder wo der Zugriff nur auf den Data Mart beschrรคnkt ist. Der zweite Ansatz ist nicht optimal, da er manchmal als Datenschrottplatz bezeichnet wird. Auf dem Datenschrottplatz stammen alle Daten aus einer gemeinsamen Quelle, werden jedoch verschrottet und grรถรŸtenteils im Mรผll landen.

Abhรคngiger Data Mart
Abhรคngiger Data Mart

Unabhรคngiger Data Mart

Es entsteht ein unabhรคngiger Data Mart ohne den Einsatz eines zentralen Data Warehouse. Diese Art von Data Mart ist eine ideale Option fรผr kleinere Gruppen innerhalb einer Organisation.

Ein unabhรคngiger Data Mart hat weder eine Beziehung zum Enterprise Data Warehouse noch zu einem anderen Data Mart. Beim Independent Data Mart werden die Daten separat eingegeben und ihre Analysen ebenfalls autonom durchgefรผhrt.

Die Implementierung unabhรคngiger Data Marts steht im Widerspruch zur Motivation fรผr den Aufbau eines Data Warehouse. Zunรคchst benรถtigen Sie einen konsistenten, zentralen Speicher fรผr Unternehmensdaten, der von mehreren Benutzern mit unterschiedlichen Interessen analysiert werden kann, die sehr unterschiedliche Informationen wรผnschen.

Unabhรคngiger Data Mart

Unabhรคngiger Data Mart

Hybrider Datenmarkt

Ein Hybrid-Data-Mart kombiniert Eingaben aus anderen Quellen als dem Data Warehouse. Dies kann hilfreich sein, wenn Sie eine Ad-hoc-Integration wรผnschen, beispielsweise nachdem eine neue Gruppe oder ein neues Produkt zur Organisation hinzugefรผgt wurde.

Es ist das beste Data-Mart-Beispiel, das fรผr mehrere Datenbankumgebungen geeignet ist und eine schnelle Implementierung fรผr jedes Unternehmen ermรถglicht. AuรŸerdem ist der Datenbereinigungsaufwand am geringsten. Hybrid Data Mart unterstรผtzt auch groรŸe Speicherstrukturen und eignet sich am besten fรผr flexible kleinere datenzentrierte Anwendungen.

Hybrider Datenmarkt

Hybrider Datenmarkt

Schritte zur Implementierung eines Datamarts

Schritte zur Implementierung eines Datamarts

Die Implementierung eines Data Mart ist ein lohnendes, aber komplexes Verfahren. Hier sind die detaillierten Schritte zur Implementierung eines Data Mart:

Entwerfen

Das Entwerfen ist die erste Phase der Data-Mart-Implementierung. Es umfasst alle Aufgaben von der Initiierung der Anfrage fรผr einen Data Mart bis zum Sammeln von Informationen รผber die Anforderungen. AbschlieรŸend erstellen wir das logische und physische Data-Mart-Design.

Der Entwurfsschritt umfasst die folgenden Aufgaben:

  • Erfassen der geschรคftlichen und technischen Anforderungen und Identifizieren von Datenquellen.
  • Auswahl der geeigneten Datenteilmenge.
  • Entwerfen der logischen und physischen Struktur des Data Mart.

Daten kรถnnen anhand der folgenden Kriterien partitioniert werden:

  • Datum
  • Geschรคfts- oder Funktionseinheit
  • Geografie
  • Jede Kombination der oben genannten

Daten kรถnnen auf Anwendungs- oder DBMS-Ebene partitioniert werden. Es wird jedoch empfohlen, die Partitionierung auf Anwendungsebene durchzufรผhren, da dadurch jedes Jahr unterschiedliche Datenmodelle mit der ร„nderung der Geschรคftsumgebung mรถglich sind.

Welche Produkte und Technologien benรถtigen Sie?

Ein einfacher Stift und Papier wรผrden ausreichen. Obwohl Tools, die Ihnen beim Erstellen von UML oder helfen ER-Diagramm wรผrde auch Metadaten in Ihre logischen und physischen Designs einbinden.

Konstruieren

Dies ist die zweite Phase der Umsetzung. Es geht um die Erstellung der physische Datenbank und die logischen Strukturen.

Dieser Schritt umfasst die folgenden Aufgaben:

  • Implementierung der in der frรผheren Phase entworfenen physischen Datenbank. Beispielsweise werden Datenbankschemaobjekte wie Tabellen, Indizes, Ansichten usw. erstellt.

Welche Produkte und Technologien benรถtigen Sie?

Du brauchst ein Relationales Datenbank Management System einen Data Mart aufbauen. RDBMS verfรผgen รผber mehrere Funktionen, die fรผr den Erfolg eines Data Mart erforderlich sind.

  • Speicherverwaltung: Ein RDBMS speichert und verwaltet die Daten zum Erstellen, Hinzufรผgen und Lรถschen von Daten.
  • Schneller Datenzugriff: Mit einer SQL-Abfrage kรถnnen Sie basierend auf bestimmten Bedingungen/Filtern einfach auf Daten zugreifen.
  • Datenschutz: Das RDBMS-System bietet auch eine Mรถglichkeit zur Wiederherstellung nach Systemausfรคllen wie Stromausfรคllen. Es ermรถglicht auch die Wiederherstellung von Daten aus diesen Sicherungen, falls die Festplatte ausfรคllt.
  • Mehrbenutzerunterstรผtzung: Das Datenverwaltungssystem bietet gleichzeitigen Zugriff, die Mรถglichkeit fรผr mehrere Benutzer, auf Daten zuzugreifen und diese zu รคndern, ohne die von einem anderen Benutzer vorgenommenen ร„nderungen zu beeintrรคchtigen oder zu รผberschreiben.
  • Sicherheit: Das RDMS-System bietet auรŸerdem eine Mรถglichkeit, den Zugriff von Benutzern auf Objekte und bestimmte Arten von Vorgรคngen zu regeln.

Bevรถlkerungszahl

In der dritten Phase werden die Daten im Data Mart befรผllt.

Der Auffรผllungsschritt umfasst die folgenden Aufgaben:

  • Zuordnung von Quelldaten zu Zieldaten
  • Extraktion von Quelldaten
  • Bereinigungs- und Transformationsvorgรคnge an den Daten
  • Laden von Daten in den Data Mart
  • Metadaten erstellen und speichern

Welche Produkte und Technologien benรถtigen Sie?

Sie erledigen diese Bevรถlkerungsaufgaben mit einem ETL-Tool (Extract Transform Load).. Mit diesem Tool kรถnnen Sie die Datenquellen betrachten, eine Quelle-zu-Ziel-Zuordnung durchfรผhren, die Daten extrahieren, transformieren, bereinigen und wieder in den Data Mart laden.

Dabei erstellt das Tool auch einige Metadaten, beispielsweise รผber die Herkunft der Daten, ihre Aktualitรคt, die Art der an den Daten vorgenommenen ร„nderungen und den Grad der Zusammenfassung.

Zugriff auf

Der Zugriff ist ein vierter Schritt, bei dem es darum geht, die Daten zu nutzen: die Daten abzufragen, Berichte und Diagramme zu erstellen und sie zu verรถffentlichen. Endbenutzer senden Abfragen an die Datenbank und zeigen die Ergebnisse der Abfragen an

Der Zugriffsschritt muss die folgenden Aufgaben ausfรผhren:

  • Richten Sie eine Metaebene ein, die Datenbankstrukturen und Objektnamen in Geschรคftsbegriffe รผbersetzt. Dies erleichtert technisch nicht versierten Benutzern den einfachen Zugriff auf den Data Mart.
  • Datenbankstrukturen einrichten und pflegen.
  • Richten Sie bei Bedarf API und Schnittstellen ein

Welche Produkte und Technologien benรถtigen Sie?

Sie kรถnnen รผber die Befehlszeile oder die GUI auf den Data Mart zugreifen. Die GUI wird bevorzugt, da sie im Vergleich zur Befehlszeile einfach Diagramme erstellen kann und benutzerfreundlich ist.

Management

Dies ist der letzte Schritt des Data-Mart-Implementierungsprozesses. Dieser Schritt umfasst Verwaltungsaufgaben wie:

  • Laufende Benutzerzugriffsverwaltung.
  • Systemoptimierungen und Feinabstimmungen zur Erzielung der verbesserten Leistung.
  • Hinzufรผgen und Verwalten neuer Daten zum Data Mart.
  • Planen Sie Wiederherstellungsszenarien und stellen Sie die Systemverfรผgbarkeit sicher, falls das System ausfรคllt.

Welche Produkte und Technologien benรถtigen Sie?

Sie kรถnnen die GUI oder die Befehlszeile fรผr die Data-Mart-Verwaltung verwenden.

Best Practices fรผr die Implementierung von Data Marts

Im Folgenden finden Sie die Best Practices, die Sie bei der Data-Mart-Implementierung befolgen mรผssen:

  • Die Quelle eines Data Marts sollte nach Abteilungen strukturiert sein
  • Der Implementierungszyklus eines Data Mart sollte in kurzen Zeitrรคumen gemessen werden, also in Wochen statt in Monaten oder Jahren.
  • Da die Data-Mart-Implementierung komplex sein kann, ist es wichtig, alle Beteiligten in die Planungs- und Entwurfsphase einzubeziehen.
  • Die Kosten fรผr Data Mart-Hardware/-Software, Netzwerk und Implementierung sollten in Ihrem Plan genau budgetiert werden
  • Auch wenn der Data Mart auf derselben Hardware erstellt wird, benรถtigen sie mรถglicherweise eine andere Software, um Benutzeranfragen zu bearbeiten. Fรผr eine schnelle Reaktion des Benutzers sollten zusรคtzliche Anforderungen an die Verarbeitungsleistung und den Festplattenspeicher bewertet werden
  • Ein Data Mart kann sich an einem anderen Ort als das Data Warehouse befinden. Deshalb ist es wichtig sicherzustellen, dass sie รผber genรผgend Netzwerkkapazitรคt verfรผgen, um die Datenmengen zu bewรคltigen, die fรผr die Datenรผbertragung an den Data Mart erforderlich sind.
  • Bei den Implementierungskosten sollte die fรผr den Datamart-Ladevorgang benรถtigte Zeit berรผcksichtigt werden. Die Ladezeit erhรถht sich mit zunehmender Komplexitรคt der Transformationen.

Vor- und Nachteile eines Data Mart

Vorteile

  • Data Marts enthalten eine Teilmenge unternehmensweiter Daten. Diese Daten sind fรผr eine bestimmte Personengruppe in einer Organisation wertvoll.
  • Es handelt sich um kostengรผnstige Alternativen zu a Data Warehouse, deren Bau hohe Kosten verursachen kann.
  • Data Mart ermรถglicht einen schnelleren Zugriff auf Daten.
  • Data Mart ist einfach zu bedienen, da es speziell auf die Bedรผrfnisse seiner Benutzer zugeschnitten ist. Somit kann ein Data Mart Geschรคftsprozesse beschleunigen.
  • Data Marts benรถtigen im Vergleich zu Data Warehouse-Systemen weniger Implementierungszeit. Die Implementierung von Data Mart ist schneller, da Sie nur die einzige Teilmenge der Daten konzentrieren mรผssen.
  • Es enthรคlt historische Daten, die es dem Analysten ermรถglichen, Datentrends zu bestimmen.

Nachteile

  • Oftmals erstellen Unternehmen zu viele unterschiedliche und voneinander unabhรคngige Data Marts ohne groรŸen Nutzen. Die Aufrechterhaltung kann zu einer groรŸen Hรผrde werden.
  • Data Mart kann nicht unternehmensweit bereitstellen Datenanalyse da ihr Datensatz begrenzt ist.

Zusammenfassung

  • Definieren Sie Data Mart: Ein Data Mart ist als eine Teilmenge des Data Warehouse definiert, die sich auf einen einzelnen Funktionsbereich einer Organisation konzentriert.
  • Data Mart trรคgt dazu bei, die Reaktionszeit des Benutzers zu verbessern, indem das Datenvolumen reduziert wird.
  • Es gibt drei Arten von Data Mart: 1) abhรคngig, 2) unabhรคngig und 3) hybrid
  • Wichtige Implementierungsschritte von Data Mart sind 1) Entwerfen, 2) Konstruieren, 3) Befรผllen, 4) Zugriff und 5) Verwalten
  • Der Implementierungszyklus eines Data Mart sollte in kurzen Zeitrรคumen gemessen werden, also in Wochen statt in Monaten oder Jahren.
  • Data Mart ist eine kostengรผnstige Alternative zu einem Data Warehouse, dessen Aufbau hohe Kosten verursachen kann.
  • Data Mart kann keine unternehmensweite Datenanalyse anbieten, da der Datensatz begrenzt ist.

Fassen Sie diesen Beitrag mit folgenden Worten zusammen: