Co je Data Mart v Data Warehouse? Typy a příklady
Co je Data Mart?
A Data Mart je zaměřena na jednu funkční oblast organizace a obsahuje podmnožinu dat uložených v datovém skladu. Data Mart je zkrácená verze Data Warehouse a je navržena pro použití konkrétním oddělením, jednotkou nebo skupinou uživatelů v organizaci. Např. marketing, prodej, HR nebo finance. Často je řízena jediným oddělením v organizaci.
Data Mart obvykle čerpá data pouze z několika zdrojů ve srovnání s datovým skladem. Datové tržiště mají malou velikost a jsou flexibilnější ve srovnání s datovým skladem.
Proč potřebujeme Data Mart?
- Data Mart pomáhá zkrátit dobu odezvy uživatele díky snížení objemu dat
- Poskytuje snadný přístup k často požadovaným datům.
- Implementace datového tržiště je ve srovnání s podnikovým Datawarehouse jednodušší. Zároveň jsou náklady na implementaci Data Mart jistě nižší ve srovnání s implementací úplného datového skladu.
- Ve srovnání s Data Warehouse je datamart agilní. V případě změny modelu lze datamart postavit rychleji díky menší velikosti.
- Datamart je definován jediným odborníkem na předmět. Naopak datový sklad je definován interdisciplinárním MSP z různých oblastí. Data mart je tedy ve srovnání s Datawarehouse otevřenější změnám.
- Data jsou rozdělena a umožňují velmi podrobná oprávnění řízení přístupu.
- Data lze segmentovat a ukládat na různé hardwarové/softwarové platformy.
Typy Data Mart
Existují tři hlavní typy datového trhu:
- Závislý: Závislé datové tržiště jsou vytvářeny čerpáním dat přímo z provozních, externích nebo obou zdrojů.
- Nezávislý: Nezávislý datový trh je vytvořen bez použití centrálního datového skladu.
- Hybridní: Tento typ datových tržišť může přebírat data z datových skladů nebo operačních systémů.
Dependent Data Mart
Závislý datový trh umožňuje získávat data organizace z jednoho datového skladu. Je to jeden z příkladů datového trhu, který nabízí výhodu centralizace. Pokud potřebujete vyvinout jeden nebo více fyzických datových tržišť, musíte je nakonfigurovat jako závislé datové tržiště.
Závislý Data Mart v datovém skladu lze vytvořit dvěma různými způsoby. Buď tam, kde má uživatel podle potřeby přístup k datovému tržišti i datovému skladu, nebo tam, kde je přístup omezen pouze na datový tržiště. Druhý přístup není optimální, protože produkuje někdy označované jako vrakoviště dat. V datovém smetišti začínají všechna data společným zdrojem, ale jsou vyřazena a většinou vyřazena.

Independent Data Mart
Nezávislý datový obchod je vytvořen bez použití centrálního datového skladu. Tento druh Data Mart je ideální volbou pro menší skupiny v rámci organizace.
Nezávislé datové tržiště nemá žádný vztah s podnikovým datovým skladem ani s žádným jiným datovým tržištěm. V Independent data mart jsou data zadávána samostatně a jejich analýzy jsou také prováděny autonomně.
Implementace nezávislých datových trhů je v rozporu s motivací pro budování datového skladu. Nejprve potřebujete konzistentní, centralizované úložiště podnikových dat, které může analyzovat více uživatelů s různými zájmy, kteří požadují velmi odlišné informace.

Hybrid Data Mart
Hybridní datový trh kombinuje vstupy ze zdrojů kromě datového skladu. To by mohlo být užitečné, když chcete integraci ad hoc, například po přidání nové skupiny nebo produktu do organizace.
Je to nejlepší příklad datového trhu vhodný pro více databázových prostředí a rychlou implementaci pro jakoukoli organizaci. Vyžaduje také nejmenší úsilí při čištění dat. Hybrid Data mart také podporuje velké struktury úložišť a nejlépe se hodí pro menší aplikace zaměřené na data.

Kroky při implementaci Datamart
Implementace Data Mart je obohacující, ale složitý postup. Zde jsou podrobné kroky k implementaci Data Mart:
Projektování
Návrh je první fází implementace Data Martu. Zahrnuje všechny úkoly od zahájení požadavku na datový trh až po shromáždění informací o požadavcích. Nakonec vytvoříme logický a fyzický návrh Data Mart.
Krok návrhu zahrnuje následující úkoly:
- Shromažďování obchodních a technických požadavků a identifikace zdrojů dat.
- Výběr vhodné podmnožiny dat.
- Návrh logické a fyzické struktury datového tržiště.
Data lze rozdělit na základě následujících kritérií:
- Datum
- Obchodní nebo funkční jednotka
- Zeměpis
- Jakákoli kombinace výše uvedeného
Data mohou být rozdělena na úrovni aplikace nebo DBMS. I když se doporučuje rozdělení na aplikační úrovni, protože každý rok umožňuje různé datové modely se změnou obchodního prostředí.
Jaké produkty a technologie potřebujete?
Postačí obyčejná tužka a papír. Ačkoli nástroje, které vám pomohou vytvořit UML nebo ER diagram také přidá metadata do vašich logických a fyzických návrhů.
Konstruování
Toto je druhá fáze implementace. Zahrnuje vytvoření fyzické databáze a logické struktury.
Tento krok zahrnuje následující úkoly:
- Implementace fyzické databáze navržené v dřívější fázi. Vytvářejí se například objekty databázových schémat jako tabulka, indexy, pohledy atd.
Jaké produkty a technologie potřebujete?
Potřebuješ systém pro správu relačních databází k vybudování datového tržiště. RDBMS má několik funkcí, které jsou vyžadovány pro úspěch Data Mart.
- Správa úložiště: RDBMS ukládá a spravuje data pro vytváření, přidávání a odstraňování dat.
- Rychlý přístup k datům: Pomocí SQL dotazu můžete snadno přistupovat k datům na základě určitých podmínek/filtrů.
- Ochrana dat: Systém RDBMS také nabízí způsob, jak se zotavit ze selhání systému, jako jsou výpadky napájení. Umožňuje také obnovu dat z těchto záloh v případě selhání disku.
- Podpora více uživatelů: Systém správy dat nabízí souběžný přístup, možnost více uživatelů přistupovat k datům a upravovat je bez zasahování nebo přepisování změn provedených jiným uživatelem.
- Zabezpečení Systém RDMS také poskytuje způsob, jak regulovat přístup uživatelů k objektům a určitým typům operací.
Zalidnění
Ve třetí fázi se data naplní do datového tržiště.
Krok vyplnění zahrnuje následující úkoly:
- Mapování zdrojových dat k cílovým datům
- Extrakce zdrojových dat
- Čistící a transformační operace na datech
- Načítání dat do datového tržiště
- Vytváření a ukládání metadat
Jaké produkty a technologie potřebujete?
Tyto populační úkoly provádíte pomocí an Nástroj ETL (Extract Transform Load).. Tento nástroj vám umožňuje podívat se na zdroje dat, provádět mapování zdroje na cíl, extrahovat data, transformovat je, vyčistit je a načíst je zpět do datového tržiště.
V tomto procesu nástroj také vytváří některá metadata týkající se věcí, jako je odkud data pocházejí, jak jsou aktuální, jaký typ změn byl v datech proveden a jaká úroveň sumarizace byla provedena.
Přístup
Přístup je čtvrtým krokem, který zahrnuje použití dat: dotazování se na data, vytváření sestav, grafů a jejich publikování. Koncový uživatel odesílá dotazy do databáze a zobrazuje výsledky dotazů
Krok přístupu musí provádět následující úkoly:
- Nastavte metavrstvu, která převádí databázové struktury a názvy objektů do obchodních podmínek. To pomáhá netechnickým uživatelům snadno přistupovat k datovému trhu.
- Nastavení a údržba databázových struktur.
- V případě potřeby nastavte API a rozhraní
Jaké produkty a technologie potřebujete?
K datovému tržišti můžete přistupovat pomocí příkazového řádku nebo GUI. GUI je preferováno, protože může snadno generovat grafy a je uživatelsky přívětivé ve srovnání s příkazovým řádkem.
Správa
Toto je poslední krok procesu implementace Data Mart. Tento krok zahrnuje úkoly správy, jako např.
- Průběžná správa uživatelského přístupu.
- Optimalizace systému a jemné ladění pro dosažení zvýšeného výkonu.
- Přidávání a správa čerstvých dat do datového tržiště.
- Plánování scénářů obnovy a zajištění dostupnosti systému v případě selhání systému.
Jaké produkty a technologie potřebujete?
Pro správu datového tržiště můžete použít GUI nebo příkazový řádek.
Doporučené postupy pro implementaci Data Marts
Níže jsou uvedeny osvědčené postupy, které musíte během procesu implementace Data Mart dodržovat:
- Zdroj datového obchodu by měl být strukturován podle oddělení
- Cyklus implementace Data Mart by měl být měřen v krátkých časových obdobích, tj. v týdnech namísto měsíců nebo let.
- Je důležité zapojit všechny zúčastněné strany do fáze plánování a navrhování, protože implementace datového trhu může být složitá.
- Náklady na hardware/software, sítě a implementaci Data Mart by měly být ve vašem plánu přesně rozpočítány
- I když je Data mart vytvořen na stejném hardwaru, může pro zpracování uživatelských dotazů potřebovat jiný software. Pro rychlou odezvu uživatele by měly být vyhodnoceny další požadavky na výpočetní výkon a diskové úložiště
- Datové tržiště se může nacházet na jiném místě než datový sklad. Proto je důležité zajistit, aby měly dostatečnou síťovou kapacitu, aby zvládly objemy dat potřebné k přenosu dat do datového tržiště..
- Náklady na implementaci by měly počítat s časem potřebným pro proces načítání Datamart. Doba zatížení se zvyšuje s rostoucí složitostí transformací.
Výhody a nevýhody Data Mart
Výhody
- Datové tržiště obsahují podmnožinu dat z celé organizace. Tato data jsou cenná pro určitou skupinu lidí v organizaci.
- Je to nákladově efektivní alternativa k a datový sklad, jehož výstavba může vyžadovat vysoké náklady.
- Data Mart umožňuje rychlejší přístup k datům.
- Data Mart se snadno používá, protože je speciálně navržen pro potřeby svých uživatelů. Datový trh tak může urychlit obchodní procesy.
- Data Marts potřebuje kratší dobu implementace ve srovnání se systémy Data Warehouse. Implementace Data Mart je rychlejší, protože potřebujete soustředit pouze jedinou podmnožinu dat.
- Obsahuje historická data, která umožňují analytikovi určit trendy dat.
Nevýhody
- Mnohokrát podniky vytvářejí příliš mnoho nesourodých a nesouvisejících datových trhů bez velkého přínosu. Udržování se může stát velkou překážkou.
- Data Mart nemůže poskytovat služby v rámci celé společnosti analýza dat protože jejich datový soubor je omezený.
Shrnutí
- Define Data Mart : Data Mart je definována jako podmnožina datového skladu, která je zaměřena na jednu funkční oblast organizace.
- Data Mart pomáhá zlepšit dobu odezvy uživatele díky snížení objemu dat.
- Tři typy datového trhu jsou 1) Závislý 2) Nezávislý 3) Hybridní
- Důležité kroky implementace Data Mart jsou 1) Návrh 2) Konstrukce 3 Naplnění 4) Přístup a 5) Správa
- Cyklus implementace Data Mart by měl být měřen v krátkých časových obdobích, tj. v týdnech namísto měsíců nebo let.
- Data mart je cenově výhodná alternativa k datovému skladu, jejíž vybudování může vyžadovat vysoké náklady.
- Data Mart nemůže poskytovat celopodnikovou analýzu dat, protože soubor dat je omezený.