Vad är Data Mart i Data Warehouse? Typer och exempel
Vad är Data Mart?
A Data Mart är fokuserad på ett enda funktionsområde i en organisation och innehåller en delmängd av data som lagras i ett datalager. En Data Mart är en komprimerad version av Data Warehouse och är designad för användning av en specifik avdelning, enhet eller uppsättning användare i en organisation. Till exempel marknadsföring, försäljning, HR eller ekonomi. Det styrs ofta av en enda avdelning i en organisation.
Data Mart hämtar vanligtvis data från endast ett fåtal källor jämfört med ett datalager. Datamars är små i storlek och är mer flexibla jämfört med ett Datawarehouse.
Varför behöver vi Data Mart?
- Data Mart hjälper till att förbättra användarens svarstid på grund av minskningen av datamängden
- Det ger enkel åtkomst till ofta efterfrågade data.
- Datamart är enklare att implementera jämfört med företags Datawarehouse. Samtidigt är kostnaden för att implementera Data Mart säkerligen lägre jämfört med att implementera ett komplett datalager.
- Jämfört med Data Warehouse är en datamart smidig. Vid byte av modell kan datamart byggas snabbare tack vare en mindre storlek.
- En Datamart definieras av en enda ämnesexpert. Tvärtom definieras datalager av tvärvetenskapliga små och medelstora företag från en mängd olika domäner. Därför är Data Mart mer öppen för förändring jämfört med Datawarehouse.
- Data är partitionerad och tillåter mycket detaljerade åtkomstkontrollprivilegier.
- Data kan segmenteras och lagras på olika hårdvaru-/mjukvaruplattformar.
Typer av Data Mart
Det finns tre huvudtyper av datamart:
- Beroende: Beroende datamars skapas genom att hämta data direkt från operativa, externa eller båda källorna.
- Oberoende: Oberoende datamart skapas utan användning av ett centralt datalager.
- Hybrid: Den här typen av datamarts kan ta data från datalager eller operativa system.
Beroende Data Mart
En beroende datamart tillåter inköp av organisationens data från ett enda datalager. Det är ett av datamartexemplen som erbjuder fördelen med centralisering. Om du behöver utveckla en eller flera fysiska datamarts, måste du konfigurera dem som beroende datamarts.
Dependent Data Mart i data warehouse kan byggas på två olika sätt. Antingen där en användare kan komma åt både datamart och datalager, beroende på behov, eller där åtkomsten endast är begränsad till datamart. Det andra tillvägagångssättet är inte optimalt eftersom det producerar ibland kallat ett dataskräp. På dataskräpgården börjar all data med en gemensam källa, men de skrotas och för det mesta skräpas.
Independent Data Mart
En oberoende datamart skapas utan användning av centralt datalager. Denna typ av Data Mart är ett idealiskt alternativ för mindre grupper inom en organisation.
En oberoende datamart har varken en relation till företagets datalager eller med någon annan datamart. I Independent data mart matas data in separat, och dess analyser utförs också autonomt.
Implementering av oberoende datamarts är motsatsen till motivationen för att bygga ett datalager. Först och främst behöver du ett konsekvent, centraliserat lager av företagsdata som kan analyseras av flera användare med olika intressen som vill ha mycket varierande information.
Hybrid Data Mart
En hybrid datamart kombinerar input från källor förutom Data Warehouse. Detta kan vara användbart när du vill ha ad hoc-integration, som efter att en ny grupp eller produkt har lagts till i organisationen.
Det är det bästa datamart-exemplet som lämpar sig för flera databasmiljöer och snabb implementering för alla organisationer. Det kräver också minsta ansträngning för datarensning. Hybrid Data mart stöder också stora lagringsstrukturer, och den är bäst lämpad för flexibla för mindre datacentrerade applikationer.
Steg för att implementera en Datamart
Att implementera en Data Mart är en givande men komplex procedur. Här är de detaljerade stegen för att implementera en Data Mart:
Utforma
Design är den första fasen av Data Mart-implementeringen. Den täcker alla uppgifter från att initiera begäran om en datamart till att samla in information om kraven. Slutligen skapar vi den logiska och fysiska Data Mart-designen.
Designsteget innefattar följande uppgifter:
- Samla affärs- och tekniska krav och identifiera datakällor.
- Välja lämplig delmängd av data.
- Designa den logiska och fysiska strukturen för datamarknaden.
Data kan delas upp baserat på följande kriterier:
- Datum
- Affärsenhet eller funktionell enhet
- Geografi
- Vilken kombination av ovanstående som helst
Data kan partitioneras på applikations- eller DBMS-nivå. Även om det rekommenderas att partitionera på applikationsnivå eftersom det tillåter olika datamodeller varje år med förändringen i affärsmiljön.
Vilka produkter och tekniker behöver du?
En enkel penna och papper skulle räcka. Även verktyg som hjälper dig att skapa UML eller ER-diagram skulle också lägga till metadata i din logiska och fysiska design.
konstruera
Detta är den andra fasen av implementeringen. Det handlar om att skapa fysisk databas och de logiska strukturerna.
Detta steg innefattar följande uppgifter:
- Implementering av den fysiska databasen designad i den tidigare fasen. Till exempel skapas databasschemaobjekt som tabell, index, vyer, etc..
Vilka produkter och tekniker behöver du?
Du behöver en hanteringssystem för relationsdatabas att konstruera en datamart. RDBMS har flera funktioner som krävs för att en Data Mart ska lyckas.
- Lagringshantering: En RDBMS lagrar och hanterar data för att skapa, lägga till och ta bort data.
- Snabb dataåtkomst: Med en SQL-fråga kan du enkelt komma åt data baserat på vissa villkor/filter.
- Dataskydd: RDBMS-systemet erbjuder också ett sätt att återhämta sig från systemfel som strömavbrott. Det gör det också möjligt att återställa data från dessa säkerhetskopior om disken misslyckas.
- Fleranvändarstöd: Datahanteringssystemet erbjuder samtidig åtkomst, möjligheten för flera användare att komma åt och ändra data utan att störa eller skriva över ändringar som gjorts av en annan användare.
- Säkerhet: RDMS-systemet ger också ett sätt att reglera användares åtkomst till objekt och vissa typer av operationer.
Befolkar
I den tredje fasen fylls data i datamarknaden.
Ifyllningssteget innefattar följande uppgifter:
- Källdata till måldata Kartläggning
- Extraktion av källdata
- Rengöring och omvandling av data
- Laddar data till datamart
- Skapa och lagra metadata
Vilka produkter och tekniker behöver du?
Du utför dessa befolkningsuppgifter med hjälp av en ETL-verktyg (Extract Transform Load).. Det här verktyget låter dig titta på datakällorna, utföra källa-till-mål-mappning, extrahera data, transformera, rengöra den och ladda tillbaka den till datamarknaden.
I processen skapar verktyget också en del metadata som relaterar till saker som var data kom ifrån, hur nyligen den är, vilken typ av ändringar som gjordes i data och vilken nivå av sammanfattning som gjordes.
Åtkomst
Åtkomst är ett fjärde steg som innebär att data används: fråga efter data, skapa rapporter, diagram och publicera dem. Slutanvändare skickar frågor till databasen och visar resultaten av frågorna
Åtkomststeget måste utföra följande uppgifter:
- Skapa ett metalager som översätter databasstrukturer och objektnamn till affärstermer. Detta hjälper icke-tekniska användare att enkelt komma åt Datamart.
- Skapa och underhålla databasstrukturer.
- Konfigurera API och gränssnitt vid behov
Vilka produkter och tekniker behöver du?
Du kan komma åt datamart med hjälp av kommandoraden eller GUI. GUI är att föredra eftersom det enkelt kan generera grafer och är användarvänligt jämfört med kommandoraden.
Hantering
Detta är det sista steget i Data Mart-implementeringsprocessen. Detta steg omfattar ledningsuppgifter som t.ex.
- Löpande användaråtkomsthantering.
- Systemoptimeringar och finjusteringar för att uppnå den förbättrade prestandan.
- Lägga till och hantera färsk data i datamarknaden.
- Planera återställningsscenarier och säkerställa systemtillgänglighet i fallet när systemet misslyckas.
Vilka produkter och tekniker behöver du?
Du kan använda det grafiska användargränssnittet eller kommandoraden för datamarthantering.
Bästa metoder för implementering av Data Marts
Följande är de bästa metoderna som du måste följa när du är i Data Mart-implementeringsprocessen:
- Källan till en Data Mart bör vara avdelningsstrukturerad
- Implementeringscykeln för en Data Mart bör mätas under korta tidsperioder, dvs i veckor istället för månader eller år.
- Det är viktigt att involvera alla intressenter i planerings- och designfasen eftersom implementeringen av datamart kan vara komplex.
- Data Mart hårdvara/mjukvara, nätverk och implementeringskostnader bör budgeteras korrekt i din plan
- Även om datamart skapas på samma hårdvara kan de behöva lite annan programvara för att hantera användarfrågor. Ytterligare krav på processorkraft och disklagring bör utvärderas för snabb användarrespons
- En datamart kan finnas på en annan plats än datalagret. Det är därför det är viktigt att se till att de har tillräckligt med nätverkskapacitet för att hantera de datavolymer som behövs för att överföra data till datamarknaden.
- Implementeringskostnaden bör budgetera den tid det tar för Datamart-laddningsprocessen. Laddningstiden ökar med ökad komplexitet hos transformationerna.
Fördelar och nackdelar med en datamart
Fördelar
- Datamars innehåller en delmängd av organisationsomfattande data. Denna data är värdefull för en specifik grupp människor i en organisation.
- Det är kostnadseffektiva alternativ till en datalagret, vilket kan ta höga kostnader att bygga.
- Data Mart möjliggör snabbare åtkomst av data.
- Data Mart är lätt att använda eftersom den är speciellt utformad för användarnas behov. Således kan en datamarknad påskynda affärsprocesser.
- Data Marts behöver mindre implementeringstid jämfört med Data Warehouse-system. Det går snabbare att implementera Data Mart eftersom du bara behöver koncentrera den enda delmängden av datan.
- Den innehåller historiska data som gör det möjligt för analytikern att fastställa datatrender.
Nackdelar
- Många gånger skapar företag för många olikartade och orelaterade datamarts utan större nytta. Det kan bli ett stort hinder att upprätthålla.
- Data Mart kan inte tillhandahålla hela företaget dataanalys eftersom deras datamängd är begränsad.
Sammanfattning
- Definiera Data Mart: En Data Mart definieras som en delmängd av Data Warehouse som är fokuserad på ett enda funktionsområde i en organisation.
- Data Mart hjälper till att förbättra användarens svarstid på grund av en minskning av datamängden.
- Tre typer av datamart är 1) Beroende 2) Oberoende 3) Hybrid
- Viktiga implementeringssteg för Data Mart är 1) Designa 2) Konstruera 3 Befolka 4) Tillgång till och 5) Hantera
- Implementeringscykeln för en Data Mart bör mätas under korta tidsperioder, dvs i veckor istället för månader eller år.
- Datamart är kostnadseffektiva alternativ till ett datalager, som kan ta höga kostnader att bygga.
- Data Mart kan inte tillhandahålla företagsomfattande dataanalys eftersom datamängden är begränsad.