Veri Ambarındaki Data Mart Nedir? Türler ve Örnek

Data Mart nedir?

A Veri Merkezi bir kuruluşun tek bir işlevsel alanına odaklanır ve Veri Ambarında depolanan verilerin bir alt kümesini içerir. Data Mart, Veri Ambarı'nın yoğunlaştırılmış bir sürümüdür ve bir kuruluştaki belirli bir departman, birim veya kullanıcı grubu tarafından kullanılmak üzere tasarlanmıştır. Örneğin, Pazarlama, Satış, İK veya finans. Genellikle bir kuruluştaki tek bir departman tarafından kontrol edilir.

Data Mart, Veri ambarına kıyasla genellikle yalnızca birkaç kaynaktan veri çeker. Data mart'ların boyutu küçüktür ve Datawarehouse'a kıyasla daha esnektir.

Data Mart'a neden ihtiyacımız var?

  • Data Mart, veri hacmindeki azalma nedeniyle kullanıcının yanıt süresini artırmaya yardımcı olur
  • Sıkça talep edilen verilere kolay erişim sağlar.
  • Data mart'ın uygulanması, kurumsal Datawarehouse'a kıyasla daha kolaydır. Aynı zamanda, Data Mart'ı uygulamanın maliyeti, tam bir veri ambarı uygulamaya kıyasla kesinlikle daha düşüktür.
  • Veri Ambarı ile karşılaştırıldığında, bir datamart çeviktir. Model değişikliği durumunda datamart daha küçük boyutta olduğundan daha hızlı oluşturulabilir.
  • Datamart, tek bir Konu Uzmanı tarafından tanımlanır. Aksine, veri ambarı çeşitli alanlardaki disiplinler arası KOBİ tarafından tanımlanır. Dolayısıyla Data mart, Datawarehouse'a göre değişime daha açıktır.
  • Veriler bölümlendirilmiştir ve çok ayrıntılı erişim kontrolü ayrıcalıklarına izin verir.
  • Veriler bölümlere ayrılabilir ve farklı donanım/yazılım platformlarında saklanabilir.

Data Mart Türleri

Üç ana veri pazarı türü vardır:

  1. Bağımlı:Bağımlı veri ambarları, verilerin doğrudan operasyonel, harici veya her iki kaynaktan çekilmesiyle oluşturulur.
  2. Bağımsız: Merkezi veri ambarı kullanılmadan bağımsız veri pazarı oluşturulur.
  3. melez: Bu tür veri pazarları, veri ambarlarından veya operasyonel sistemlerden veri alabilir.

Bağımlı Veri Pazarı

Bağımlı bir veri pazarı, kuruluşun verilerinin tek bir Veri Ambarından sağlanmasına olanak tanır. Merkezileştirme avantajı sunan veri pazarı örneklerinden biridir. Bir veya daha fazla fiziksel veri reyonu geliştirmeniz gerekiyorsa bunları bağımlı veri reyonları olarak yapılandırmanız gerekir.

Veri ambarındaki bağımlı Data Mart iki farklı şekilde oluşturulabilir. İhtiyaca bağlı olarak bir kullanıcının hem veri pazarına hem de veri ambarına erişebildiği veya erişimin yalnızca veri pazarıyla sınırlı olduğu yer. İkinci yaklaşım, bazen veri çöplüğü olarak da anılan bir ürün ürettiği için optimal değildir. Veri çöplüğünde tüm veriler ortak bir kaynakla başlar, ancak bunlar hurdaya çıkarılır, çoğunlukla da çöpe atılır.

Bağımlı Veri Pazarı
Bağımlı Veri Pazarı

Bağımsız Veri Pazarı

Merkezi Veri ambarı kullanılmadan bağımsız bir veri pazarı oluşturulur. Bu tür Data Mart, bir kuruluş içindeki daha küçük gruplar için ideal bir seçenektir.

Bağımsız bir veri pazarının ne kurumsal veri ambarı ne de başka herhangi bir veri pazarı ile ilişkisi vardır. Bağımsız veri martında veriler ayrı ayrı girilir ve analizleri de otonom olarak gerçekleştirilir.

Bağımsız veri pazarlarının uygulanması, veri ambarı oluşturma motivasyonuna aykırıdır. Her şeyden önce, çok çeşitli bilgiler isteyen, farklı ilgi alanlarına sahip birden fazla kullanıcı tarafından analiz edilebilecek tutarlı, merkezi bir kurumsal veri deposuna ihtiyacınız var.

Bağımsız Veri Pazarı

Bağımsız Veri Pazarı

Hibrit Veri Pazarı

Hibrit bir veri pazarı, Veri ambarı dışındaki kaynaklardan gelen girdileri birleştirir. Kuruluşa yeni bir grup veya ürün eklendikten sonra olduğu gibi geçici entegrasyon istediğinizde bu yararlı olabilir.

Herhangi bir kuruluş için birden fazla veritabanı ortamına ve hızlı uygulama geri dönüşüne uygun en iyi veri pazarı örneğidir. Aynı zamanda en az veri temizleme çabası gerektirir. Hibrit Veri mart aynı zamanda büyük depolama yapılarını da destekler ve daha küçük veri merkezli uygulamalar için esneklik açısından en uygunudur.

Hibrit Veri Pazarı

Hibrit Veri Pazarı

Datamart'ı Uygulama Adımları

Datamart'ı Uygulama Adımları

Bir Veri Martı uygulamak ödüllendirici ancak karmaşık bir prosedürdür. Bir Veri Martı uygulamak için ayrıntılı adımlar şunlardır:

Tasarımı

Tasarım, Data Mart uygulamasının ilk aşamasıdır. Bir veri pazarına yönelik talebin başlatılmasından gereksinimler hakkında bilgi toplanmasına kadar tüm görevleri kapsar. Son olarak mantıksal ve fiziksel Data Mart tasarımını oluşturuyoruz.

Tasarım aşaması aşağıdaki görevleri içerir:

  • İş ve teknik gereksinimlerin toplanması ve veri kaynaklarının belirlenmesi.
  • Uygun veri alt kümesinin seçilmesi.
  • Datamart'ın mantıksal ve fiziksel yapısının tasarlanması.

Veriler aşağıdaki kriterlere göre bölümlendirilebilir:

  • Tarih
  • İş veya Fonksiyonel Birim
  • Coğrafya
  • Yukarıdakilerin herhangi bir kombinasyonu

Veriler uygulama veya DBMS seviyesinde bölümlenebilir. Ancak iş ortamının değişmesiyle her yıl farklı veri modellerine izin verdiği için Uygulama düzeyinde bölümleme yapılması tavsiye edilir.

Hangi Ürün ve Teknolojilere İhtiyacınız Var?

Basit bir kalem ve kağıt yeterli olacaktır. UML oluşturmanıza yardımcı olacak araçlar veya ER diyagramı aynı zamanda meta verileri mantıksal ve fiziksel tasarımlarınıza da ekler.

Oluşturma

Bu uygulamanın ikinci aşamasıdır. Şunu oluşturmayı içerir: fiziksel veritabanı ve mantıksal yapılar.

Bu adım aşağıdaki görevleri içerir:

  • Önceki aşamada tasarlanan fiziksel veritabanının uygulanması. Örneğin tablo, indeksler, görünümler vb. gibi veritabanı şeması nesneleri oluşturulur.

Hangi Ürün ve Teknolojilere İhtiyacınız Var?

Birine ihtiyacın var. ilişkisel veritabanı yönetim sistemi bir veri pazarı inşa etmek. RDBMS, bir Data Mart'ın başarısı için gerekli olan çeşitli özelliklere sahiptir.

  • Depolama Yönetimi: Bir RDBMS, veri oluşturmak, eklemek ve silmek için verileri saklar ve yönetir.
  • Hızlı veri erişimi: Bir SQL sorgusu ile belirli koşullara/filtrelere dayalı verilere kolayca erişebilirsiniz.
  • Veri koruması: RDBMS sistemi ayrıca elektrik kesintileri gibi sistem arızalarından kurtulmanın bir yolunu da sunar. Ayrıca diskin arızalanması durumunda bu yedeklerden verilerin geri yüklenmesine de olanak tanır.
  • Çok kullanıcılı destek: Veri yönetimi sistemi, eşzamanlı erişim, birden fazla kullanıcının verilere müdahale etmeden veya başka bir kullanıcı tarafından yapılan değişikliklerin üzerine yazmadan erişme ve bunları değiştirme yeteneği sunar.
  • Güvenlik: RDMS sistemi aynı zamanda kullanıcıların nesnelere ve belirli işlem türlerine erişimini düzenlemenin bir yolunu da sağlar.

Doldurma

Üçüncü aşamada, veriler veri martına doldurulur.

Doldurma adımı aşağıdaki görevleri içerir:

  • Kaynak veriden hedef veriye Eşleme
  • Kaynak verilerinin çıkarılması
  • Veriler üzerinde temizleme ve dönüştürme işlemleri
  • Data mart'a veri yükleme
  • Meta veri oluşturma ve saklama

Hangi Ürün ve Teknolojilere İhtiyacınız Var?

Bu nüfus görevlerini bir kullanarak gerçekleştirirsiniz. ETL (Dönüştürme Yükünü Çıkarma) Aracı. Bu araç, veri kaynaklarına bakmanıza, kaynaktan hedefe eşleme yapmanıza, verileri çıkarmanıza, dönüştürmenize, temizlemenize ve veri pazarına geri yüklemenize olanak tanır.

Araç bu süreçte verilerin nereden geldiği, ne kadar güncel olduğu, verilerde ne tür değişiklikler yapıldığı ve ne düzeyde özetleme yapıldığı gibi bazı meta veriler de oluşturuyor.

erişme

Erişim, verilerin kullanıma sunulmasını içeren dördüncü adımdır: verileri sorgulamak, raporlar, grafikler oluşturmak ve bunları yayınlamak. Son kullanıcı sorguları veritabanına gönderir ve sorguların sonuçlarını görüntüler

Erişim adımının aşağıdaki görevleri gerçekleştirmesi gerekir:

  • Veritabanı yapılarını ve nesne adlarını iş terimlerine çeviren bir meta katman oluşturun. Bu, teknik bilgisi olmayan kullanıcıların Data mart'a kolayca erişmesine yardımcı olur.
  • Veritabanı yapılarını kurun ve bakımını yapın.
  • Gerekirse API ve arayüzleri ayarlayın

Hangi Ürün ve Teknolojilere İhtiyacınız Var?

Veri pazarına komut satırını veya GUI'yi kullanarak erişebilirsiniz. GUI, kolaylıkla grafik oluşturabildiğinden ve komut satırına göre kullanıcı dostu olduğundan tercih edilmektedir.

Yönetme

Bu, Data Mart Uygulama sürecinin son adımıdır. Bu adım aşağıdaki gibi yönetim görevlerini kapsar:

  • Sürekli kullanıcı erişim yönetimi.
  • Gelişmiş performansa ulaşmak için sistem optimizasyonları ve ince ayarlar.
  • Veri pazarına yeni veriler ekleme ve yönetme.
  • Kurtarma senaryolarının planlanması ve sistemin arızalanması durumunda sistemin kullanılabilirliğinin sağlanması.

Hangi Ürün ve Teknolojilere İhtiyacınız Var?

Veri merkezi yönetimi için GUI'yi veya komut satırını kullanabilirsiniz.

Data Mart'ları Uygulamaya Yönelik En İyi Uygulamalar

Veri Martı Uygulama sürecinde izlemeniz gereken en iyi uygulamalar şunlardır:

  • Data Mart'ın kaynağı departman bazında yapılandırılmalıdır
  • Data Mart'ın uygulama döngüsü kısa sürelerle, yani aylar veya yıllar yerine haftalarla ölçülmelidir.
  • Veri ambarı uygulaması karmaşık olabileceğinden, planlama ve tasarım aşamasına tüm paydaşların dahil edilmesi önemlidir.
  • Data Mart Donanım/Yazılım, Ağ İletişimi ve Uygulama maliyetleri planınızda doğru bir şekilde bütçelendirilmelidir
  • Data mart aynı donanım üzerinde oluşturulmuş olsa bile, kullanıcı sorgularını işlemek için bazı farklı yazılımlara ihtiyaç duyabilir. Hızlı kullanıcı yanıtı için ek işlem gücü ve disk depolama gereksinimleri değerlendirilmelidir
  • Bir veri pazarı, veri ambarından farklı bir konumda olabilir. Bu nedenle, verileri veri pazarına aktarmak için gereken Veri hacimlerini işlemek için yeterli ağ bağlantısı kapasitesine sahip olduklarından emin olmak önemlidir..
  • Uygulama maliyeti, Datamart yükleme süreci için gereken süreyi bütçelemelidir. Yükleme süresi, dönüşümlerin karmaşıklığındaki artışla birlikte artar.

Data Mart'ın Avantajları ve Dezavantajları

Avantajlar

  • Veri reyonları kuruluş çapındaki verilerin bir alt kümesini içerir. Bu Veriler bir kuruluştaki belirli bir grup insan için değerlidir.
  • Uygun maliyetli alternatiflerdir veri ambarıinşa edilmesi yüksek maliyetler gerektirebilir.
  • Data Mart, Verilere daha hızlı erişim sağlar.
  • Data Mart, kullanıcılarının ihtiyaçlarına göre özel olarak tasarlandığından kullanımı kolaydır. Böylece bir veri pazarı iş süreçlerini hızlandırabilir.
  • Data Marts, Veri Ambarı sistemlerine kıyasla daha az uygulama süresine ihtiyaç duyar. Verilerin yalnızca alt kümesine konsantre olmanız gerektiğinden Data Mart'ı uygulamak daha hızlıdır.
  • Analistin veri eğilimlerini belirlemesine olanak tanıyan geçmiş verileri içerir.

Dezavantajlar

  • Çoğu zaman işletmeler pek fazla fayda sağlamadan çok fazla farklı ve ilgisiz veri pazarı oluştururlar. Sürdürülmesi büyük bir engel haline gelebilir.
  • Data Mart şirket çapında sağlayamaz veri analizi çünkü veri setleri sınırlıdır.

ÖZET

  • Data Mart'ı Tanımlayın: Data Mart, bir kuruluşun tek bir işlevsel alanına odaklanan Veri Ambarı'nın bir alt kümesi olarak tanımlanır.
  • Data Mart, veri hacmindeki azalma nedeniyle kullanıcının yanıt süresini artırmaya yardımcı olur.
  • Üç tür veri pazarı vardır: 1) Bağımlı 2) Bağımsız 3) Hibrit
  • Data Mart'ın önemli uygulama adımları şunlardır: 1) Tasarlama 2) Oluşturma 3 Doldurma 4) Erişim ve 5)Yönetim
  • Data Mart'ın uygulama döngüsü kısa sürelerle, yani aylar veya yıllar yerine haftalarla ölçülmelidir.
  • Data mart, oluşturulması yüksek maliyetler gerektirebilen bir veri ambarının uygun maliyetli alternatifleridir.
  • Veri seti sınırlı olduğundan Data Mart şirket çapında veri analizi sağlayamaz.