Veri Ambarında Boyutsal Modelleme Nedir? Türleri Öğrenin

Boyutlu Modelleme

Boyutsal Modelleme (DM) Veri ambarında veri depolamak için optimize edilmiş bir veri yapısı tekniğidir. Boyutsal modellemenin amacı, verilerin daha hızlı alınması için veritabanını optimize etmektir. Boyutsal Modelleme kavramı Ralph Kimball tarafından geliştirilmiş olup “gerçek” ve “boyut” tablolarından oluşmaktadır.

Veri ambarındaki boyutlu bir model, bir veri ambarındaki değerler, bakiyeler, sayımlar, ağırlıklar vb. gibi sayısal bilgileri okumak, özetlemek ve analiz etmek için tasarlanmıştır. Buna karşılık ilişki modelleri, gerçek zamanlı bir Çevrimiçi İşlem Sisteminde verilerin eklenmesi, güncellenmesi ve silinmesi için optimize edilmiştir.

Bu boyutlu ve ilişkisel modeller, belirli avantajlara sahip olan benzersiz veri depolama yöntemlerine sahiptir.

Örneğin ilişkisel modda normalleştirme ve ER modelleri verilerdeki fazlalığı azaltır. Aksine, veri ambarındaki boyutlu model, verileri, bilginin alınmasını ve rapor oluşturulmasını kolaylaştıracak şekilde düzenler.

Bu nedenle Boyutsal modeller kullanılır. veri ambarı sistemleri ve ilişkisel sistemler için iyi bir uyum değildir.

Boyutlu Veri Modelinin Unsurları

Gerçek

Gerçekler, iş sürecinizdeki ölçümler/metrikler veya gerçeklerdir. Satış iş süreci için ölçüm, üç aylık satış sayısı olacaktır.

Boyut

Boyut, bir iş süreci olayını çevreleyen bağlamı sağlar. Basit bir ifadeyle, kim, ne, nerede olduğuna dair bir gerçeği verirler. Satış iş sürecinde üç aylık satış sayısı için boyutlar şu şekilde olacaktır:

  • Kim – Müşteri İsimleri
  • Nerede – Konum
  • Ne – Ürün Adı

Başka bir deyişle boyut, olgulardaki bilgiyi görüntüleyen bir penceredir.

Özellikler

Nitelikler, boyutlu veri modellemede boyutun çeşitli özellikleridir.

Konum boyutunda nitelikler şunlar olabilir:

  • Eyalet
  • Ülke
  • Posta kodu vb.

Nitelikler gerçekleri aramak, filtrelemek veya sınıflandırmak için kullanılır. Boyut Tabloları Nitelikler içerir

Bilgi Tablosu

Bir olgu tablosu boyut modellemede birincil tablodur.

Bir Bilgi Tablosu şunları içerir:

  1. Ölçümler/gerçekler
  2. Boyut tablosunun yabancı anahtarı

Boyut Tablosu

  • Bir boyut tablosu bir gerçeğin boyutlarını içerir.
  • Yabancı anahtar aracılığıyla olgu tablosuna bağlanırlar.
  • Boyut tabloları normalleştirilmemiş tablolardır.
  • Boyut Nitelikleri, boyut tablosundaki çeşitli sütunlardır
  • Boyutlar, niteliklerinin yardımıyla olguların tanımlayıcı özelliklerini sunar.
  • Boyut sayısı için belirlenmiş bir sınır yoktur
  • Boyut ayrıca bir veya daha fazla hiyerarşik ilişki içerebilir

Veri Ambarındaki Boyut Türleri

Aşağıdaki vardır Veri Ambarındaki Boyut Türleri:

  • Uyumlu Boyut
  • Payanda Boyutu
  • Küçültülmüş Boyut
  • Rol Yapma Boyutu
  • Boyuttan Boyuta Tablo
  • Önemsiz Boyut
  • Dejenere Boyut
  • Değiştirilebilir Boyut
  • Adım Boyutu

Boyutsal Modellemenin Adımları

Boyutsal modellemenizi oluşturmanın doğruluğu, veri ambarı uygulamanızın başarısını belirler. Boyut Modeli oluşturma adımları şunlardır

  1. İş Sürecini Tanımlayın
  2. Tahılın Tanımlanması (ayrıntı düzeyi)
  3. Boyutları Tanımlayın
  4. Gerçekleri Belirleyin
  5. Yıldız Oluştur

Model, iş sürecinizin Neden, Ne Kadar, Ne Zaman/Nerede/Kim ve Ne konularını açıklamalıdır.

Boyutsal Modellemenin Adımları

Adım 1) İş Sürecini Tanımlayın

Bir veri merkezinin kapsaması gereken gerçek iş sürecini belirlemek. Bu, Pazarlama, Satış, İK vb. olabilir. veri analizi organizasyonun ihtiyaçları. İş sürecinin seçimi aynı zamanda bu süreç için mevcut olan verilerin kalitesine de bağlıdır. Veri Modelleme sürecinin en önemli adımıdır ve burada yaşanacak bir başarısızlık, ardı ardına gelen ve telafisi mümkün olmayan kusurlara yol açacaktır.

İş sürecini tanımlamak için düz metin kullanabilir veya temel İş Süreci Modelleme Gösterimini (BPMN) veya Birleşik Modelleme Dilini (UML).

Adım 2) Tahılı Tanımlayın

Tahıl, iş sorununun/çözümünün ayrıntı düzeyini açıklar. Veri ambarınızdaki herhangi bir tablo için en düşük seviyedeki bilginin belirlenmesi işlemidir. Bir tablo her güne ait satış verilerini içeriyorsa, günlük ayrıntı düzeyinde olmalıdır. Bir tablo her ay için toplam satış verilerini içeriyorsa aylık ayrıntı düzeyine sahiptir.

Bu aşamada aşağıdaki gibi soruları yanıtlarsınız:

  1. Mevcut tüm ürünleri mi yoksa sadece birkaç ürün türünü mi depolamamız gerekiyor? Bu karar, Datawarehouse için seçilen iş süreçlerine dayanmaktadır.
  2. Ürün satış bilgilerini aylık, haftalık, günlük veya saatlik olarak mı saklıyoruz? Bu karar, yöneticilerin talep ettiği raporların niteliğine bağlıdır.
  3. Yukarıdaki iki seçenek veritabanı boyutunu nasıl etkiler?

Tahıl Örneği:

Bir çokuluslu şirketin CEO'su, günlük olarak farklı yerlerdeki belirli ürünlerin satışlarını bulmak istiyor.

Yani tahıl, “güne göre konuma göre ürün satış bilgisidir.”

Adım 3) Boyutları Tanımlayın

Boyutlar tarih, mağaza, envanter vb. isimlerdir. Bu boyutlar tüm verilerin depolanması gereken yerdir. Örneğin tarih boyutu yıl, ay ve haftanın günü gibi verileri içerebilir.

Boyut Örneği:

Bir çokuluslu şirketin CEO'su, günlük olarak farklı yerlerdeki belirli ürünlerin satışlarını bulmak istiyor.

Boyutlar: Ürün, Yer ve Zaman

Nitelikler: Ürün için: Ürün anahtarı (Yabancı Anahtar), Ad, Tür, Özellikler

Hiyerarşiler: Konum için: Ülke, Eyalet, Şehir, Sokak Adresi, Ad

Adım 4) Gerçeği Belirleyin

Bu adım, sistemin iş kullanıcılarıyla ortak ilişkilidir çünkü burası, veri ambarında depolanan verilere erişim elde ettikleri yerdir. Bilgi tablosu satırlarının çoğu, fiyat veya birim başına maliyet vb. gibi sayısal değerlerdir.

Gerçeklere Örnek:

Bir çokuluslu şirketin CEO'su, günlük olarak farklı yerlerdeki belirli ürünlerin satışlarını bulmak istiyor.

Buradaki gerçek, ürüne, konuma ve zamana göre Satışların Toplamıdır.

Adım 5) Şema Oluşturun

Bu adımda Boyut Modelini uygularsınız. Şema, veritabanı yapısından (tabloların düzenlenmesi) başka bir şey değildir. İki popüler şema var

  1. Yıldız Şeması

Yıldız şeması mimarisinin tasarımı kolaydır. Yıldız şeması olarak adlandırılır çünkü diyagram bir yıldıza benzer, noktalar bir merkezden yayılır. Yıldızın merkezi olgu tablosundan oluşur ve yıldızın noktaları boyut tablolarıdır.

Üçüncü normal form olan yıldız şemasındaki olgu tabloları, boyut tabloları ise normalleştirilmemiştir.

  1. kar tanesi şeması

Kar tanesi şeması yıldız şemasının bir uzantısıdır. Bir kar tanesi şemasında her boyut normalleştirilir ve daha fazla boyut tablosuna bağlanır.

Ayrıca Kontrol Edin: - Model Örnekleriyle Veri Ambarında Yıldız ve Kar Tanesi Şeması

Boyutlu Modelleme Kuralları

Boyutsal Modellemenin kuralları ve prensipleri şunlardır:

  • Atomik verileri boyutlu yapılara yükleyin.
  • İş süreçleri etrafında boyutlu modeller oluşturun.
  • Her olgu tablosunun ilişkili bir tarih boyutu tablosuna sahip olduğundan emin olmanız gerekir.
  • Tek bir olgu tablosundaki tüm olguların aynı düzeyde veya ayrıntı düzeyinde olduğundan emin olun.
  • Rapor etiketlerini depolamak ve etki alanı değerlerini boyut tablolarında filtrelemek önemlidir.
  • Boyut tablolarının yedek anahtar kullandığından emin olmanız gerekir
  • Karar alma süreçlerini destekleyecek iş çözümü sunmak için gereksinimleri ve gerçekleri sürekli olarak dengeleyin

Boyutsal Modellemenin Faydaları

  • Boyutların standartlaştırılması, iş alanları arasında kolay raporlama yapılmasına olanak tanır.
  • Boyut tabloları boyutsal bilgilerin geçmişini saklar.
  • Gerçek tablosunda büyük kesintiler olmadan tamamen yeni bir boyut getirilmesine olanak tanır.
  • Verileri, veriler veritabanında saklandıktan sonra verilerden bilgilerin alınmasını kolaylaştıracak şekilde depolamak için de boyutludur.
  • Normalleştirilmiş model boyut tablosuyla karşılaştırıldığında anlaşılması daha kolaydır.
  • Bilgiler açık ve basit iş kategorileri halinde gruplandırılmıştır.
  • Boyutsal model işletme tarafından oldukça anlaşılırdır. Bu model iş şartlarını temel alır, böylece işletme her gerçeğin, boyutun veya özelliğin ne anlama geldiğini bilir.
  • Boyutlu modeller, hızlı veri sorgulama için deforme edilmiş ve optimize edilmiştir. Birçok ilişkisel veritabanı platformu bu modeli tanır ve performansa yardımcı olmak için sorgu yürütme planlarını optimize eder.
  • Veri ambarındaki boyutlu modelleme, yüksek performans için optimize edilmiş bir şema oluşturur. Bu, daha az katılım anlamına gelir ve veri yedekliliğinin en aza indirilmesine yardımcı olur.
  • Boyutsal model aynı zamanda sorgu performansının artırılmasına da yardımcı olur. Daha denormalize olduğundan sorgulama için optimize edilmiştir.
  • Boyutlu modeller rahatlıkla değişime uyum sağlayabilir. Boyut tablolarına, bu tabloları kullanan mevcut iş zekası uygulamalarını etkilemeden daha fazla sütun eklenebilir.

Veri Ambarında Çok Boyutlu Veri Modeli Nedir?

Çok boyutlu veri modeli Veri ambarında, verileri veri küpleri biçiminde temsil eden bir modeldir. Verilerin birden fazla boyutta modellenmesine ve görüntülenmesine olanak tanır ve boyutlar ve gerçeklerle tanımlanır. Çok boyutlu veri modeli genellikle merkezi bir tema etrafında kategorize edilir ve bir olgu tablosuyla temsil edilir.

ÖZET

  • Boyutsal model, aşağıdakiler için optimize edilmiş bir veri yapısı tekniğidir: Veri depolama araçları.
  • Gerçekler, iş sürecinizdeki ölçümler/metrikler veya gerçeklerdir.
  • Boyut, bir iş süreci olayını çevreleyen bağlamı sağlar.
  • Nitelikler boyut modellemenin çeşitli özellikleridir.
  • Bir olgu tablosu, boyutlu bir modeldeki birincil tablodur.
  • Bir boyut tablosu bir gerçeğin boyutlarını içerir.
  • Üç tür olgu vardır: 1. Toplamsal 2. Toplamsal olmayan 3. Yarı katkılı.
  • Boyut Türleri Uyumlu, Destekli, Küçültülmüş, Rol Yapma, Boyuttan Boyuta Tablo, Önemsiz, Dejenere, Değiştirilebilir ve Adım Boyutlarıdır.
  • Boyutsal modellemenin beş adımı şunlardır: 1. İş Sürecini Tanımlayın 2. Tahılı Tanımlayın (ayrıntı düzeyi) 3. Boyutları Tanımlayın 4. Gerçekleri Belirleyin 5. Yıldız Oluşturun
  • Veri ambarında Boyutsal modelleme için, her olgu tablosunun ilişkili bir tarih boyut tablosuna sahip olmasını sağlamak için bir ihtiyaç vardır.