Apa itu Pemodelan Dimensi di Gudang Data? Jenis Pembelajaran

Pemodelan Dimensi

Pemodelan Dimensi (DM) adalah teknik struktur data yang dioptimalkan untuk penyimpanan data di gudang Data. Tujuan pemodelan dimensi adalah untuk mengoptimalkan database agar pengambilan data lebih cepat. Konsep Pemodelan Dimensi dikembangkan oleh Ralph Kimball dan terdiri dari tabel “fakta” ​​dan “dimensi”.

Model dimensi dalam gudang data dirancang untuk membaca, meringkas, menganalisis informasi numerik seperti nilai, saldo, jumlah, bobot, dll. di gudang data. Sebaliknya, model relasi dioptimalkan untuk penambahan, pembaruan, dan penghapusan data dalam Sistem Transaksi Online real-time.

Model dimensi dan relasional ini memiliki cara penyimpanan data unik yang memiliki keunggulan spesifik.

Misalnya, dalam mode relasional, normalisasi dan model ER mengurangi redundansi data. Sebaliknya, model dimensi dalam gudang data mengatur data sedemikian rupa sehingga lebih mudah untuk mengambil informasi dan menghasilkan laporan.

Oleh karena itu, model Dimensi digunakan dalam sistem gudang data dan tidak cocok untuk sistem relasional.

Elemen Model Data Dimensi

Fakta

Fakta adalah pengukuran/metrik atau fakta dari proses bisnis Anda. Untuk proses bisnis Penjualan, pengukurannya adalah jumlah penjualan triwulanan

Dimensi

Dimensi memberikan konteks seputar peristiwa proses bisnis. Secara sederhana, mereka memberikan siapa, apa, di mana sebuah fakta. Dalam proses bisnis Penjualan, untuk jumlah penjualan triwulanan, dimensinya adalah

  • Siapa – Nama Pelanggan
  • Dimana – Lokasi
  • Apa – Nama Produk

Dengan kata lain, dimensi merupakan jendela untuk melihat informasi dalam fakta.

atribut

Atribut adalah berbagai karakteristik dimensi dalam pemodelan data dimensi.

Pada dimensi Lokasi, atributnya bisa berupa

  • Negara
  • Negara
  • Kode pos dll.

Atribut digunakan untuk mencari, memfilter, atau mengklasifikasikan fakta. Tabel Dimensi berisi Atribut

Tabel Fakta

Tabel fakta adalah tabel utama dalam pemodelan dimensi.

Tabel Fakta berisi

  1. Pengukuran/fakta
  2. Kunci asing ke tabel dimensi

Tabel Dimensi

  • Tabel dimensi berisi dimensi suatu fakta.
  • Mereka digabungkan ke tabel fakta melalui kunci asing.
  • Tabel dimensi adalah tabel yang dinormalisasi.
  • Atribut Dimensi adalah berbagai kolom dalam tabel dimensi
  • Dimensi menawarkan karakteristik deskriptif fakta dengan bantuan atributnya
  • Tidak ada batasan yang ditetapkan untuk jumlah dimensi yang diberikan
  • Dimensi juga dapat berisi satu atau lebih hubungan hierarkis

Jenis Dimensi di Data Warehouse

Berikut ini adalah Jenis Dimensi di Data Warehouse:

  • Dimensi Sesuai
  • Dimensi Cadik
  • Dimensi Menyusut
  • Dimensi Permainan Peran
  • Tabel Dimensi ke Dimensi
  • Dimensi Sampah
  • Dimensi Degenerasi
  • Dimensi yang Dapat Ditukar
  • Dimensi Langkah

Langkah-langkah Pemodelan Dimensi

Keakuratan dalam membuat pemodelan Dimensi menentukan keberhasilan implementasi gudang data Anda. Berikut langkah-langkah membuat Model Dimensi

  1. Identifikasi Proses Bisnis
  2. Identifikasi Butir (tingkat detail)
  3. Identifikasi Dimensi
  4. Identifikasi Fakta
  5. Bangun Bintang

Model tersebut harus menggambarkan Mengapa, Berapa Banyak, Kapan/Di Mana/Siapa dan Apa dari proses bisnis Anda

Langkah-langkah Pemodelan Dimensi

Langkah 1) Identifikasi Proses Bisnis

Mengidentifikasi proses bisnis sebenarnya yang harus dicakup oleh datarehouse. Ini bisa berupa Pemasaran, Penjualan, SDM, dll. Sesuai dengan analisis data kebutuhan organisasi. Pemilihan proses Bisnis juga bergantung pada kualitas data yang tersedia untuk proses tersebut. Ini adalah langkah terpenting dalam proses Pemodelan Data, dan kegagalan di sini akan menyebabkan kerusakan yang terus menerus dan tidak dapat diperbaiki.

Untuk mendeskripsikan proses bisnis, Anda dapat menggunakan teks biasa atau menggunakan Notasi Pemodelan Proses Bisnis dasar (BPMN) atau Unified Modeling Language (UML).

Langkah 2) Identifikasi Gandum

Grain menggambarkan tingkat detail masalah/solusi bisnis. Ini adalah proses mengidentifikasi tingkat informasi terendah untuk setiap tabel di gudang data Anda. Jika tabel berisi data penjualan setiap hari, maka tabel tersebut harus berupa rincian harian. Jika tabel berisi data total penjualan setiap bulan, maka tabel tersebut memiliki rincian bulanan.

Selama tahap ini, Anda menjawab pertanyaan seperti

  1. Apakah kita perlu menyimpan semua produk yang tersedia atau hanya beberapa jenis produk saja? Keputusan ini didasarkan pada proses bisnis yang dipilih untuk Datawarehouse
  2. Apakah kami menyimpan informasi penjualan produk secara bulanan, mingguan, harian, atau per jam? Keputusan ini bergantung pada sifat laporan yang diminta oleh eksekutif
  3. Bagaimana dua pilihan di atas mempengaruhi ukuran database?

Contoh Gandum:

CEO di sebuah MNC ingin mengetahui penjualan produk tertentu di lokasi berbeda setiap hari.

Jadi, butirnya adalah “informasi penjualan produk berdasarkan lokasi setiap hari”.

Langkah 3) Identifikasi Dimensi

Dimensi adalah kata benda seperti tanggal, penyimpanan, inventaris, dll. Dimensi ini adalah tempat semua data harus disimpan. Misalnya, dimensi tanggal mungkin berisi data seperti tahun, bulan, dan hari kerja.

Contoh Dimensi:

CEO di sebuah MNC ingin mengetahui penjualan produk tertentu di lokasi berbeda setiap hari.

Dimensi: Produk, Lokasi dan Waktu

Atribut: Untuk Produk: Kunci Produk (Kunci Asing), Nama, Jenis, Spesifikasi

Hirarki: Untuk Lokasi: Negara, Negara Bagian, Kota, Alamat Jalan, Nama

Langkah 4) Identifikasi Fakta

Langkah ini dikaitkan dengan pengguna bisnis sistem karena di sinilah mereka mendapatkan akses ke data yang disimpan di gudang data. Sebagian besar baris tabel fakta adalah nilai numerik seperti harga atau biaya per unit, dll.

Contoh Fakta:

CEO di sebuah MNC ingin mengetahui penjualan produk tertentu di lokasi berbeda setiap hari.

Faktanya di sini adalah Jumlah Penjualan berdasarkan produk berdasarkan lokasi berdasarkan waktu.

Langkah 5) Bangun Skema

Pada langkah ini, Anda menerapkan Model Dimensi. Skema tidak lain adalah struktur database (susunan tabel). Ada dua skema yang populer

  1. Skema Bintang

Arsitektur skema bintang mudah dirancang. Disebut skema bintang karena diagramnya menyerupai bintang, dengan titik-titik yang memancar dari pusatnya. Pusat bintang terdiri dari tabel fakta, dan titik-titik bintang adalah tabel dimensi.

Tabel fakta dalam skema bintang yang merupakan bentuk normal ketiga sedangkan tabel dimensi didenormalisasi.

  1. Skema Kepingan Salju

Skema kepingan salju merupakan perpanjangan dari skema bintang. Dalam skema kepingan salju, setiap dimensi dinormalisasi dan dihubungkan ke tabel dimensi lainnya.

Juga Periksa: - Skema Bintang dan Kepingan Salju di Gudang Data dengan Contoh Model

Aturan Pemodelan Dimensi

Berikut ini adalah aturan dan prinsip Pemodelan Dimensi:

  • Memuat data atom ke dalam struktur dimensi.
  • Membangun model dimensi di sekitar proses bisnis.
  • Perlu memastikan bahwa setiap tabel fakta memiliki tabel dimensi tanggal terkait.
  • Pastikan semua fakta dalam satu tabel fakta mempunyai butiran atau tingkat detail yang sama.
  • Penting untuk menyimpan label laporan dan memfilter nilai domain dalam tabel dimensi
  • Perlu memastikan bahwa tabel dimensi menggunakan kunci pengganti
  • Terus menyeimbangkan kebutuhan dan kenyataan untuk memberikan solusi bisnis guna mendukung pengambilan keputusan mereka

Manfaat Pemodelan Dimensi

  • Standarisasi dimensi memungkinkan pelaporan yang mudah di seluruh area bisnis.
  • Tabel dimensi menyimpan sejarah informasi dimensi.
  • Hal ini memungkinkan untuk memperkenalkan dimensi yang sepenuhnya baru tanpa gangguan besar pada tabel fakta.
  • Dimensi juga untuk menyimpan data sedemikian rupa sehingga lebih mudah untuk mengambil informasi dari data setelah data disimpan dalam database.
  • Dibandingkan dengan tabel dimensi model yang dinormalisasi lebih mudah dipahami.
  • Informasi dikelompokkan ke dalam kategori bisnis yang jelas dan sederhana.
  • Model dimensional sangat dimengerti oleh bisnis. Model ini didasarkan pada istilah bisnis, sehingga bisnis mengetahui arti dari setiap fakta, dimensi, atau atribut.
  • Model dimensi dideformasi dan dioptimalkan untuk kueri data yang cepat. Banyak platform database relasional mengenali model ini dan mengoptimalkan rencana eksekusi kueri untuk membantu kinerja.
  • Pemodelan dimensi di gudang data menciptakan skema yang dioptimalkan untuk kinerja tinggi. Ini berarti lebih sedikit penggabungan dan membantu meminimalkan redundansi data.
  • Model dimensi juga membantu meningkatkan kinerja kueri. Ini lebih didenormalisasi oleh karena itu dioptimalkan untuk kueri.
  • Model dimensi dapat mengakomodasi perubahan dengan nyaman. Tabel dimensi dapat memiliki lebih banyak kolom yang ditambahkan ke dalamnya tanpa mempengaruhi aplikasi intelijen bisnis yang ada menggunakan tabel ini.

Apa itu Model Data Multidimensi di Gudang Data?

Model data multidimensi pada data warehouse adalah model yang merepresentasikan data dalam bentuk data cube. Hal ini memungkinkan untuk memodelkan dan melihat data dalam berbagai dimensi dan ditentukan oleh dimensi dan fakta. Model data multidimensi umumnya dikategorikan berdasarkan tema sentral dan diwakili oleh tabel fakta.

Ringkasan

  • Model dimensi adalah teknik struktur data yang dioptimalkan Alat pergudangan data.
  • Fakta adalah pengukuran/metrik atau fakta dari proses bisnis Anda.
  • Dimensi memberikan konteks seputar peristiwa proses bisnis.
  • Atribut adalah berbagai karakteristik pemodelan dimensi.
  • Tabel fakta adalah tabel utama dalam model dimensi.
  • Tabel dimensi berisi dimensi suatu fakta.
  • Ada tiga jenis fakta 1. Aditif 2. Non aditif 3. Semi aditif.
  • Jenis Dimensi adalah Dimensi Sesuai, Cadik, Menyusut, Permainan Peran, Dimensi ke Tabel Dimensi, Dimensi Sampah, Degenerasi, Dapat Ditukar, dan Dimensi Langkah.
  • Lima langkah pemodelan Dimensi adalah 1. Identifikasi Proses Bisnis 2. Identifikasi Grain (tingkat detail) 3. Identifikasi Dimensi 4. Identifikasi Fakta 5. Build Star
  • Untuk pemodelan dimensi di gudang data, terdapat kebutuhan untuk memastikan bahwa setiap tabel fakta memiliki tabel dimensi tanggal yang terkait.