Apa itu Data Mart di Gudang Data? Jenis & Contoh
Apa itu Data Mart?
A DataMart difokuskan pada satu area fungsional organisasi dan berisi subkumpulan data yang disimpan di Gudang Data. Data Mart adalah versi ringkas dari Data Warehouse dan dirancang untuk digunakan oleh departemen, unit, atau kumpulan pengguna tertentu dalam suatu organisasi. Misalnya, Pemasaran, Penjualan, SDM atau keuangan. Seringkali dikendalikan oleh satu departemen dalam suatu organisasi.
Data Mart biasanya mengambil data hanya dari beberapa sumber dibandingkan dengan Data Warehouse. Data mart berukuran kecil dan lebih fleksibel dibandingkan dengan Datawarehouse.
Mengapa kita membutuhkan Data Mart?
- Data Mart membantu meningkatkan waktu respons pengguna karena pengurangan volume data
- Ini menyediakan akses mudah ke data yang sering diminta.
- Data mart lebih sederhana untuk diimplementasikan jika dibandingkan dengan Datawarehouse korporat. Pada saat yang sama, biaya penerapan Data Mart tentunya lebih rendah dibandingkan dengan penerapan gudang data lengkap.
- Dibandingkan dengan Data Warehouse, datamart lebih gesit. Jika terjadi perubahan model, datamart dapat dibangun lebih cepat karena ukurannya yang lebih kecil.
- Datamart ditentukan oleh seorang Pakar Materi Pokok. Sebaliknya data warehouse ditentukan oleh UKM interdisipliner dari berbagai domain. Oleh karena itu, Data mart lebih terbuka terhadap perubahan dibandingkan dengan Datawarehouse.
- Data dipartisi dan memungkinkan hak kontrol akses yang sangat terperinci.
- Data dapat disegmentasi dan disimpan pada platform perangkat keras/perangkat lunak yang berbeda.
Jenis Data Mart
Ada tiga jenis utama data mart:
- Tergantung: Data mart dependen dibuat dengan mengambil data langsung dari sumber operasional, eksternal, atau keduanya.
- Independen: Data mart independen dibuat tanpa menggunakan gudang data pusat.
- Hibrida: Jenis data mart ini dapat mengambil data dari gudang data atau sistem operasional.
Data Mart yang Bergantung
Data mart yang bergantung memungkinkan sumber data organisasi dari satu Gudang Data. Ini adalah salah satu contoh data mart yang menawarkan manfaat sentralisasi. Jika Anda perlu mengembangkan satu atau lebih data mart fisik, Anda perlu mengonfigurasinya sebagai data mart dependen.
Dependent Data Mart di gudang data dapat dibangun dengan dua cara berbeda. Baik di mana pengguna dapat mengakses data mart dan gudang data, tergantung pada kebutuhan, atau di mana akses dibatasi hanya pada data mart. Pendekatan kedua tidak optimal karena kadang-kadang disebut sebagai tempat barang rongsokan data. Di tempat barang rongsokan data, semua data dimulai dari sumber yang sama, namun data tersebut dibuang dan sebagian besar dibuang.
Data Mart Independen
Data mart independen dibuat tanpa menggunakan gudang data pusat. Data Mart semacam ini adalah pilihan ideal untuk kelompok kecil dalam suatu organisasi.
Data mart independen tidak memiliki hubungan dengan gudang data perusahaan atau dengan data mart lainnya. Di data mart Independen, data dimasukkan secara terpisah, dan analisisnya juga dilakukan secara mandiri.
Penerapan data mart independen bertentangan dengan motivasi membangun gudang data. Pertama-tama, Anda memerlukan penyimpanan data perusahaan yang konsisten dan terpusat yang dapat dianalisis oleh banyak pengguna dengan minat berbeda yang menginginkan informasi yang sangat beragam.
Mart Data Hibrid
Data mart hibrid menggabungkan input dari sumber selain dari gudang data. Ini dapat berguna ketika Anda menginginkan integrasi ad-hoc, seperti setelah grup atau produk baru ditambahkan ke organisasi.
Ini adalah contoh data mart terbaik yang cocok untuk berbagai lingkungan database dan penyelesaian implementasi yang cepat untuk organisasi mana pun. Ini juga memerlukan upaya pembersihan data yang paling sedikit. Hybrid Data mart juga mendukung struktur penyimpanan yang besar, dan paling cocok untuk aplikasi data-sentris yang lebih kecil dan fleksibel.
Langkah-Langkah Implementasi Datamart
Menerapkan Data Mart merupakan prosedur yang rumit namun menguntungkan. Berikut adalah langkah-langkah terperinci untuk menerapkan Data Mart:
Merancang
Perancangan adalah tahap pertama implementasi Data Mart. Ini mencakup semua tugas mulai dari memulai permintaan data mart hingga mengumpulkan informasi tentang persyaratan. Terakhir, kami membuat desain Data Mart yang logis dan fisik.
Langkah desain melibatkan tugas-tugas berikut:
- Mengumpulkan persyaratan bisnis & teknis dan Mengidentifikasi sumber data.
- Memilih subset data yang sesuai.
- Merancang struktur logis dan fisik data mart.
Data dapat dipartisi berdasarkan kriteria berikut:
- Tanggal
- Unit Bisnis atau Fungsional
- Geografi
- Kombinasi apa pun di atas
Data dapat dipartisi pada tingkat aplikasi atau DBMS. Meskipun disarankan untuk melakukan partisi pada tingkat Aplikasi karena memungkinkan model data yang berbeda setiap tahun seiring dengan perubahan lingkungan bisnis.
Produk dan Teknologi Apa yang Anda Butuhkan?
Pena dan kertas sederhana saja sudah cukup. Padahal alat yang membantu Anda membuat UML atau diagram UGD juga akan menambahkan data meta ke dalam desain logis dan fisik Anda.
Membangun
Ini adalah implementasi tahap kedua. Ini melibatkan penciptaan database fisik dan struktur logis.
Langkah ini melibatkan tugas-tugas berikut:
- Mengimplementasikan database fisik yang dirancang pada fase sebelumnya. Misalnya, objek skema database seperti tabel, indeks, tampilan, dll. dibuat.
Produk dan Teknologi Apa yang Anda Butuhkan?
Kamu butuh a sistem manajemen basis data relasional untuk membangun data mart. RDBMS memiliki beberapa fitur yang diperlukan untuk keberhasilan Data Mart.
- Manajemen Penyimpanan: RDBMS menyimpan dan mengelola data untuk membuat, menambah, dan menghapus data.
- Akses data cepat: Dengan kueri SQL Anda dapat dengan mudah mengakses data berdasarkan kondisi/filter tertentu.
- Perlindungan data: Sistem RDBMS juga menawarkan cara untuk pulih dari kegagalan sistem seperti kegagalan daya. Hal ini juga memungkinkan memulihkan data dari cadangan ini jika disk gagal.
- Dukungan multi-pengguna: Sistem manajemen data menawarkan akses bersamaan, kemampuan bagi banyak pengguna untuk mengakses dan mengubah data tanpa mengganggu atau menimpa perubahan yang dibuat oleh pengguna lain.
- Keamanan: Sistem RDMS juga menyediakan cara untuk mengatur akses pengguna terhadap objek dan jenis operasi tertentu.
Mengisi
Pada tahap ketiga, data dipopulasikan di data mart.
Langkah pengisian melibatkan tugas-tugas berikut:
- Sumber data ke data sasaran Pemetaan
- Ekstraksi data sumber
- Operasi pembersihan dan transformasi pada data
- Memuat data ke dalam data mart
- Membuat dan menyimpan metadata
Produk dan Teknologi Apa yang Anda Butuhkan?
Anda menyelesaikan tugas populasi ini menggunakan Alat ETL (Ekstrak Transform Load).. Alat ini memungkinkan Anda melihat sumber data, melakukan pemetaan sumber-ke-target, mengekstrak data, mengubah, membersihkannya, dan memuatnya kembali ke data mart.
Dalam prosesnya, alat tersebut juga membuat beberapa metadata yang berkaitan dengan hal-hal seperti dari mana data berasal, seberapa baru data tersebut, jenis perubahan apa yang dibuat pada data, dan tingkat ringkasan apa yang dilakukan.
Mengakses
Mengakses adalah langkah keempat yang melibatkan penggunaan data: menanyakan data, membuat laporan, bagan, dan menerbitkannya. Pengguna akhir mengirimkan kueri ke database dan menampilkan hasil kueri
Langkah pengaksesan perlu melakukan tugas-tugas berikut:
- Siapkan lapisan meta yang menerjemahkan struktur database dan nama objek ke dalam istilah bisnis. Ini membantu pengguna non-teknis untuk mengakses Data mart dengan mudah.
- Menyiapkan dan memelihara struktur database.
- Siapkan API dan antarmuka jika diperlukan
Produk dan Teknologi Apa yang Anda Butuhkan?
Anda dapat mengakses data mart menggunakan baris perintah atau GUI. GUI lebih disukai karena dapat dengan mudah menghasilkan grafik dan ramah pengguna dibandingkan dengan baris perintah.
Pelaksana
Ini adalah langkah terakhir dari proses Implementasi Data Mart. Langkah ini mencakup tugas-tugas manajemen seperti-
- Manajemen akses pengguna yang berkelanjutan.
- Optimalisasi dan penyempurnaan sistem untuk mencapai peningkatan kinerja.
- Menambah dan mengelola data baru ke dalam data mart.
- Merencanakan skenario pemulihan dan memastikan ketersediaan sistem jika sistem gagal.
Produk dan Teknologi Apa yang Anda Butuhkan?
Anda bisa menggunakan GUI atau baris perintah untuk manajemen data mart.
Praktik terbaik untuk Menerapkan Data Mart
Berikut ini adalah praktik terbaik yang perlu Anda ikuti saat dalam proses Implementasi Data Mart:
- Sumber Data Mart harus terstruktur secara departemen
- Siklus implementasi Data Mart harus diukur dalam periode waktu yang singkat, yaitu dalam hitungan minggu, bukan bulan atau tahun.
- Penting untuk melibatkan semua pemangku kepentingan dalam fase perencanaan dan perancangan karena implementasi data mart bisa jadi rumit.
- Biaya Perangkat Keras/Perangkat Lunak Data Mart, Jaringan dan Implementasi harus dianggarkan secara akurat dalam rencana Anda
- Meskipun jika Data mart dibuat pada perangkat keras yang sama, mereka mungkin memerlukan beberapa perangkat lunak berbeda untuk menangani pertanyaan pengguna. Persyaratan daya pemrosesan dan penyimpanan disk tambahan harus dievaluasi untuk respons pengguna yang cepat
- Data mart mungkin berada di lokasi yang berbeda dari gudang data. Itu sebabnya penting untuk memastikan bahwa mereka memiliki kapasitas jaringan yang cukup untuk menangani volume data yang diperlukan untuk mentransfer data ke data mart..
- Biaya implementasi harus memperhitungkan waktu yang dibutuhkan untuk proses pemuatan Datamart. Waktu pemuatan meningkat seiring dengan meningkatnya kompleksitas transformasi.
Keuntungan dan Kerugian Data Mart
Kelebihan
- Data mart berisi subset data seluruh organisasi. Data ini berharga bagi sekelompok orang tertentu dalam suatu organisasi.
- Ini merupakan alternatif yang hemat biaya dibandingkan a data warehouse, yang pembangunannya membutuhkan biaya tinggi.
- Data Mart memungkinkan akses Data yang lebih cepat.
- Data Mart mudah digunakan karena dirancang khusus untuk kebutuhan penggunanya. Dengan demikian data mart dapat mempercepat proses bisnis.
- Data Mart membutuhkan waktu implementasi yang lebih sedikit dibandingkan dengan sistem Data Warehouse. Implementasi Data Mart lebih cepat karena Anda hanya perlu memusatkan satu-satunya subset data.
- Ini berisi data historis yang memungkinkan analis menentukan tren data.
Kekurangan
- Seringkali perusahaan menciptakan terlalu banyak data mart yang berbeda dan tidak berhubungan tanpa banyak manfaat. Ini bisa menjadi rintangan besar untuk dipertahankan.
- Data Mart tidak dapat menyediakan layanan untuk seluruh perusahaan analisis data karena kumpulan data mereka terbatas.
Ringkasan
- Definisikan Data Mart: Data Mart didefinisikan sebagai bagian dari Gudang Data yang berfokus pada satu area fungsional suatu organisasi.
- Data Mart membantu meningkatkan waktu respons pengguna karena pengurangan volume data.
- Tiga jenis data mart adalah 1) Dependent 2) Independent 3) Hybrid
- Langkah-langkah implementasi Data Mart yang penting adalah 1) Merancang 2) Membangun 3 Mengisi 4) Mengakses dan 5) Mengelola
- Siklus implementasi Data Mart harus diukur dalam periode waktu yang singkat, yaitu dalam hitungan minggu, bukan bulan atau tahun.
- Data mart adalah alternatif hemat biaya dibandingkan gudang data, yang memerlukan biaya tinggi untuk membangunnya.
- Data Mart tidak dapat menyediakan analisis data seluruh perusahaan karena kumpulan datanya terbatas.