Lược đồ hình sao trong mô hình kho dữ liệu là gì?

Lược đồ sao là gì?

Lược đồ sao trong kho dữ liệu, là một lược đồ trong đó tâm của ngôi sao có thể có một bảng dữ kiện và một số bảng chiều liên quan. Nó được gọi là lược đồ hình sao vì cấu trúc của nó giống một ngôi sao. Mô hình dữ liệu Lược đồ sao là loại lược đồ Kho dữ liệu đơn giản nhất. Nó còn được gọi là Lược đồ Star Join và được tối ưu hóa để truy vấn các tập dữ liệu lớn.

Lược đồ đa chiều là gì?

Lược đồ đa chiều được thiết kế đặc biệt để mô hình hóa các hệ thống kho dữ liệu. Các lược đồ được thiết kế để giải quyết các nhu cầu riêng biệt của cơ sở dữ liệu rất lớn được thiết kế cho mục đích phân tích (OLAP).

Các loại lược đồ kho dữ liệu:

Sau đây là 3 loại lược đồ đa chiều chính, mỗi loại có những ưu điểm riêng.

Ví dụ về mô hình hóa dữ liệu lược đồ hình sao

Trong ví dụ Sơ đồ ngôi sao sau đây, bảng dữ kiện nằm ở trung tâm chứa các khóa cho mọi bảng thứ nguyên như Dealer_ID, Model ID, Date_ID, Product_ID, Branch_ID và các thuộc tính khác như Số lượng bán ra và doanh thu.

Mô hình hóa dữ liệu lược đồ sao
Ví dụ về sơ đồ sao

Bảng sự kiện

Bảng Sự kiện trong lược đồ hình sao chứa các sự kiện và được kết nối với các thứ nguyên. Một bảng sự kiện có hai loại cột:

  • Một cột bao gồm Sự kiện
  • Khóa ngoại cho bảng kích thước

Nói chung, khóa chính của bảng dữ kiện là khóa tổng hợp được tạo thành từ tất cả các khóa ngoại tạo nên bảng.

Bảng sự kiện có thể chứa các sự kiện ở cấp độ chi tiết hoặc sự kiện tổng hợp. Các bảng sự kiện bao gồm các sự kiện tổng hợp thường được gọi là bảng tóm tắt. Bảng sự kiện thường chứa các sự kiện đã được tổng hợp ở một mức độ nào đó.

Bảng kích thước

Một chiều là một kiến ​​trúc phân loại dữ liệu theo thứ bậc. Một chiều không có thứ bậc và cấp độ được gọi là chiều phẳng hoặc danh sách. Khóa chính của mỗi bảng chiều là một phần của khóa chính tổng hợp của bảng dữ kiện. Thuộc tính chiều là thuộc tính mô tả, dạng văn bản giúp mô tả giá trị chiều. Bảng dữ kiện thường lớn hơn bảng chiều.

Đặc điểm của lược đồ sao

  • Mọi chiều trong lược đồ sao được biểu diễn bằng bảng một chiều duy nhất.
  • Bảng thứ nguyên phải chứa tập hợp các thuộc tính.
  • Bảng thứ nguyên được nối với bảng dữ kiện bằng khóa ngoại
  • Bảng kích thước không được nối với nhau
  • Bảng thực tế sẽ chứa khóa và thước đo
  • Lược đồ Star rất dễ hiểu và cung cấp cách sử dụng đĩa tối ưu.
  • Các bảng kích thước không được chuẩn hóa. Ví dụ: trong hình trên, Country_ID không có bảng tra cứu Quốc gia như thiết kế OLTP sẽ có.
  • Lược đồ được hỗ trợ rộng rãi bởi BI Tools

Ưu điểm của Lược đồ sao

  • Lược đồ hình sao có logic nối đơn giản hơn so với các lược đồ khác để tìm nạp dữ liệu từ các lược đồ giao dịch được chuẩn hóa cao.
  • Ngược lại với các lược đồ giao dịch được chuẩn hóa cao, lược đồ hình sao đơn giản hóa logic báo cáo kinh doanh phổ biến, chẳng hạn như báo cáo và theo từng giai đoạn.
  • Lược đồ hình sao được các hệ thống OLAP sử dụng rộng rãi để thiết kế các hình khối một cách hiệu quả. Lược đồ sao có thể được sử dụng làm nguồn mà không cần thiết kế cấu trúc khối trong hầu hết các hệ thống OLAP chính.
  • Bằng cách kích hoạt các sơ đồ hiệu suất cụ thể có thể áp dụng cho các truy vấn, phần mềm bộ xử lý truy vấn trong Lược đồ hình sao có thể đưa ra các kế hoạch thực hiện tốt hơn.

Nhược điểm của lược đồ sao

  • Vì lược đồ có tính phi chuẩn hóa cao nên tính toàn vẹn dữ liệu không được thực thi tốt.
  • Không linh hoạt về nhu cầu phân tích.
  • Lược đồ hình sao không củng cố mối quan hệ nhiều-nhiều trong các thực thể kinh doanh.

Tóm tắt bài viết này với: