88 câu hỏi và câu trả lời phỏng vấn về mô hình hóa dữ liệu hàng đầu (2024)
Câu hỏi và câu trả lời phỏng vấn về mô hình hóa dữ liệu dành cho người mới
1) Mô hình hóa dữ liệu là gì?
Mô hình hóa dữ liệu là quá trình tạo mô hình để dữ liệu được lưu trữ trong cơ sở dữ liệu. Nó là sự biểu diễn mang tính khái niệm của các đối tượng dữ liệu, sự liên kết giữa các đối tượng dữ liệu khác nhau và các quy tắc.
2) Giải thích các loại mô hình dữ liệu
Chủ yếu có ba loại mô hình dữ liệu khác nhau:
Khái niệm: Mô hình dữ liệu khái niệm xác định hệ thống nên chứa những gì. Mô hình này thường được tạo ra bởi các bên liên quan trong doanh nghiệp và kiến trúc sư dữ liệu. Mục đích là để tổ chức, xác định phạm vi và định nghĩa các khái niệm và quy tắc kinh doanh.
Hợp lý: Xác định cách hệ thống nên được thực hiện bất kể DBMS. Mô hình này thường được tạo ra bởi các kiến trúc sư dữ liệu và nhà phân tích kinh doanh. Mục đích là phát triển bản đồ kỹ thuật về các quy tắc và cấu trúc dữ liệu.
Vật lý: Mô hình dữ liệu này mô tả cách hệ thống sẽ được triển khai bằng hệ thống DBMS cụ thể. Mô hình này thường được tạo bởi DBA và các nhà phát triển. Mục đích là việc thực hiện thực tế của cơ sở dữ liệu.
3) Giải thích sự kiện và bảng sự việc
Thực tế đại diện cho dữ liệu định lượng. Ví dụ: số tiền ròng đến hạn. Bảng dữ kiện chứa dữ liệu số cũng như khóa ngoại từ bảng chiều.
4) Liệt kê các lược đồ thiết kế khác nhau trong mô hình hóa dữ liệu
Có hai loại lược đồ mô hình hóa dữ liệu khác nhau: 1) Lược đồ hình sao và 2) Lược đồ bông tuyết
5) Khi nào bạn nên xem xét việc không chuẩn hóa?
Tính năng không chuẩn hóa được sử dụng khi có nhiều sự tham gia của bảng trong khi truy xuất dữ liệu. Nó được sử dụng để xây dựng một kho dữ liệu.
6) Giải thích thứ nguyên và thuộc tính
Kích thước đại diện cho dữ liệu định tính. Ví dụ: sản phẩm, lớp, gói, v.v. Bảng thứ nguyên có các thuộc tính văn bản hoặc mô tả. Ví dụ: danh mục sản phẩm và tên sản phẩm là hai thuộc tính của bảng thứ nguyên sản phẩm.
7) Sự thật ít sự thật là gì?
Thực tế ít thực tế là một bảng không có phép đo thực tế. Nó chỉ chứa các phím kích thước.
8) Phân tích trong bộ nhớ là gì?
Phân tích trong bộ nhớ là một quá trình lưu cơ sở dữ liệu vào bộ nhớ đệm trong RAM.
9) Sự khác biệt giữa OLTP và OLAP là gì?
Dưới đây là sự khác biệt giữa OLAP và OLTP:
OLTP | OLAP |
---|---|
OLTP là một hệ thống giao dịch trực tuyến. | OLAP là một quá trình phân tích và truy xuất dữ liệu trực tuyến. |
Nó được đặc trưng bởi một số lượng lớn các giao dịch trực tuyến ngắn. | Nó được đặc trưng bởi một khối lượng lớn dữ liệu. |
OLTP sử dụng DBMS truyền thống. | OLAP sử dụng kho dữ liệu. |
Các bảng trong cơ sở dữ liệu OLTP được chuẩn hóa. | Các bảng trong OLAP không được chuẩn hóa. |
Thời gian phản hồi của nó tính bằng mili giây. | Thời gian phản hồi của nó tính bằng giây đến vài phút. |
OLTP được thiết kế cho hoạt động kinh doanh theo thời gian thực. | OLAP được thiết kế để phân tích các biện pháp kinh doanh theo danh mục và thuộc tính. |
10) Bàn là gì?
Tập hợp các hàng và cột được gọi là bảng. Mỗi cột có một kiểu dữ liệu. Bảng chứa dữ liệu liên quan ở định dạng bảng.
11) Cột là gì?
Cột hoặc trường là sự sắp xếp dữ liệu theo chiều dọc chứa thông tin liên quan.
12) Xác định độ thưa thớt dữ liệu
Độ thưa thớt dữ liệu là thuật ngữ được sử dụng cho lượng dữ liệu bạn có cho thực thể/thứ nguyên của mô hình.
13) Khóa chính tổng hợp là gì?
Khóa chính tổng hợp được dùng để chỉ trường hợp có nhiều hơn một cột trong bảng được sử dụng làm một phần của khóa chính.
14) Khóa chính là gì?
Khóa chính là một cột hoặc nhóm các cột xác định không đồng đều từng hàng trong bảng. Giá trị của khóa chính không được rỗng. Mỗi bảng phải chứa một khóa chính.
15) Giải thích khóa ngoại
Khóa ngoại là một nhóm các thuộc tính được sử dụng để liên kết bảng cha và bảng con. Giá trị của cột khóa ngoại có sẵn trong bảng con được tham chiếu đến giá trị của khóa chính trong bảng cha.
16) Siêu dữ liệu là gì?
Siêu dữ liệu mô tả dữ liệu về dữ liệu. Nó cho thấy loại dữ liệu nào thực sự được lưu trữ trong hệ thống cơ sở dữ liệu.
17) Siêu thị dữ liệu là gì?
A dữ liệu mart là phiên bản thu gọn của kho dữ liệu và được thiết kế để sử dụng bởi một bộ phận, đơn vị hoặc nhóm người dùng cụ thể trong một tổ chức. Ví dụ: tiếp thị bán hàng, nhân sự hoặc tài chính.
18) OLTP là gì?
Xử lý giao dịch trực tuyến, được gọi ngắn gọn là OLTP, hỗ trợ ứng dụng hướng giao dịch trong kiến trúc 3 tầng. OLTP quản lý giao dịch hàng ngày của công ty hoặc tổ chức.
19) Ví dụ về hệ thống OLTP là gì?
Ví dụ về hệ thống OLTP là:
- Gửi tin nhắn văn bản
- Thêm sách vào giỏ hàng
- Đặt vé máy bay trực tuyến
- Ngân hàng trực tuyến
- Nhập đơn hàng
20) Ràng buộc kiểm tra là gì?
Ràng buộc kiểm tra được sử dụng để xác minh một phạm vi giá trị trong một cột.
21) Liệt kê các loại chuẩn hóa?
Các loại chuẩn hóa là: 1) dạng chuẩn thứ nhất, 2) dạng chuẩn thứ hai, 3) dạng chuẩn thứ ba, 4) dạng chuẩn thứ tư boyce-codd và 5) dạng chuẩn thứ năm.
22) Kỹ thuật dữ liệu chuyển tiếp là gì?
Kỹ thuật chuyển tiếp là một thuật ngữ kỹ thuật được sử dụng để mô tả quá trình chuyển một mô hình logic thành một thực hiện vật lý một cách tự động.
23) PDAP là gì?
Nó là một khối dữ liệu lưu trữ dữ liệu dưới dạng tóm tắt. Nó giúp người dùng phân tích dữ liệu một cách nhanh chóng. Dữ liệu trong PDAP được lưu trữ theo cách có thể thực hiện báo cáo một cách dễ dàng.
24) Giải thích thiết kế cơ sở dữ liệu lược đồ bông tuyết
Lược đồ bông tuyết là sự sắp xếp của bảng thứ nguyên và bảng dữ kiện. Nói chung, cả hai bảng đều được chia nhỏ thành nhiều bảng thứ nguyên hơn.
25) Giải thích dịch vụ phân tích
Dịch vụ phân tích cung cấp chế độ xem kết hợp dữ liệu được sử dụng trong khai thác dữ liệu hoặc OLAP.
26) Thuật toán phân cụm tuần tự là gì?
Thuật toán phân cụm trình tự thu thập các đường dẫn tương tự hoặc liên quan với nhau và các chuỗi dữ liệu có sự kiện.
27) Dữ liệu rời rạc và liên tục là gì?
Dữ liệu rời rạc là dữ liệu hữu hạn hoặc dữ liệu được xác định. Ví dụ: giới tính, số điện thoại. Dữ liệu liên tục là dữ liệu thay đổi một cách liên tục và có trật tự. Ví dụ, tuổi tác.
28) Thuật toán chuỗi thời gian là gì?
Thuật toán chuỗi thời gian là phương pháp dự đoán giá trị liên tục của dữ liệu trong bảng. Ví dụ: Hiệu suất một nhân viên có thể dự báo lợi nhuận hoặc ảnh hưởng.
29) Kinh doanh thông minh là gì?
BI (Business Intelligence) là một tập hợp các quy trình, kiến trúc và công nghệ chuyển đổi dữ liệu thô thành thông tin có ý nghĩa thúc đẩy các hành động kinh doanh có lợi nhuận. Đây là một bộ phần mềm và dịch vụ để chuyển đổi dữ liệu thành thông tin và kiến thức có thể hành động được.
30) Chỉ số ánh xạ bit là gì?
Chỉ mục bitmap là một loại chỉ mục cơ sở dữ liệu đặc biệt sử dụng bitmap (mảng bit) để trả lời các truy vấn bằng cách thực hiện các hoạt động bitwise.
Câu hỏi và câu trả lời phỏng vấn về lập mô hình dữ liệu dành cho người có kinh nghiệm
31) Giải thích chi tiết về kho dữ liệu
Kho dữ liệu là một quy trình thu thập và quản lý dữ liệu từ nhiều nguồn khác nhau. Nó cung cấp những hiểu biết có ý nghĩa về doanh nghiệp. Kho dữ liệu thường được sử dụng để kết nối và phân tích dữ liệu từ nhiều nguồn không đồng nhất. Đây là cốt lõi của hệ thống BI, được xây dựng để phân tích và báo cáo dữ liệu.
32) Kích thước rác là gì?
Thứ nguyên rác kết hợp hai hoặc nhiều lượng số liên quan vào một thứ nguyên. Nó thường là giá trị Boolean hoặc cờ.
33) Giải thích sơ đồ dữ liệu
Lược đồ dữ liệu là một biểu diễn sơ đồ minh họa các mối quan hệ và cấu trúc dữ liệu.
34) Giải thích tần suất thu thập dữ liệu
Tần suất thu thập dữ liệu là tốc độ thu thập dữ liệu. Nó cũng trải qua nhiều giai đoạn khác nhau. Các giai đoạn này là: 1) trích xuất từ nhiều nguồn khác nhau, 3) chuyển đổi, 4) làm sạch và 5) lưu trữ.
35) Số lượng cơ sở dữ liệu là gì?
Số lượng là một thuộc tính số của mối quan hệ giữa hai thực thể hoặc tập thực thể.
36) Các loại mối quan hệ chính yếu khác nhau là gì?
Các loại mối quan hệ then chốt khác nhau là:
- Mối quan hệ một-một
- Mối quan hệ một-nhiều
- Mối quan hệ nhiều-một
- Mối quan hệ nhiều-nhiều
37) Xác định Yếu tố thành công quan trọng và liệt kê bốn loại của nó
Yếu tố thành công quan trọng là kết quả thuận lợi của bất kỳ hoạt động nào cần thiết để tổ chức đạt được mục tiêu của mình.
Bốn loại yếu tố thành công quan trọng là:
- CSF ngành
- CSF chiến lược
- CSF môi trường
- CSF tạm thời
38) Khai thác dữ liệu là gì?
Khai thác dữ liệu là một kỹ năng đa ngành sử dụng máy học, thống kê, AI và công nghệ cơ sở dữ liệu. Đó là tất cả về việc khám phá các mối quan hệ không bị nghi ngờ/chưa được biết trước đây giữa các dữ liệu.
39) Sự khác biệt giữa lược đồ Ngôi sao và lược đồ Bông tuyết là gì?
Sau đây là một sự khác biệt quan trọng giữa Lược đồ sao và lược đồ bông tuyết:
Lược đồ sao | Lược đồ bông tuyết |
---|---|
Hệ thống phân cấp cho các chiều được lưu trữ trong bảng chiều. | Hệ thống phân cấp được chia thành các bảng riêng biệt. |
Nó chứa một bảng sự kiện được bao quanh bởi các bảng thứ nguyên. | Một bảng thực tế được bao quanh bởi bảng thứ nguyên, bảng này lần lượt được bao quanh bởi bảng thứ nguyên |
Trong lược đồ hình sao, chỉ một phép nối duy nhất tạo ra mối quan hệ giữa bảng dữ kiện và bất kỳ bảng thứ nguyên nào. | Lược đồ bông tuyết yêu cầu nhiều phép nối để tìm nạp dữ liệu. |
Nó có thiết kế cơ sở dữ liệu đơn giản | Nó có thiết kế cơ sở dữ liệu phức tạp |
Cấu trúc dữ liệu và truy vấn không chuẩn hóa cũng chạy nhanh hơn. | Cấu trúc dữ liệu chuẩn hóa. |
Mức độ dư thừa dữ liệu cao | Dự phòng dữ liệu ở mức độ rất thấp |
Cung cấp các truy vấn có hiệu suất cao hơn bằng cách sử dụng Tối ưu hóa truy vấn Star Join. Các bảng có thể được kết nối với nhiều chiều. | Lược đồ Bông tuyết được thể hiện bằng một bảng dữ kiện tập trung, khó có thể kết nối với nhiều chiều. |
40) Xác định mối quan hệ là gì?
Xác định mối quan hệ thực thể trong DBMS được sử dụng để xác định mối quan hệ giữa hai thực thể: 1) thực thể mạnh và 2) thực thể yếu.
41) Mối quan hệ tự đệ quy là gì?
Mối quan hệ đệ quy là một cột độc lập trong bảng được kết nối với khóa chính của cùng một bảng.
42) Giải thích mô hình dữ liệu quan hệ
Mô hình hóa dữ liệu quan hệ là sự biểu diễn các đối tượng trong cơ sở dữ liệu quan hệ, thường được chuẩn hóa.
43) Phân tích mô hình dự đoán là gì?
Quá trình xác nhận hoặc thử nghiệm một mô hình được sử dụng để dự đoán kết quả thử nghiệm và xác nhận. Nó có thể được sử dụng cho máy học, trí tuệ nhân tạo cũng như thống kê.
44) Sự khác biệt giữa mô hình dữ liệu logic và mô hình dữ liệu vật lý là gì?
Mô hình dữ liệu logic | Mô hình dữ liệu vật lý |
---|---|
Một mô hình dữ liệu logic có thể thiết kế các yêu cầu kinh doanh một cách logic. | Mô hình dữ liệu vật lý cung cấp thông tin về nguồn cơ sở dữ liệu đích và các thuộc tính của nó. |
Nó chịu trách nhiệm thực hiện thực tế dữ liệu được lưu trữ trong cơ sở dữ liệu. | Mô hình dữ liệu vật lý giúp bạn tạo mô hình cơ sở dữ liệu mới từ hiện có và áp dụng ràng buộc toàn vẹn tham chiếu. |
Nó chứa một thực thể, thuộc tính khóa chính, khóa đảo ngược, khóa thay thế, quy tắc, quan hệ kinh doanh, định nghĩa, v.v. | Mô hình dữ liệu vật lý chứa một bảng, các ràng buộc khóa, khóa duy nhất, cột, khóa ngoại, chỉ mục, giá trị mặc định, v.v. |
45) Các loại ràng buộc khác nhau là gì?
Một loại ràng buộc khác có thể là duy nhất, giá trị null, khóa ngoại, khóa tổng hợp hoặc ràng buộc kiểm tra, v.v.
46) Công cụ mô hình hóa dữ liệu là gì?
Công cụ mô hình hóa dữ liệu là phần mềm giúp xây dựng luồng dữ liệu và mối quan hệ giữa các dữ liệu. Ví dụ về các công cụ như vậy là Borland Together, Altova Database Spy, casewise, Case Studio 2, v.v.
47) DBMS phân cấp là gì?
Trong cơ sở dữ liệu phân cấp, dữ liệu mô hình được tổ chức theo cấu trúc dạng cây. Dữ liệu được lưu trữ theo định dạng phân cấp. Dữ liệu được biểu diễn bằng mối quan hệ cha-con. Trong DBMS phân cấp, cha có thể có nhiều con, con chỉ có một cha.
48) Nhược điểm của mô hình dữ liệu phân cấp là gì?
Nhược điểm của mô hình dữ liệu phân cấp là:
- Nó không linh hoạt vì cần có thời gian để thích ứng với nhu cầu thay đổi của doanh nghiệp.
- Cấu trúc này đặt ra vấn đề về liên lạc giữa các bộ phận, liên lạc theo chiều dọc cũng như liên lạc giữa các cơ quan.
- Mô hình dữ liệu phân cấp có thể tạo ra vấn đề mất thống nhất.
49) Giải thích cách tiếp cận mô hình hóa dữ liệu theo hướng quy trình
Cách tiếp cận theo hướng quy trình được sử dụng trong mô hình hóa dữ liệu tuân theo phương pháp từng bước về mối quan hệ giữa mô hình mối quan hệ thực thể và quy trình tổ chức.
50) Ưu điểm của việc sử dụng mô hình hóa dữ liệu là gì?
Ưu điểm của việc sử dụng mô hình hóa dữ liệu trong kho dữ liệu là:
- Nó giúp bạn quản lý dữ liệu kinh doanh bằng cách chuẩn hóa dữ liệu và xác định các thuộc tính của nó.
- Mô hình hóa dữ liệu tích hợp dữ liệu của các hệ thống khác nhau để giảm sự dư thừa dữ liệu.
- Nó cho phép tạo ra thiết kế cơ sở dữ liệu hiệu quả.
- Mô hình hóa dữ liệu giúp bộ phận tổ chức hoạt động như một nhóm.
- Nó tạo điều kiện để truy cập dữ liệu một cách dễ dàng.
51) Nhược điểm của việc sử dụng mô hình dữ liệu là gì?
Nhược điểm của việc sử dụng mô hình dữ liệu là:
- Nó có ít tính độc lập về cấu trúc hơn
- Nó có thể làm cho hệ thống trở nên phức tạp.
52) Chỉ mục là gì?
Index dùng cho một cột hoặc một nhóm cột để lấy dữ liệu nhanh.
53) Các đặc điểm của mô hình dữ liệu logic là gì?
Đặc điểm của mô hình dữ liệu logic là:
- Mô tả nhu cầu dữ liệu cho một dự án nhưng có thể tích hợp với các mô hình dữ liệu logic khác dựa trên phạm vi của dự án.
- Được thiết kế và phát triển độc lập với DBMS.
- Thuộc tính dữ liệu sẽ có kiểu dữ liệu với độ chính xác và độ dài chính xác.
- Các quy trình chuẩn hóa cho mô hình thường được áp dụng cho đến 3NF.
54) Đặc điểm của mô hình dữ liệu vật lý là gì?
Đặc điểm của mô hình dữ liệu vật lý là:
- Mô hình dữ liệu vật lý mô tả nhu cầu dữ liệu cho một dự án hoặc ứng dụng. Nó có thể được tích hợp với các mô hình dữ liệu vật lý khác dựa trên phạm vi dự án.
- Mô hình dữ liệu chứa các mối quan hệ giữa các bảng nhằm giải quyết tính chính yếu và tính vô hiệu của các mối quan hệ.
- Được phát triển cho một phiên bản cụ thể của DBMS, vị trí, lưu trữ dữ liệu hoặc công nghệ sẽ được sử dụng trong dự án.
- Các cột phải có kiểu dữ liệu chính xác, độ dài được chỉ định và giá trị mặc định.
- Khóa chính và khóa ngoài, chế độ xem, chỉ mục, hồ sơ truy cập và ủy quyền, v.v. đều được xác định.
55) Hai loại kỹ thuật lập mô hình dữ liệu là gì?
Hai loại kỹ thuật lập mô hình dữ liệu là: 1) Mô hình mối quan hệ thực thể (ER) và 2) UML (Ngôn ngữ mô hình thống nhất).
56) UML là gì?
UML (Ngôn ngữ mô hình hóa thống nhất) là ngôn ngữ mô hình hóa, phát triển cơ sở dữ liệu có mục đích chung trong lĩnh vực công nghệ phần mềm. Mục đích chính là cung cấp một cách tổng quát để trực quan hóa thiết kế hệ thống.
57) Giải thích mô hình cơ sở dữ liệu hướng đối tượng
Mô hình cơ sở dữ liệu hướng đối tượng là một tập hợp các đối tượng. Các đối tượng này có thể có các tính năng cũng như phương thức liên quan.
58) Mô hình mạng là gì?
Đây là mô hình được xây dựng trên mô hình phân cấp. Nó cho phép nhiều hơn một mối quan hệ liên kết các bản ghi, điều này cho biết rằng nó có nhiều bản ghi. Có thể xây dựng một tập hợp các bản ghi cha và bản ghi con. Mỗi bản ghi có thể thuộc về nhiều tập hợp cho phép bạn thực hiện các mối quan hệ bảng phức tạp.
59) Băm là gì?
Băm là một kỹ thuật được sử dụng để tìm kiếm tất cả giá trị chỉ mục và truy xuất dữ liệu mong muốn. Nó giúp tính toán vị trí trực tiếp của dữ liệu được ghi trên đĩa mà không cần sử dụng cấu trúc chỉ mục.
60) Khóa kinh doanh hoặc khóa tự nhiên là gì?
khóa doanh nghiệp hoặc khóa tự nhiên là trường xác định duy nhất một thực thể. Ví dụ: ID khách hàng, số nhân viên, email, v.v.
61) Khóa ghép là gì?
Khi có nhiều hơn một trường được sử dụng để biểu thị một khóa, nó được gọi là khóa ghép.
62) Dạng bình thường đầu tiên là gì?
Dạng chuẩn đầu tiên hoặc 1NF là một thuộc tính của một quan hệ có sẵn trong hệ thống quản lý cơ sở dữ liệu quan hệ. Bất kỳ quan hệ nào được gọi là dạng chuẩn đầu tiên nếu miền của mọi thuộc tính chứa các giá trị là nguyên tử. Nó chứa một giá trị từ miền đó.
63) Sự khác biệt giữa khóa chính và khóa ngoại là gì?
Khóa chính | Khóa ngoại |
---|---|
Khóa chính giúp bạn xác định duy nhất một bản ghi trong bảng. | Khóa ngoại là một trường trong bảng và là khóa chính của bảng khác. |
Khóa chính không bao giờ chấp nhận giá trị null. | Khóa ngoại có thể chấp nhận nhiều giá trị null. |
Khóa chính là một chỉ mục được nhóm và dữ liệu trong bảng DBMS được tổ chức vật lý theo trình tự của chỉ mục được nhóm. | Khóa ngoại không thể tự động tạo chỉ mục, được nhóm hoặc không được nhóm. Tuy nhiên, bạn có thể tạo chỉ mục trên khóa ngoại theo cách thủ công. |
Bạn có thể có một khóa Chính duy nhất trong một bảng. | Bạn có thể có nhiều khóa ngoại trong một bảng. |
64) Các yêu cầu của dạng chuẩn thứ hai là gì?
Các yêu cầu của dạng chuẩn thứ hai là:
- Nó phải ở dạng bình thường đầu tiên.
- Nó không chứa bất kỳ thuộc tính không phải số nguyên tố nào, thuộc tính này phụ thuộc về mặt chức năng vào bất kỳ tập hợp con nào của khóa ứng cử viên của quan hệ bảng.
65) Các quy tắc cho dạng chuẩn thứ ba là gì?
Quy tắc cho các hình thức bình thường thứ ba là:
- Nó phải ở dạng bình thường thứ hai
- Nó không có sự phụ thuộc chức năng bắc cầu.
66) Tầm quan trọng của việc sử dụng chìa khóa là gì?
- Các phím giúp bạn xác định bất kỳ hàng dữ liệu nào trong bảng. Trong ứng dụng thực tế, một bảng có thể chứa hàng nghìn bản ghi.
- Khóa đảm bảo rằng bạn có thể xác định duy nhất một bản ghi bảng bất chấp những thách thức này.
- Cho phép bạn thiết lập mối quan hệ và xác định mối quan hệ giữa các bảng
- Giúp bạn thực thi danh tính và tính toàn vẹn trong mối quan hệ.
67) Khóa thay thế là gì?
Khóa nhân tạo nhằm mục đích xác định duy nhất từng bản ghi được gọi là khóa thay thế. Những loại khóa này là duy nhất vì chúng được tạo khi bạn không có bất kỳ khóa chính tự nhiên nào. Chúng không mang lại bất kỳ ý nghĩa nào cho dữ liệu trong bảng. Khóa thay thế thường là số nguyên.
68) Giải thích chi tiết về khóa thay thế
Khóa thay thế là một cột hoặc nhóm cột trong bảng xác định duy nhất mỗi hàng trong bảng đó. Một bảng có thể có nhiều lựa chọn cho khóa chính, nhưng chỉ có thể đặt một lựa chọn làm khóa chính. Tất cả các khóa không phải là khóa chính được gọi là Khóa thay thế.
69) Dạng chuẩn thứ tư trong DBMS là gì?
Dạng chuẩn thứ tư là mức chuẩn hóa cơ sở dữ liệu trong đó không được có sự phụ thuộc tầm thường nào ngoài khóa ứng viên.
70) Hệ thống quản lý cơ sở dữ liệu là gì?
Hệ thống quản lý cơ sở dữ liệu hay DBMS là phần mềm lưu trữ và truy xuất dữ liệu người dùng. Nó bao gồm một nhóm các chương trình thao tác cơ sở dữ liệu.
71) Quy tắc của dạng chuẩn thứ năm là gì?
Một bàn ở 5th dạng bình thường chỉ khi nó ở dạng 4th dạng bình thường và nó không thể bị phân tách thành bất kỳ số lượng bảng nhỏ hơn nào mà không mất dữ liệu.
72) Bình thường hóa là gì?
Bình thường hóa là một kỹ thuật thiết kế cơ sở dữ liệu nhằm tổ chức các bảng theo cách giảm sự dư thừa và phụ thuộc của dữ liệu. Nó chia các bảng lớn hơn thành các bảng nhỏ hơn và liên kết chúng bằng các mối quan hệ.
73) Giải thích các đặc điểm của hệ thống quản lý cơ sở dữ liệu
- Cung cấp bảo mật và loại bỏ dư thừa
- Bản chất tự mô tả của hệ thống cơ sở dữ liệu
- Cách ly giữa các chương trình và sự trừu tượng hóa dữ liệu
- Hỗ trợ nhiều chế độ xem dữ liệu.
- Chia sẻ dữ liệu và xử lý giao dịch nhiều người dùng
- DBMS cho phép các thực thể và mối quan hệ giữa chúng tạo thành các bảng.
- Nó tuân theo khái niệm ACID (Atombăng giá, tính nhất quán, sự cô lập và độ bền).
- DBMS hỗ trợ môi trường nhiều người dùng cho phép người dùng truy cập, truy cập và thao tác dữ liệu song song.
74) Liệt kê các phần mềm DBMS phổ biến
Phổ biến Phần mềm DBMS là:
- MySQL
- Microsoft Truy Cập
- Oracle
- PostgreSQL
- cơ sở dữ liệu
- Foxpro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Giải thích khái niệm RDBMS
Hệ thống quản lý cơ sở dữ liệu quan hệ là phần mềm dùng để lưu trữ dữ liệu dưới dạng bảng. Trong loại hệ thống này, dữ liệu được quản lý và lưu trữ theo hàng và cột, được gọi là bộ dữ liệu và thuộc tính. RDBMS là một hệ thống quản lý dữ liệu mạnh mẽ và được sử dụng rộng rãi trên toàn thế giới.
76) Ưu điểm của mô hình dữ liệu là gì?
Ưu điểm của mô hình dữ liệu là:
- Mục tiêu chính của việc thiết kế mô hình dữ liệu là đảm bảo rằng các đối tượng dữ liệu do nhóm chức năng cung cấp được thể hiện chính xác.
- Mô hình dữ liệu phải đủ chi tiết để sử dụng cho việc xây dựng cơ sở dữ liệu vật lý.
- Thông tin trong mô hình dữ liệu có thể được sử dụng để xác định mối quan hệ giữa các bảng, khóa chính và khóa ngoại cũng như các thủ tục được lưu trữ.
- Mô hình dữ liệu giúp doanh nghiệp giao tiếp trong và giữa các tổ chức.
- Mô hình dữ liệu giúp ghi lại ánh xạ dữ liệu trong quy trình ETL
- Giúp nhận biết nguồn dữ liệu chính xác để đưa vào mô hình
77) Nhược điểm của Mô hình Dữ liệu là gì?
Nhược điểm của mô hình dữ liệu là:
- Để phát triển mô hình Dữ liệu, người ta cần biết các đặc tính lưu trữ dữ liệu vật lý.
- Đây là một hệ thống định hướng tạo ra sự phát triển ứng dụng phức tạp, quản lý. Do đó, nó đòi hỏi kiến thức về sự thật tiểu sử.
- Ngay cả những thay đổi nhỏ hơn được thực hiện trong cấu trúc cũng đòi hỏi phải sửa đổi trong toàn bộ ứng dụng.
- Không có bộ ngôn ngữ thao tác dữ liệu trong DBMS.
78) Giải thích các loại bảng sự kiện
Có ba loại bảng sự kiện:
- Phụ gia: Đó là một thước đo được thêm vào bất kỳ chiều nào.
- Không phụ gia: Đó là thước đo không thể thêm vào bất kỳ chiều hướng nào.
- Bán phụ gia: Đó là một thước đo có thể được thêm vào một vài chiều.
79) Bảng tổng hợp là gì?
Bảng tổng hợp chứa dữ liệu tổng hợp có thể được tính toán bằng các hàm như: 1) Trung bình 2) MAX, 3) Đếm, 4) SUM, 5) SUM và 6) MIN.
80) Kích thước được xác nhận là gì?
Thứ nguyên phù hợp là thứ nguyên được thiết kế theo cách có thể được sử dụng trên nhiều bảng thực tế trong các khu vực khác nhau của kho dữ liệu.
81) Liệt kê các loại Phân cấp trong mô hình dữ liệu
Có hai loại Phân cấp: 1) Phân cấp theo cấp độ và 2) Phân cấp cha-con.
82) Sự khác biệt giữa siêu thị dữ liệu và kho dữ liệu là gì?
Đây là phần chính sự khác biệt giữa Data Mart và Data Warehouse:
Dữ liệu Mart | Kho dữ liệu |
---|---|
Data mart tập trung vào một lĩnh vực kinh doanh duy nhất. | Kho dữ liệu tập trung vào nhiều lĩnh vực kinh doanh. |
Nó được sử dụng để đưa ra các quyết định chiến thuật cho sự phát triển kinh doanh. | Nó giúp chủ doanh nghiệp đưa ra quyết định chiến lược |
Data mart theo mô hình từ dưới lên | Kho dữ liệu theo mô hình từ trên xuống |
Nguồn dữ liệu đến từ một nguồn dữ liệu | Nguồn dữ liệu đến từ nhiều nguồn dữ liệu không đồng nhất. |
83) XMLA là gì?
XMLA là một phân tích XML được coi là tiêu chuẩn để truy cập dữ liệu trong Xử lý phân tích trực tuyến (OLAP).
84) Giải thích kích thước rác
Kích thước rác giúp lưu trữ dữ liệu. Nó được sử dụng khi dữ liệu không thích hợp để lưu trữ trong lược đồ.
85) Giải thích việc sao chép dữ liệu theo chuỗi
Tình huống khi nút phụ chọn mục tiêu bằng thời gian ping hoặc khi nút gần nhất là nút phụ, nó được gọi là sao chép dữ liệu theo chuỗi.
86) Giải thích về kho dữ liệu ảo
Kho dữ liệu ảo cung cấp cái nhìn tổng thể về dữ liệu đã hoàn thành. Kho dữ liệu ảo không có dữ liệu lịch sử. Nó được coi là mô hình dữ liệu logic có siêu dữ liệu.
87) Giải thích snapshot của kho dữ liệu
Ảnh chụp nhanh là hình ảnh trực quan hóa hoàn chỉnh của dữ liệu tại thời điểm quá trình trích xuất dữ liệu bắt đầu.
88) Trích xuất hai chiều là gì?
Khả năng hệ thống trích xuất, làm sạch và truyền dữ liệu theo hai hướng được gọi là trích xuất định hướng.
Những câu hỏi phỏng vấn này cũng sẽ giúp ích cho bài thi viva(orals) của bạn