Cơ sở dữ liệu là gì? Định nghĩa và các loại
⚡ Tóm tắt thông minh
Cơ sở dữ liệu là gì? Cơ sở dữ liệu là một tập hợp dữ liệu được hệ thống hóa và cấu trúc, hỗ trợ việc lưu trữ, truy xuất và quản lý điện tử. Nó vận hành các hệ thống hàng ngày, từ danh bạ điện thoại đến mạng xã hội, và được điều hành thông qua phần mềm gọi là Hệ thống Quản lý Cơ sở dữ liệu (DBMS).

Dữ liệu là gì?
Trong thuật ngữ đơn giản, dữ liệu Dữ liệu là thông tin về một đối tượng quan tâm. Tên, tuổi, chiều cao và cân nặng của bạn đều là dữ liệu về bạn. Hình ảnh, tập tin và PDF cũng có thể được coi là dữ liệu vì mỗi loại đều chứa thông tin có thể được lưu trữ và xử lý.
Cơ sở dữ liệu là gì?
A cơ sở dữ liệu Cơ sở dữ liệu là một tập hợp dữ liệu được thu thập một cách có hệ thống. Cơ sở dữ liệu hỗ trợ việc lưu trữ, truy xuất và xử lý dữ liệu điện tử, giúp quản lý dữ liệu dễ dàng hơn ở quy mô lớn.
Hãy xem xét một vài ví dụ quen thuộc. Danh bạ điện thoại trực tuyến sử dụng cơ sở dữ liệu để lưu trữ thông tin về người, số điện thoại và chi tiết liên hệ. Nhà cung cấp điện sử dụng cơ sở dữ liệu để xử lý hóa đơn, các vấn đề của khách hàng và lịch sử sự cố. Facebook lưu trữ thành viên, tình bạn, bài đăng, tin nhắn, quảng cáo và nhiều hơn nữa — tất cả đều nằm trong cơ sở dữ liệu. Mô hình này giống nhau trong tất cả các ngành: tổ chức thông tin sao cho các ứng dụng và người dùng có thể truy vấn một cách đáng tin cậy.
Các loại cơ sở dữ liệu
Các loại cơ sở dữ liệu phổ biến nhất được tóm tắt dưới đây. Mỗi loại phù hợp với một dạng dữ liệu và khối lượng công việc cụ thể.
Cơ sở dữ liệu phân tán
Cơ sở dữ liệu phân tán trải rộng dữ liệu trên nhiều địa điểm hoặc vị trí khác nhau. Mỗi địa điểm giữ phần dữ liệu riêng của mình, trong khi các máy khách chỉ nhìn thấy một cơ sở dữ liệu logic duy nhất. Mô hình này phổ biến trong các ứng dụng toàn cầu cần độ trễ thấp và khả năng truy cập cục bộ.
Cơ sở dữ liệu quan hệ
Cơ sở dữ liệu quan hệ lưu trữ dữ liệu trong các bảng với các hàng và cột và sử dụng khóa để liên kết các bảng với nhau. Thường được gọi là RDBMS, nó vẫn là loại cơ sở dữ liệu phổ biến nhất. DBMS gia đình trong chợ. Ví dụ bao gồm MySQL, Oracle Database, PostgreSQLvà Microsoft SQL Server.
cơ sở dữ liệu hướng đối tượng
Cơ sở dữ liệu hướng đối tượng lưu trữ dữ liệu dưới dạng các đối tượng, mỗi đối tượng mang các thuộc tính và phương thức xác định các thao tác được phép thực hiện trên dữ liệu. Chúng tương thích một cách rõ ràng với các ngôn ngữ lập trình hướng đối tượng và loại bỏ nhu cầu về lớp quản lý đối tượng-hoạt động (ORM).
Cơ sở dữ liệu tập trung
Cơ sở dữ liệu tập trung lưu trữ mọi bản ghi trên một máy chủ trung tâm duy nhất. Người dùng kết nối từ nhiều địa điểm khác nhau đến cùng một kho dữ liệu, điều này giúp đơn giản hóa việc quản trị nhưng lại biến máy chủ thành điểm gây xung đột duy nhất.
Cơ sở dữ liệu nguồn mở
Các cơ sở dữ liệu mã nguồn mở công bố mã nguồn của chúng theo giấy phép tự do, cho phép bất kỳ ai cũng có thể sử dụng, sửa đổi và phân phối lại. MySQL, PostgreSQL, SQLite, MariaDBvà MongoDB là những ví dụ được triển khai rộng rãi.
Cơ sở dữ liệu đám mây
Cơ sở dữ liệu đám mây được tối ưu hóa cho cơ sở hạ tầng ảo hóa, theo yêu cầu. Nó được cung cấp dưới dạng dịch vụ được quản lý, mở rộng quy mô lưu trữ và tính toán một cách linh hoạt, đồng thời cung cấp tính khả dụng cao thông qua cơ chế sao chép tích hợp. Ví dụ bao gồm: Amazon RDS, Azure Cơ sở dữ liệu SQL và Google Cloud Cờ lê.
Kho dữ liệu
A kho dữ liệu Hệ thống này tập trung dữ liệu lịch sử và dữ liệu tích lũy từ nhiều hệ thống nguồn khác nhau để hỗ trợ việc ra quyết định, báo cáo và dự báo. Nó đơn giản hóa việc phân tích bằng cách cung cấp cho tổ chức một phiên bản duy nhất, đáng tin cậy về sự thật.
Cơ sở dữ liệu NoSQL
Các cơ sở dữ liệu NoSQL xử lý các tập dữ liệu rất lớn, thường không có cấu trúc và không thể phân loại gọn gàng thành hàng và cột. Các loại kho lưu trữ tài liệu, cặp khóa-giá trị, nhóm cột và đồ thị đều giải quyết một mô hình truy cập khác nhau và cung cấp khả năng mở rộng theo chiều ngang mà các cơ sở dữ liệu quan hệ truyền thống khó có thể sánh kịp.
Cơ sở dữ liệu đồ thị
Cơ sở dữ liệu đồ thị sử dụng lý thuyết đồ thị — các nút và cạnh — để lưu trữ và truy vấn trực tiếp các mối quan hệ. Nó lý tưởng cho việc phát hiện gian lận, hệ thống đề xuất và phân tích mạng xã hội, nơi các kết nối giữa các thực thể quan trọng không kém gì chính các thực thể đó.
Cơ sở dữ liệu OLTP
Cơ sở dữ liệu OLTP (Xử lý giao dịch trực tuyến) tập trung vào các giao dịch có thông lượng cao, độ trễ thấp trong môi trường đa người dùng. Chúng đảm bảo các thuộc tính ACID và được tối ưu hóa cho nhiều thao tác đọc và ghi nhỏ, phục vụ các hệ thống vận hành như ứng dụng bán hàng và ngân hàng.
Cơ sở dữ liệu cá nhân
Cơ sở dữ liệu cá nhân lưu trữ dữ liệu trên một máy tính duy nhất dành cho một người dùng hoặc một nhóm nhỏ. Microsoft Truy cập và SQLite là những ví dụ điển hình.
Cơ sở dữ liệu đa phương thức
Cơ sở dữ liệu đa phương thức hỗ trợ nhiều mô hình dữ liệu — ví dụ: tài liệu, đồ thị và cặp khóa-giá trị — trong một công cụ duy nhất. ArangoDB và Microsoft Azure Cosmos DB là một lựa chọn đa phương thức phổ biến.
Cơ sở dữ liệu tài liệu/JSON
Trong cơ sở dữ liệu hướng tài liệu, mỗi bản ghi là một tài liệu độc lập, thường ở định dạng JSON, BSON hoặc XML. Một tài liệu duy nhất có thể chứa dữ liệu lồng ghép phức tạp và các trường khác nhau, điều này làm cho mô hình trở nên linh hoạt đối với các ứng dụng có tốc độ phát triển nhanh. MongoDB và Couchbase là những ví dụ nổi tiếng.
Cơ sở dữ liệu phân cấp
Cơ sở dữ liệu phân cấp sử dụng cấu trúc cây với các mối quan hệ cha-con. Các nút đại diện cho các bản ghi và các nhánh đại diện cho các trường. Windows Đăng ký trên Windows XP và IBM IMS là những ví dụ điển hình về cơ sở dữ liệu phân cấp.
Cơ sở dữ liệu mạng
Hệ quản trị cơ sở dữ liệu mạng (Network DBMS) hỗ trợ các mối quan hệ nhiều-nhiều giữa các bản ghi, tạo ra cấu trúc phức tạp hơn so với mô hình phân cấp. RDM Server là một ví dụ về hệ quản trị cơ sở dữ liệu triển khai mô hình mạng.
Thành phần cơ sở dữ liệu
Các thành phần cơ sở dữ liệu.
Mỗi cơ sở dữ liệu được xây dựng từ năm thành phần hoạt động cùng nhau:
Hàng sắt thép
Phần cứng là lớp vật lý — bao gồm máy tính, thiết bị I/O, phương tiện lưu trữ và mạng. Nó cung cấp giao diện giữa cơ sở dữ liệu và phần còn lại của thế giới.
Phần mềm
Phần mềm bao gồm mọi thứ quản lý và điều khiển cơ sở dữ liệu: chính hệ quản trị cơ sở dữ liệu (DBMS), hệ điều hành, phần mềm mạng cho phép nhiều người dùng chia sẻ dữ liệu và các ứng dụng đọc và ghi thông qua DBMS.
Ngày
Dữ liệu là những sự thật thô, quan sát, con số, ký hiệu và hình ảnh mà cơ sở dữ liệu lưu trữ. Bản thân dữ liệu thô không có ý nghĩa gì; cơ sở dữ liệu tổ chức và xử lý chúng thành thông tin hữu ích.
Thủ tục
Quy trình là những hướng dẫn và quy tắc được ghi lại, chi phối cách thức thiết kế, vận hành và bảo trì cơ sở dữ liệu. Chúng hướng dẫn người quản trị và người dùng cách vận hành hệ thống một cách đáng tin cậy.
Ngôn ngữ truy cập cơ sở dữ liệu
Ngôn ngữ truy cập cơ sở dữ liệu — thường là SQL — cho phép người dùng và ứng dụng chèn, cập nhật, xóa và truy vấn dữ liệu. Người dùng đưa ra các lệnh cụ thể mà hệ quản trị cơ sở dữ liệu (DBMS) phân tích, lập kế hoạch và thực thi trên hệ thống lưu trữ cơ bản.
Hệ thống quản lý cơ sở dữ liệu (DBMS) là gì?
A Hệ thống quản lý cơ sở dữ liệu (DBMS) Đây là lớp phần mềm cho phép người dùng định nghĩa, lưu trữ, truy xuất, cập nhật và bảo mật dữ liệu. DBMS Điều phối quyền truy cập giữa nhiều người dùng và ứng dụng, đảm bảo tính toàn vẹn và kiểm soát ai có thể xem hoặc thay đổi những gì.
Công nghệ hệ quản trị cơ sở dữ liệu (DBMS) không phải là mới — Charles Bachman. Kho dữ liệu tích hợp (IDS)Hệ quản trị cơ sở dữ liệu (DBMS), được xây dựng tại General Electric vào đầu những năm 1960, được công nhận rộng rãi là DBMS đầu tiên. Kể từ đó, lĩnh vực này đã phát triển qua các mô hình phân cấp, mạng lưới, quan hệ, hướng đối tượng và NoSQL, mỗi mô hình đều giải quyết cho thế hệ khối lượng công việc dữ liệu tiếp theo.
Lịch sử của các hệ thống quản lý cơ sở dữ liệu
Các mốc quan trọng dưới đây tracSự phát triển của công nghệ cơ sở dữ liệu.
- 1960s — Charles Bachman thiết kế hệ quản trị cơ sở dữ liệu (DBMS) đầu tiên tại General Electric.
- 1968 - IBM Hệ thống quản lý thông tin tàu (IMS), một trong những hệ quản trị cơ sở dữ liệu phân cấp sớm nhất.
- 1970 — Edgar F. Codd xuất bản cuốn sách “A Relational Model of Data for Large Shared Data Banks”, giới thiệu mô hình quan hệ.
- 1976 — Peter Chen đã chính thức hóa mô hình Quan hệ Thực thể (ER).
- 1980s - Các mô hình quan hệ Nó trở thành mô hình cơ sở dữ liệu chiếm ưu thế và SQL được tiêu chuẩn hóa.
- 1985 — Các hệ quản trị cơ sở dữ liệu hướng đối tượng dường như phù hợp với sự phát triển của các ngôn ngữ lập trình hướng đối tượng.
- 1990s — Các tính năng quan hệ đối tượng xuất hiện trong các hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) phổ biến.
- 1992 - Microsoft phát hành phiên bản đầu tiên của Microsoft Quyền truy cập vào cơ sở dữ liệu cá nhân.
- 1995 — Các ứng dụng web bắt đầu thúc đẩy việc sử dụng cơ sở dữ liệu trên quy mô Internet.
- 1997 — XML được đưa vào cơ sở dữ liệu vừa là định dạng vừa là mục tiêu truy vấn.
- 2009 — Thuật ngữ NoSQL trở nên phổ biến hơn tracSự phát triển này diễn ra nhanh chóng khi các kho lưu trữ tài liệu, cặp khóa-giá trị và đồ thị ngày càng lớn mạnh.
- 2010 và hơn thế nữa — Cơ sở dữ liệu SQL phân tán và dựa trên nền tảng đám mây (Aurora, Spanner, CockroachDB) hiện ra.
Ưu điểm của DBMS
Một hệ quản trị cơ sở dữ liệu (DBMS) được triển khai tốt mang lại cho các tổ chức nhiều lợi ích thiết thực:
- Cung cấp nhiều kỹ thuật để lưu trữ và truy xuất dữ liệu một cách hiệu quả.
- Cân bằng nhu cầu của nhiều ứng dụng cùng chia sẻ dữ liệu.
- Cung cấp các quy trình quản lý thống nhất.
- Giúp các lập trình viên ứng dụng tránh khỏi việc phải tiết lộ thông tin chi tiết về lưu trữ.
- Đảm bảo tính toàn vẹn và bảo mật dữ liệu thông qua các ràng buộc và kiểm soát truy cập.
- Lập lịch truy cập đồng thời sao cho chỉ những thao tác hợp lệ mới thành công.
- Giảm thời gian phát triển ứng dụng thông qua các dịch vụ có thể tái sử dụng.
Nhược điểm của DBMS
Mô hình hệ quản trị cơ sở dữ liệu (DBMS) cũng có những sự đánh đổi:
- Chi phí phần cứng và phần mềm có thể rất lớn.
- Hầu hết các hệ thống đều phức tạp, vì vậy người dùng và quản trị viên cần được đào tạo.
- Việc tập trung dữ liệu vào một cơ sở dữ liệu duy nhất tạo ra một mục tiêu dễ bị tấn công, hư hỏng hoặc gặp sự cố.
- Việc truy cập đồng thời đòi hỏi thiết kế cẩn thận để tránh mất dữ liệu cập nhật và tình trạng tắc nghẽn.
- Hệ quản trị cơ sở dữ liệu (DBMS) không được thiết kế cho các phép tính số học phức tạp; các công cụ chuyên dụng sẽ xử lý khối lượng công việc đó tốt hơn.

