Hướng dẫn Teradata: Teradata SQL là gì? Cơ sở dữ liệu Archikiến trúc
Teradata là gì?
Siêu dữ liệu là một Hệ thống quản lý cơ sở dữ liệu nguồn mở để phát triển các ứng dụng kho dữ liệu quy mô lớn. Công cụ này cung cấp hỗ trợ cho nhiều hoạt động kho dữ liệu đồng thời bằng cách sử dụng khái niệm song song. Teradata là một hệ thống xử lý mở rộng rãi hỗ trợ Unix/Linux/Windows nền tảng máy chủ.
Phần mềm Teradata được phát triển bởi Teradata Corporation, một công ty CNTT của Mỹ. Đây là nhà cung cấp nền tảng dữ liệu phân tích, ứng dụng và các dịch vụ liên quan khác. Công ty phát triển một sản phẩm để tổng hợp dữ liệu từ nhiều nguồn khác nhau và cung cấp dữ liệu để phân tích.
Lịch sử của Teradata
Teradata là một bộ phận của NCR Corporation. Nó được thành lập vào năm 1979 nhưng tách khỏi NCR vào tháng 2007 năm XNUMX. Michael Koehler trở thành Giám đốc điều hành đầu tiên của Teradata.
Các cột mốc quan trọng của Tập đoàn Teradata:
- 1979 – Teradata được thành lập
- 1984 – Phát hành máy tính cơ sở dữ liệu đầu tiên DBC/1012
- 1986 – Tạp chí Fortune tuyên bố Teradata là 'Sản phẩm của Năm'
- 1999 – Cơ sở dữ liệu lớn nhất được xây dựng bằng Teradata với 130 Terabyte
- 2002 – Phát hành phiên bản Teradata V2R5 với tính năng nén và phân vùng chính
- 2006 – Ra mắt giải pháp quản lý dữ liệu Teradata Master
- 2008 – Teradata 13.0 được phát hành với Kho dữ liệu hoạt động
- 2011 – Mua lại Teradata Aster và dấn thân vào Không gian phân tích nâng cao
- 2012 – Teradata 14.0 được giới thiệu
- 2014 – Teradata 15.0 được giới thiệu
- 2015- Teradata mua nền tảng tiếp thị ứng dụng Appoxee
- 2016- Terada chung tay với Big data
- 2017- Teradata mua lại StackIQ của San Diego
Tại sao lại là Teradata?
- Teradata cung cấp một bộ dịch vụ đầy đủ tập trung vào Kho dữ liệu
- Hệ thống được xây dựng trên kiến trúc mở. Vì vậy, bất cứ khi nào có thiết bị nhanh hơn, nó có thể được tích hợp vào kiến trúc đã xây dựng.
- Teradata hỗ trợ hơn 50 petabyte dữ liệu.
- Chế độ xem hoạt động đơn lẻ cho hệ thống nhiều nút Teradata lớn bằng cách sử dụng Service Workstation
- Tương thích với nhiều loại công cụ BI để lấy dữ liệu.
- Nó có thể hoạt động như một điểm kiểm soát duy nhất để DBA quản lý Cơ sở dữ liệu.
- Hiệu suất cao, truy vấn đa dạng, phân tích trong cơ sở dữ liệu và quản lý khối lượng công việc phức tạp
- Teradata cho phép bạn lấy cùng một dữ liệu trên nhiều tùy chọn triển khai
Tiếp theo trong hướng dẫn Teradata này, chúng ta sẽ tìm hiểu về các tính năng của Teradata.
Các tính năng của Teradata SQL
Teradata cung cấp các tính năng mạnh mẽ sau:
- Khả năng mở rộng tuyến tính: Cung cấp khả năng mở rộng tuyến tính khi xử lý khối lượng dữ liệu lớn bằng cách thêm các nút để tăng hiệu suất của hệ thống.
- Song song không giới hạn: Teradata dựa trên MPP (Xử lý song song lớn Archikiến trúc). Vì vậy, nó được thiết kế song song ngay từ đầu. Nó có thể chia một nhiệm vụ lớn thành các nhiệm vụ nhỏ hơn và chạy chúng song song
- Trình tối ưu hóa trưởng thành: Trình tối ưu hóa Teradata có thể xử lý tối đa 64 phép nối trong một truy vấn.
- TCO thấp: Dữ liệu Tera có tổng chi phí sở hữu thấp. Thật dễ dàng để thiết lập, bảo trì và quản trị.
- Tiện ích Load & Unload: Teradata cung cấp các tiện ích tải và dỡ tải để di chuyển dữ liệu vào/từ Hệ thống Teradata.
- Kết nối: Hệ thống MPP này có thể kết nối với các hệ thống gắn liền với kênh như máy tính lớn hoặc hệ thống gắn liền với mạng.
- SQL: Hỗ trợ Teradata SQL để tương tác với dữ liệu được lưu trữ trong bảng. Nó cung cấp phần mở rộng của nó.
- Tiện ích mạnh mẽ: Teradata cung cấp các tiện ích mạnh mẽ để nhập/xuất dữ liệu từ/đến các hệ thống Teradata như FastExport, FastLoad, MultiLoad và TPT.
- Phân phối tự động: Siêu dữ liệu có thể tự động phân phối dữ liệu vào đĩa mà không cần can thiệp thủ công.
Tiếp theo trong hướng dẫn Teradata SQL này, chúng ta sẽ tìm hiểu về Teradata Archikiến trúc.
Siêu dữ liệu Archikiến trúc
Kiến trúc Teradata là một Xử lý song song hàng loạt Archikiến trúc.
Ba thành phần quan trọng của Teradata là:
- Công cụ phân tích cú pháp
- BYNET
- Bộ xử lý mô-đun truy cập (AMP)
Lưu trữ Teradata Archicơ sở dữ liệu kiến trúc ArchiSơ đồ kiến trúc:
Lưu trữ Teradata Archikiến trúc
Công cụ phân tích cú pháp:
Parsing Engine phân tích cú pháp các truy vấn và chuẩn bị kế hoạch thực hiện. Nó quản lý các phiên cho người dùng. Nó tối ưu hóa và gửi yêu cầu đến người dùng.
Vì vậy, khi máy khách thực hiện các truy vấn để chèn bản ghi, Công cụ phân tích cú pháp sẽ gửi bản ghi đến lớp Truyền thông báo. Lớp truyền tin nhắn hoặc BYNET là một thành phần phần mềm và phần cứng. Nó cung cấp khả năng kết nối mạng. Nó cũng truy xuất các bản ghi và gửi hàng đến AMP đích.
KBTB:
AMP là viết tắt của Access Module Processor. Nó lưu trữ các bản ghi trên các đĩa này. AMP thực hiện các hoạt động sau:
- Quản lý một phần cơ sở dữ liệu
- Quản lý một phần của mỗi bảng
- Thực hiện tất cả các tác vụ liên quan đến việc tạo tập kết quả như sắp xếp, tổng hợp và nối
- Thực hiện quản lý khóa và không gian
Truy xuất dữ liệu Teradata Archikiến trúc
Khi máy khách chạy truy vấn để truy xuất bản ghi, công cụ phân tích cú pháp sẽ gửi yêu cầu tới BYNET. Sau đó, BYNET gửi yêu cầu truy xuất tới các AMP thích hợp.
AMP tìm kiếm đĩa của chúng song song và nhận ra các bản ghi cần thiết rồi gửi chúng tới BYNET. BYNET gửi các bản ghi tới Parsing Engine, công cụ này sẽ lần lượt được gửi đến máy khách.
Tiếp theo trong hướng dẫn Cơ sở dữ liệu Teradata này, chúng ta sẽ tìm hiểu về các lệnh SQL Teradata.
Các loại lệnh SQL Teradata
Cơ sở dữ liệu Teradata hỗ trợ các lệnh SQL cơ bản sau:
- Các lệnh Ngôn ngữ Định nghĩa Dữ liệu (DDL)
- Các lệnh Ngôn ngữ điều khiển dữ liệu (DCL)
- Các lệnh Ngôn ngữ thao tác dữ liệu (DML)
Các lệnh ngôn ngữ định nghĩa dữ liệu
COMMAND | Mô tả |
---|---|
TẠO NÊN | Tạo cơ sở dữ liệu, bảng, người dùng mới, v.v. |
Thả | Xóa cơ sở dữ liệu, bảng, người dùng mới, v.v. |
THAY ĐỔI | Thay đổi Bảng, cột, trình kích hoạt, v.v. |
SỬA ĐỔI | Thay đổi cơ sở dữ liệu hoặc định nghĩa người dùng |
ĐỔI TÊN | Thay đổi tên của bảng, dạng xem, macro, v.v. |
Lệnh ngôn ngữ kiểm soát dữ liệu
COMMAND | Mô tả |
---|---|
CẤP/Thu hồi | Được sử dụng để kiểm soát đặc quyền của người dùng trên một đối tượng |
CẤP ĐĂNG NHẬP/ THU HỒI ĐĂNG NHẬP | Được sử dụng để kiểm soát đặc quyền đăng nhập vào máy chủ hoặc nhóm máy chủ |
ĐƯA CHO | Được sử dụng để cung cấp một đối tượng cơ sở dữ liệu cho một đối tượng cơ sở dữ liệu khác |
Các lệnh ngôn ngữ thao tác dữ liệu SQL của cơ sở dữ liệu Teradata
COMMAND | Mô tả |
---|---|
DELETE | Xóa một hàng khỏi bảng |
ECHO | Được sử dụng để lặp lại một chuỗi hoặc lệnh cho máy khách |
KIỂM TRA | Xác định điểm khôi phục trong nhật ký có thể được sử dụng sau này để khôi phục nội dung bảng |
CHỌN | Được sử dụng để trả về dữ liệu hàng cụ thể ở dạng bảng |
CẬP NHẬT | Sửa đổi dữ liệu trong một hoặc nhiều hàng của bảng |
Ứng dụng của cơ sở dữ liệu Teradata
Sau đây là các ứng dụng Teradata phổ biến:
- Quản lý dữ liệu khách hàng: Giúp duy trì mối quan hệ lâu dài với khách hàng.
- Người quản lý dữ liệu: Giúp phát triển môi trường nơi dữ liệu chính có thể được sử dụng, đồng bộ hóa và lưu trữ.
- Quản lý tài chính và hiệu suất: Giúp tổ chức cải thiện tốc độ và chất lượng báo cáo tài chính. Nó làm giảm chi phí cơ sở hạ tầng tài chính và chủ động quản lý hiệu quả hoạt động của doanh nghiệp.
- Quản lý chuỗi cung ứng: Cải thiện hoạt động của chuỗi cung ứng giúp cải thiện dịch vụ khách hàng, giảm thời gian chu kỳ và giảm hàng tồn kho.
- Quản lý chuỗi nhu cầu: Giúp tăng mức độ dịch vụ khách hàng và doanh số bán hàng. Nó cũng giúp các công ty dự đoán chính xác nhu cầu về mặt hàng trong cửa hàng của họ.
Tiếp theo trong hướng dẫn Teradata dành cho người mới bắt đầu này, chúng ta sẽ tìm hiểu về sự khác biệt giữa Teradata và các phần mềm khác. RDBMS.
Sự khác biệt giữa Teradata và RDBMS khác
Tham số | DỮ LIỆU TERA | RDBMS |
---|---|---|
Archikiến trúc | Theo dõi Không chia sẻ gì Archikiến trúc. | Chia sẻ mọi thứ và cho phép tranh chấp tài nguyên. |
Quy trình | MIPS [Hàng triệu lệnh/giây] | KIPS [Nghìn tổ chức/giây] |
Chỉ số | Phân phối và truy xuất tốt hơn | Chỉ cung cấp Truy xuất FASI |
Song song | Hỗ trợ song song vô điều kiện. | Sự song song là có điều kiện và không thể đoán trước |
Tải số lượng lớn | Teradata cho phép tải số lượng lớn. | Chỉ cho phép tải số lượng lớn hạn chế. |
khả năng mở rộng | Khả năng mở rộng tuyến tính với độ dốc bằng một | Khả năng mở rộng với lợi nhuận giảm dần |
Bộ đệm cơ sở dữ liệu | Một bộ đệm cơ sở dữ liệu duy nhất được sử dụng bởi tất cả UoP. (Một sự thống nhất của tính song song). Một kho dữ liệu duy nhất được truy cập bởi tất cả UoP | Bộ điều khiển truy vấn gửi các chức năng tới UoP sở hữu dữ liệu |
Cửa hàng | Nó lưu trữ TERA BYTES[Billion của hàng] | GIGA BYTES[Hàng triệu hàng] |
MPP so với SMP
MPP | SMP |
---|---|
MPP - Xử lý song song lớn. Đó là hệ thống máy tính được gắn với nhiều đơn vị số học độc lập hoặc toàn bộ bộ vi xử lý chạy song song. | Đa xử lý đối xứng Trong hệ thống xử lý SMP, CPU dùng chung bộ nhớ và kết quả là mã chạy trong một hệ thống có thể ảnh hưởng đến bộ nhớ được sử dụng bởi hệ thống khác. |
Cơ sở dữ liệu có thể mở rộng bằng cách thêm CPU mới. | Cơ sở dữ liệu SMP thường sử dụng một CPU để thực hiện tìm kiếm cơ sở dữ liệu. |
Trong môi trường MPP, hiệu suất được cải thiện vì không cần chia sẻ tài nguyên giữa các máy tính vật lý. | Khối lượng công việc cho một công việc song song được phân phối trên các bộ xử lý trong hệ thống. |
Hiệu suất của hệ thống xử lý song song lớn là tuyến tính. Tuy nhiên, nó sẽ tăng tỷ lệ thuận với số lượng nút. | Cơ sở dữ liệu SMP có thể chạy trên nhiều máy chủ. Tuy nhiên, sẽ chia sẻ một nguồn tài nguyên khác. |
Tổng kết
- Ý nghĩa Teradata: Teradata là nguồn mở Hệ thống quản lý cơ sở dữ liệu để phát triển các ứng dụng lưu trữ dữ liệu quy mô lớn.
- Teradata là một bộ phận của NCR Corporation. Nó được thành lập vào năm 1979 nhưng đã tách khỏi NCR vào tháng 2007 năm XNUMX
- Teradata cung cấp bộ dịch vụ đầy đủ tập trung vào Kho dữ liệu
- Teradata cung cấp khả năng mở rộng tuyến tính khi xử lý khối lượng dữ liệu lớn bằng cách thêm các nút để tăng hiệu suất của hệ thống.
- Ba thành phần quan trọng của Teradata là 1) Công cụ phân tích cú pháp 2) MPP 3) Bộ xử lý mô-đun truy cập (AMP)
- Teradata cung cấp đầy đủ bộ sản phẩm để đáp ứng nhu cầu lưu trữ dữ liệu và ETL của bất kỳ tổ chức nào
- Ứng dụng Teradata chủ yếu được sử dụng để Quản lý chuỗi cung ứng, Quản lý dữ liệu chính, Quản lý chuỗi nhu cầu, v.v.