Teradata 教程:什么是 Teradata SQL?数据库 Archi质地
什么是 Teradata?
Teradata数据 是一个开源数据库管理系统,用于开发大型数据仓库应用程序。此工具使用并行概念同时支持多个数据仓库操作。Teradata 是一个大规模开放处理系统,支持 Unix/Linux/Windows 服务器平台。
Teradata 软件由美国 IT 公司 Teradata Corporation 开发。它是分析数据平台、应用程序和其他相关服务的供应商。该公司开发了一种产品来整合来自各种来源的数据并使数据可供分析。
Teradata 的历史
Teradata 是 NCR Corporation 的一个部门。它成立于 1979 年,但于 2007 年 XNUMX 月从 NCR 分离。Michael Koehler 成为 Teradata 的第一任首席执行官。
Teradata 公司的里程碑:
- 1979 年 – Teradata 成立
- 1984 年——发布第一台数据库计算机 DBC/1012
- 1986 年 – 《财富》杂志将 Teradata 评为“年度产品”
- 1999 年 – 使用 Teradata 构建的最大数据库,容量为 130 TB
- 2002 年 – Teradata V2R5 版本发布,具有压缩和分区主功能
- 2006 年 – 推出 Teradata 主数据管理解决方案
- 2008 年 – Teradata 13.0 发布,搭载 Active Data Warehousing
- 2011 年 - 收购 Teradata Aster,进军高级分析领域
- 2012 年 – 推出 Teradata 14.0
- 2014 年 – 推出 Teradata 15.0
- 2015 年 - Teradata 收购应用营销平台 Appoxee
- 2016- Terada 携手大数据
- 2017 年 - Teradata 收购圣地亚哥的 StackIQ
为何选择 Teradata?
- Teradata 提供全套服务,重点关注 数据仓库
- 该系统建立在开放式架构上。因此,无论何时推出任何更快的设备,都可以将其纳入已构建的架构中。
- Teradata 支持 50+PB 的数据。
- 使用 Service Workstation 的大型 Teradata 多节点系统的单一操作视图
- 兼容多种 BI工具 获取数据。
- 它可以作为 DBA 的单一控制点来管理 数据库.
- 高性能、多样化查询、数据库内分析和复杂的工作负载管理
- Teradata 可让您在多个部署选项上获取相同的数据
接下来在本 Teradata 教程中,我们将了解 Teradata 的功能。
Teradata SQL 的功能
Teradata 提供以下强大的功能:
- 线性可扩展性: 通过添加节点来提高系统性能,在处理大量数据时提供线性可扩展性。
- 无限并行: Teradata 基于 MPP(大规模并行处理 Archi所以它从一开始就被设计为并行的。它可以将一个大任务分成几个小任务,然后并行运行
- 成熟的优化器: Teradata Optimizer 最多可以处理一个查询中的 64 个连接。
- 低总体拥有成本(TCO): Tera 数据的总拥有成本较低。它易于设置、维护和管理。
- 加载和卸载实用程序: Teradata 提供加载和卸载实用程序以将数据移入或移出 Teradata 系统。
- 连接: 该MPP系统可以连接到通道附加系统,如大型机或网络附加系统。
- SQL: Teradata 支持 SQL 与表中存储的数据进行交互。它提供了其扩展。
- 强大的实用程序: Teradata 提供强大的实用程序来从 Teradata 系统(如 FastExport、FastLoad、MultiLoad 和 TPT)导入/导出数据。
- 自动分配: Teradata数据 可以自动将数据分发到磁盘,无需人工干预。
接下来在本 Teradata SQL 教程中,我们将学习 Teradata Archi结构。
Teradata数据 Archi质地
Teradata 架构是一种大规模并行处理 Archi结构。
Teradata 的三个重要组件是:
- 解析引擎
- 碧雅特
- 访问模块处理器 (AMP)
Teradata 存储 Archi建筑数据库 Archi结构图:
Teradata 存储 Archi质地
解析引擎:
解析引擎解析查询并准备执行计划。它为用户管理会话。它优化并向用户发送请求。
因此,当客户端执行插入记录的查询时,解析引擎会将记录发送到消息传递层。消息传递层或 BYNET 是一个软件和硬件组件。它提供联网功能。它还会检索记录并将行发送到目标 AMP。
放大器:
AMP 代表访问模块处理器。它将记录存储在这些磁盘上。AMP 进行以下活动:
- 管理数据库的一部分
- 管理每张桌子的一部分
- 执行与生成结果集相关的所有任务,例如排序、聚合和连接
- 执行锁和空间管理
Teradata 检索 Archi质地
当客户端运行查询以检索记录时,解析引擎会向 BYNET 发送请求。然后 BYNET 会将检索请求发送到适当的 AMP。
AMP 并行搜索磁盘并识别所需记录并将其发送到 BYNET。BYNET 将记录发送到解析引擎,解析引擎随后将发送给客户端。
接下来在本 Teradata 数据库教程中,我们将学习 Teradata SQL 命令。
Teradata SQL 命令的类型
Teradata 数据库支持以下基本 SQL 命令:
- 数据定义语言 (DDL) 命令
- 数据控制语言 (DCL) 命令
- 数据操作语言 (DML) 命令
数据定义语言命令
指挥 | 描述 |
---|---|
CREATE | 创建新的数据库、表、用户等。 |
下降 | 删除新的数据库、表、用户等。 |
改变 | 更改表、列、触发器等。 |
调整 | 更改数据库或用户定义 |
改名 | 更改表、视图、宏等的名称。 |
数据控制语言命令
指挥 | 描述 |
---|---|
授予/撤销 | 用于控制用户对对象的权限 |
授予登录权/撤销登录权 | 用于控制主机或主机组的登录权限 |
给 | 用于将一个数据库对象赋予另一个数据库对象 |
Teradata 数据库 SQL 数据操作语言命令
指挥 | 描述 |
---|---|
删除 | 从表中删除一行 |
ECHO | 用于向客户端回显字符串或命令 |
检查点 | 定义日志中的恢复点,稍后可用于恢复表内容 |
选择 | 用于以表格形式返回特定行的数据 |
更新 | 修改表中一行或多行的数据 |
Teradata 数据库的应用
以下是流行的 Teradata 应用程序:
- 客户数据管理: 有助于与客户维持长期关系。
- 主数据管理: 有助于开发可以使用、同步和存储主数据的环境。
- 财务和绩效管理: 帮助组织提高财务报告的速度和质量。降低财务基础设施成本,并主动管理企业绩效。
- 供应链管理: 改善供应链运作,有助于改善客户服务、缩短周期时间并降低库存。
- 需求链管理: 有助于提高客户服务水平和销售额。它还可以帮助公司准确预测其商店商品的需求。
接下来,在本 Teradata 初学者教程中,我们将了解 Teradata 与其他 RDBMS.
Teradata 与其他 RDBMS 之间的区别
产品型号 | TERA 数据 | RDBMS |
---|---|---|
Archi讲座 | 遵循无共享 Archi结构。 | 共享一切并允许资源争用。 |
流程 | MIPS [每秒百万条指令] | KIPS [千家机构/秒] |
指数 | 更好的分发和检索 | 仅提供 FASI 检索 |
排比 | 支持无条件并行。 | 并行是有条件的且不可预测的 |
批量加载 | Teradata 允许批量加载。 | 仅允许有限的批量负载。 |
可扩展性 | 斜率为 1 的线性可扩展性 | 收益递减的可扩展性 |
数据库缓冲区 | 所有 UoP 使用的单个数据库缓冲区。(并行性单元)。所有 UoP 访问的单个数据存储 | 查询控制器将函数发送给拥有数据的 UoP |
商店 | 它存储了 TERA 字节[Bill行离子] | 千兆字节[百万行] |
MPP 与 SMP
MPP的 | SMP |
---|---|
MPP——大规模并行处理。它是连接许多并行运行的独立运算单元或整个微处理器的计算机系统。 | 对称多处理。在 SMP 处理系统中,CPU 共享相同的内存,因此一个系统中运行的代码可能会影响另一个系统中使用的内存。 |
数据库可以通过添加新的 CPU 来扩展。 | SMP 数据库通常使用一个 CPU 来执行数据库搜索。 |
在 MPP 环境中,由于物理计算机之间不需要共享任何资源,因此性能得到了提高。 | 并行作业的工作负载分布在系统的各个处理器上。 |
大规模并行处理系统的性能是线性的。但是,它会随着节点数量的增加而成比例增加。 | SMP 数据库可以在多台服务器上运行。但是,将共享其他资源。 |
总结
- Teradata 含义:Teradata 是一个开源 数据库管理系统 用于开发大型数据仓库应用程序。
- Teradata 是 NCR Corporation 的一个部门。它成立于 1979 年,但于 2007 年 XNUMX 月从 NCR 分离出来
- Teradata 提供专注于数据仓库的全套服务
- Teradata 在处理大量数据时通过添加节点来提高系统性能,提供线性可扩展性。
- Teradata 的三个重要组件是 1) 解析引擎 2) MPP 3) 访问模块处理器 (AMP)
- Teradata 提供全系列产品套件,满足任何组织的数据仓库和 ETL 需求
- Teradata应用程序主要用于供应链管理、主数据管理、需求链管理等。