Teradata チュートリアル: Teradata SQL とは何ですか?データベース Archi構造

テラデータとは?

Teradataの は、大規模なデータ ウェアハウジング アプリケーションを開発するためのオープンソースのデータベース管理システムです。 このツールは、複数のデータ ウェアハウス操作を同時にサポートします。neo通常は並列処理の概念を使用します。 Teradata は、Unix/Linux/をサポートする大規模にオープンな処理システムです。Windows サーバープラットフォーム。

Teradata ソフトウェアは、アメリカの IT 企業である Teradata Corporation によって開発されています。 分析データ プラットフォーム、アプリケーション、およびその他の関連サービスのベンダーです。 同社は、さまざまなソースからのデータを統合し、分析に利用できるようにする製品を開発しています。

テラデータの歴史

Teradata は NCR Corporation の一部門でした。 Teradata は 1979 年に設立されましたが、2007 年 XNUMX 月に NCR から独立しました。Michael Koehler が Teradata の初代 CEO に就任しました。

Teradata Corporation のマイルストーン:

  • 1979 – Teradata が法人化される
  • 1984 – 最初のデータベース コンピューター DBC/1012 のリリース
  • 1986 – フォーチュン誌が Teradata を「今年の製品」と宣言
  • 1999 – Teradata を使用して構築された最大のデータベース (130 テラバイト)
  • 2002 – 圧縮とパーティション プライマリを備えた Teradata V2R5 バージョン リリース
  • 2006 – Teradata マスター データ管理ソリューションの発売
  • 2008 – Teradata 13.0 が Active Data Warehousing とともにリリースされました
  • 2011 – Teradata Aster を買収し、高度な分析分野に参入
  • 2012 – Teradata 14.0 導入
  • 2014 – Teradata 15.0 導入
  • 2015- Teradata がアプリ マーケティング プラットフォーム Appoxee を買収
  • 2016年 - 寺田がビッグデータと手を組む
  • 2017- Teradata がサンディエゴの StackIQ を買収

なぜテラデータなのか?

  • Teradata は、以下に焦点を当てた完全なサービス スイートを提供します。 データウェアハウス
  • システムはオープンに基づいて構築されています archi構造。したがって、より高速なデバイスが利用可能になるたびに、それをすでに構築されているシステムに組み込むことができます。 archi構造。
  • Teradata は 50 ペタバイト以上のデータをサポートします。
  • Service Workstation を使用した大規模な Teradata マルチノード システムの単一操作ビュー
  • 幅広い製品に対応 BIツール データを取得します。
  • DBA が単一の制御点として機能して、 データベース.
  • 高性能、多様なクエリ、データベース内分析、洗練されたワークロード管理
  • Teradata を使用すると、複数の展開オプションで同じデータを取得できます

次に、この Teradata チュートリアルでは、Teradata の機能について学びます。

Teradata SQLの機能

Teradata は以下を提供しますwing 強力な機能:

  • 線形スケーラビリティ: ノードを追加してシステムのパフォーマンスを向上させることで、大量のデータを処理するときに線形のスケーラビリティを提供します。
  • 無制限の並列処理: Teradata は MPP (Massively Parallel Processing) に基づいています Archiテクチャ)。なので、最初から並列になるように設計されています。大きなタスクを小さなタスクに分割し、それらを並行して実行できます。
  • 成熟したオプティマイザー: Teradata Optimizer は、クエリ内で最大 64 個の結合を処理できます。
  • 低い TCO: Tera データは総所有コストが低くなります。 セットアップ、保守、管理が簡単です。
  • ロードおよびアンロード ユーティリティ: Teradata は、Teradata System との間でデータを移動するためのロードおよびアンロード ユーティリティを提供します。
  • 接続: この MPP システムは、メインフレームなどのチャネル接続システムやネットワーク接続システムに接続できます。
  • SQL: テラデータのサポート SQL テーブルに格納されているデータを操作します。 それはその拡張機能を提供します。
  • 堅牢なユーティリティ: Teradata は、Teradata システムとの間でデータをインポート/エクスポートするための FastExport、FastLoad、MultiLoad、TPT などの堅牢なユーティリティを提供します。
  • 自動配布: Teradataの 手動介入なしでデータを自動的にディスクに分散できます。

次に、この Teradata SQL チュートリアルでは、Teradata について学習します。 Archi構造。

Teradataの Archi構造

Teradataの archi技術は超並列処理です Archi構造。

Teradata の XNUMX つの重要なコンポーネントは次のとおりです。

  • 解析エンジン
  • バイネット
  • アクセス モジュール プロセッサ (AMP)

テラデータストレージ Archi構造データベース Archi構造図:

Teradataの Archi構造
Teradataの Archi構造図

テラデータストレージ Archi構造

解析エンジン:

解析エンジンはクエリを解析して準備しますares 実行計画。 ユーザーのセッションを管理します。 リクエストを最適化してユーザーに送信します。

したがって、クライアントがレコードを挿入するクエリを実行すると、解析エンジンはレコードをメッセージ パッシング レイヤーに送信します。 メッセージ パッシング レイヤー (BYNET) は、ソフトウェアおよびハードウェア コンポーネントです。 ネットワーク機能を提供します。 また、レコードを取得し、行をターゲット AMP に送信します。

AMP:

AMP はアクセス モジュール プロセッサの略です。 これらのディスクにレコードを保存します。 AMP は次のように実行しますwing 活動:

  • データベースの一部を管理します
  • 各テーブルの一部を管理します
  • ソート、集計、結合など、結果セットの生成に関連するすべてのタスクを実行します。
  • ロックとスペース管理を実行する

テラデータの取得 Archi構造

クライアントがクエリを実行してレコードを取得すると、解析エンジンはリクエストを BYNET に送信します。 次に、BYNET は取得リクエストを適切な AMP に送信します。

AMP はディスクを並行して検索し、必要なレコードを認識して BYNET に送信します。 BYNET はレコードを解析エンジンに送信し、解析エンジンはクライアントに送信されます。

次に、この Teradata Database チュートリアルでは、Teradata SQL コマンドについて学習します。

Teradata SQL コマンドの種類

Teradata Database は以下をサポートしますwing 基本的な SQL コマンド:

  1. データ定義言語 (DDL) コマンド
  2. データ制御言語 (DCL) コマンド
  3. データ操作言語 (DML) コマンド

データ定義言語コマンド

COMMAND Description
CREATE 新しいデータベース、テーブル、ユーザーなどを作成します。
DROP 新しいデータベース、テーブル、ユーザーなどを削除します。
変更する テーブル、列、トリガーなどを変更します。
変更 データベースまたはユーザー定義を変更します
RENAME テーブル、ビュー、マクロなどの名前を変更します。

データ制御言語コマンド

COMMAND Description
許可/取り消し オブジェクトに対するユーザーの権限を制御するために使用されます
ログオンの許可/ログオンの取り消し ホストまたはホスト グループへのログオン権限を制御するために使用されます。
与える データベース オブジェクトを別のデータベース オブジェクトに与えるために使用されます

Teradata Database SQL データ操作言語コマンド

COMMAND Description
DELETE テーブルから行を削除します
エコー 文字列またはコマンドをクライアントにエコーするために使用されます
チェックポイント 使用できるジャーナル内のリカバリポイントを定義します。 later テーブルの内容を復元するには
SELECT テーブル形式で特定の行データを返すために使用されます。
UPDATE テーブルの XNUMX つ以上の行のデータを変更します

Teradata データベースのアプリケーション

Following 人気のある Teradata アプリケーションは次のとおりです。

  • 顧客データ管理: 顧客との長期的な関係を維持するのに役立ちます。
  • マスターデータ管理: マスターデータを活用できる環境の整備を支援し、 sync保存され、保存されます。
  • 財務およびパフォーマンス管理: 組織が財務報告の速度と品質を向上できるように支援します。 財務インフラストラクチャのコストを削減し、企業のパフォーマンスを積極的に管理します。
  • サプライチェーンマネジメント: サプライチェーンの運用を改善し、顧客サービスの向上、サイクルタイムの短縮、在庫の削減に貢献します。
  • デマンドチェーン管理: 顧客サービスレベルと売上の向上に役立ちます。 また、企業が店舗の商品の需要を正確に予測するのにも役立ちます。

次に、この初心者向け Teradata チュートリアルでは、Teradata とその他の Teradata の違いについて学びます。 RDBMS.

Teradata と他の RDBMS の違い

テラデータ RDBMS
Archi構造 何も共有されないままフォローします Archi構造。 すべてを共有し、リソースの競合を許可します。
プロセス MIPS [数百万命令/秒] KIPS [数千の機関/秒]
インデックス より良い配布と取得 FASI 検索のみを提供します
平行度 無条件並列処理をサポートします。 並列処理は条件付きであり、予測不可能です
バルクロード Teradata では一括ロードが可能です。 限られた一括ロードのみを許可します。
スケーラビリティ 傾き XNUMX の線形スケーラビリティ 利益が逓減するスケーラビリティ
データベース buffer 単一のデータベース buffer すべての UoP によって使用されます。 (並列処理の結合)。すべての UoP がアクセスする単一のデータ ストア クエリ コントローラーは、データを所有する UoP に関数を送信します。
店舗 TERA BYTESを保存します[Bill行のイオン] GIGA BYTES[数百万行]

MPP 対 SMP

MPP SMP
MPP – 大規模並列処理。 これは、並列実行される多数の独立した演算ユニットまたはマイクロプロセッサ全体に接続されたコンピュータ システムです。 対称型マルチプロセッシング。 SMP 処理システムでは、CPU が同じメモリを共有するため、あるシステムで実行されているコードが別のシステムで使用されているメモリに影響を与える可能性があります。
データベースは、新しい CPU を追加することで拡張できます。 SMP データベースは通常、データベース検索の実行に XNUMX つの CPU を使用します。
MPP 環境では、物理コンピューター間でリソースを共有する必要がないため、パフォーマンスが向上します。 並列ジョブのワークロードは、システム内のプロセッサー全体に分散されます。
大規模並列処理システムのパフォーマンスは線形です。 ただし、ノード数に比例して増加します。 SMP データベースは複数のサーバー上で実行できます。 ただし、別のリソースを共有します。

まとめ

  • Teradata の意味: Teradata はオープンソースです データベースマネージメントシステム 大規模なデータ ウェアハウジング アプリケーションの開発に最適です。
  • Teradata は NCR Corporation の一部門でした。 1979 年に法人化されましたが、2007 年 XNUMX 月に NCR から独立しました。
  • Teradata は、データ ウェアハウジングに焦点を当てた完全なサービス スイートを提供します
  • Teradata は、ノードを追加してシステムのパフォーマンスを向上させることで、大量のデータを処理する際の線形なスケーラビリティを提供します。
  • Teradata の 1 つの重要なコンポーネントは、2) 解析エンジン 3) MPP XNUMX) アクセス モジュール プロセッサ (AMP)
  • Teradata は、あらゆる組織のデータ ウェアハウジングと ETL のニーズを満たす幅広い製品スイートを提供します
  • 主にサプライチェーン管理、マスターデータ管理、デマンドチェーン管理などに使用される Teradata アプリケーション