Teradata チュートリアル: Teradata SQL とは何ですか?データベース Archi構造

テラデータとは?

Teradataの は、大規模なデータウェアハウスアプリケーションを開発するためのオープンソースのデータベース管理システムです。このツールは、並列処理の概念を使用して、複数のデータウェアハウス操作を同時にサポートします。Teradataは、Unix / Linux /をサポートする大規模なオープン処理システムです。Windows サーバープラットフォーム。

Teradata ソフトウェアは、アメリカの IT 企業である Teradata Corporation によって開発されています。 分析データ プラットフォーム、アプリケーション、およびその他の関連サービスのベンダーです。 同社は、さまざまなソースからのデータを統合し、分析に利用できるようにする製品を開発しています。

テラデータの歴史

Teradata は NCR Corporation の一部門でした。 Teradata は 1979 年に設立されましたが、2007 年 XNUMX 月に NCR から独立しました。Michael Koehler が Teradata の初代 CEO に就任しました。

Teradata Corporation のマイルストーン:

  • 1979 – Teradata が法人化される
  • 1984 – 最初のデータベース コンピューター DBC/1012 のリリース
  • 1986 – フォーチュン誌が Teradata を「今年の製品」と宣言
  • 1999 – Teradata を使用して構築された最大のデータベース (130 テラバイト)
  • 2002 – 圧縮とパーティション プライマリを備えた Teradata V2R5 バージョン リリース
  • 2006 – Teradata マスター データ管理ソリューションの発売
  • 2008 – Teradata 13.0 が Active Data Warehousing とともにリリースされました
  • 2011 – Teradata Aster を買収し、高度な分析分野に参入
  • 2012 – Teradata 14.0 導入
  • 2014 – Teradata 15.0 導入
  • 2015- Teradata がアプリ マーケティング プラットフォーム Appoxee を買収
  • 2016年 - 寺田がビッグデータと手を組む
  • 2017- Teradata がサンディエゴの StackIQ を買収

なぜテラデータなのか?

  • Teradata は、以下に焦点を当てた完全なサービス スイートを提供します。 データウェアハウス
  • このシステムはオープン アーキテクチャに基づいて構築されています。そのため、より高速なデバイスが利用可能になった場合は、既に構築されているアーキテクチャに組み込むことができます。
  • Teradata は 50 ペタバイト以上のデータをサポートします。
  • サービスワークステーションを使用した大規模な Teradata マルチノード システムの単一操作ビュー
  • 幅広い製品に対応 BIツール データを取得します。
  • DBA が単一の制御点として機能して、 データベース.
  • 高性能、多様なクエリ、データベース内分析、洗練されたワークロード管理
  • Teradata を使用すると、複数の展開オプションで同じデータを取得できます

次に、この Teradata チュートリアルでは、Teradata の機能について学びます。

Teradata SQLの機能

Teradata は次の強力な機能を提供します。

  • 線形スケーラビリティ: ノードを追加してシステムのパフォーマンスを向上させることで、大量のデータを処理するときに線形のスケーラビリティを提供します。
  • 無制限の並列処理: Teradata は MPP (Massively Parallel Processing) に基づいています Archiテクチャ)。なので、最初から並列になるように設計されています。大きなタスクを小さなタスクに分割し、それらを並行して実行できます。
  • 成熟したオプティマイザー: Teradata Optimizer は、クエリ内で最大 64 個の結合を処理できます。
  • 低い TCO: Tera データは総所有コストが低くなります。 セットアップ、保守、管理が簡単です。
  • ロードおよびアンロード ユーティリティ: Teradata は、Teradata System との間でデータを移動するためのロードおよびアンロード ユーティリティを提供します。
  • 接続: この MPP システムは、メインフレームなどのチャネル接続システムやネットワーク接続システムに接続できます。
  • SQL: テラデータのサポート SQL テーブルに格納されているデータを操作します。 それはその拡張機能を提供します。
  • 堅牢なユーティリティ: Teradata は、Teradata システムとの間でデータをインポート/エクスポートするための FastExport、FastLoad、MultiLoad、TPT などの堅牢なユーティリティを提供します。
  • 自動配布: Teradataの 手動介入なしでデータを自動的にディスクに分散できます。

次に、この Teradata SQL チュートリアルでは、Teradata について学習します。 Archi構造。

Teradataの Archi構造

Teradataアーキテクチャは超並列処理です Archi構造。

Teradata の XNUMX つの重要なコンポーネントは次のとおりです。

  • 解析エンジン
  • バイネット
  • アクセス モジュール プロセッサ (AMP)

テラデータストレージ Archi構造データベース Archi構造図:

Teradataの Archi構造
Teradataの Archi構造図

テラデータストレージ Archi構造

解析エンジン:

解析エンジンはクエリを解析し、実行プランを準備します。ユーザーのセッションを管理します。リクエストを最適化してユーザーに送信します。

したがって、クライアントがレコードを挿入するクエリを実行すると、解析エンジンはレコードをメッセージ パッシング レイヤーに送信します。 メッセージ パッシング レイヤー (BYNET) は、ソフトウェアおよびハードウェア コンポーネントです。 ネットワーク機能を提供します。 また、レコードを取得し、行をターゲット AMP に送信します。

AMP:

AMP はアクセス モジュール プロセッサの略です。これらのディスクにレコードを保存します。AMP は次のアクティビティを実行します。

  • データベースの一部を管理します
  • 各テーブルの一部を管理します
  • ソート、集計、結合など、結果セットの生成に関連するすべてのタスクを実行します。
  • ロックとスペース管理を実行する

テラデータの取得 Archi構造

クライアントがクエリを実行してレコードを取得すると、解析エンジンはリクエストを BYNET に送信します。 次に、BYNET は取得リクエストを適切な AMP に送信します。

AMP はディスクを並行して検索し、必要なレコードを認識して BYNET に送信します。 BYNET はレコードを解析エンジンに送信し、解析エンジンはクライアントに送信されます。

次に、この Teradata Database チュートリアルでは、Teradata SQL コマンドについて学習します。

Teradata SQL コマンドの種類

Teradata データベースは、次の基本的な SQL コマンドをサポートしています。

  1. データ定義言語 (DDL) コマンド
  2. データ制御言語 (DCL) コマンド
  3. データ操作言語 (DML) コマンド

データ定義言語コマンド

COMMAND Description
CREATE 新しいデータベース、テーブル、ユーザーなどを作成します。
DROP 新しいデータベース、テーブル、ユーザーなどを削除します。
変更する テーブル、列、トリガーなどを変更します。
変更 データベースまたはユーザー定義を変更します
RENAME テーブル、ビュー、マクロなどの名前を変更します。

データ制御言語コマンド

COMMAND Description
許可/取り消し オブジェクトに対するユーザーの権限を制御するために使用されます
ログオンの許可/ログオンの取り消し ホストまたはホスト グループへのログオン権限を制御するために使用されます。
与える データベース オブジェクトを別のデータベース オブジェクトに与えるために使用されます

Teradata Database SQL データ操作言語コマンド

COMMAND Description
DELETE テーブルから行を削除します
エコー 文字列またはコマンドをクライアントにエコーするために使用されます
チェックポイント 後でテーブルコンテンツを復元するために使用できるジャーナル内の回復ポイントを定義します。
SELECT テーブル形式で特定の行データを返すために使用されます。
UPDATE テーブルの XNUMX つ以上の行のデータを変更します

Teradata データベースのアプリケーション

人気のある Teradata アプリケーションは次のとおりです。

  • 顧客データ管理: 顧客との長期的な関係を維持するのに役立ちます。
  • マスターデータ管理: マスターデータを利用、同期、保存できる環境の開発に役立ちます。
  • 財務およびパフォーマンス管理: 組織が財務報告の速度と品質を向上できるように支援します。 財務インフラストラクチャのコストを削減し、企業のパフォーマンスを積極的に管理します。
  • サプライチェーンマネジメント: サプライ チェーンの運用を改善することで、顧客サービスの向上、サイクル タイムの短縮、在庫の削減に役立ちます。
  • デマンドチェーン管理: 顧客サービスレベルと売上の向上に役立ちます。 また、企業が店舗の商品の需要を正確に予測するのにも役立ちます。

次に、この初心者向け Teradata チュートリアルでは、Teradata とその他の Teradata の違いについて学びます。 RDBMS.

Teradata と他の RDBMS の違い

テラデータ RDBMS
Archi構造 何も共有されないままフォローします Archi構造。 すべてを共有し、リソースの競合を許可します。
プロセス MIPS [数百万命令/秒] KIPS [数千の機関/秒]
インデックス より良い配布と取得 FASI 検索のみを提供します
平行度 無条件並列処理をサポートします。 並列処理は条件付きであり、予測不可能です
バルクロード Teradata では一括ロードが可能です。 限られた一括ロードのみを許可します。
スケーラビリティ 傾き XNUMX の線形スケーラビリティ 利益が逓減するスケーラビリティ
データベースバッファ すべての UoP で使用される単一のデータベース バッファ (並列処理の統合)。すべての UoP がアクセスする単一のデータ ストア クエリ コントローラーは、データを所有する UoP に関数を送信します。
店舗 TERA BYTESを保存します[Bill行のイオン] GIGA BYTES[数百万行]

MPP 対 SMP

MPP SMP
MPP – 大規模並列処理。 これは、並列実行される多数の独立した演算ユニットまたはマイクロプロセッサ全体に接続されたコンピュータ システムです。 対称型マルチプロセッシング。 SMP 処理システムでは、CPU が同じメモリを共有するため、あるシステムで実行されているコードが別のシステムで使用されているメモリに影響を与える可能性があります。
データベースは、新しい CPU を追加することで拡張できます。 SMP データベースは通常、データベース検索の実行に XNUMX つの CPU を使用します。
MPP 環境では、物理コンピューター間でリソースを共有する必要がないため、パフォーマンスが向上します。 並列ジョブのワークロードは、システム内のプロセッサー全体に分散されます。
大規模並列処理システムのパフォーマンスは線形です。 ただし、ノード数に比例して増加します。 SMP データベースは複数のサーバー上で実行できます。 ただし、別のリソースを共有します。

まとめ

  • Teradata の意味: Teradata はオープンソースです データベースマネージメントシステム 大規模なデータ ウェアハウジング アプリケーションの開発に最適です。
  • Teradata は NCR Corporation の一部門でした。 1979 年に法人化されましたが、2007 年 XNUMX 月に NCR から独立しました。
  • Teradata は、データ ウェアハウジングに焦点を当てた完全なサービス スイートを提供します
  • Teradata は、ノードを追加してシステムのパフォーマンスを向上させることで、大量のデータを処理する際の線形なスケーラビリティを提供します。
  • Teradata の 1 つの重要なコンポーネントは、2) 解析エンジン 3) MPP XNUMX) アクセス モジュール プロセッサ (AMP)
  • Teradata は、あらゆる組織のデータ ウェアハウジングと ETL のニーズを満たす幅広い製品スイートを提供します
  • 主にサプライチェーン管理、マスターデータ管理、デマンドチェーン管理などに使用される Teradata アプリケーション