Tutoriel Teradata : Qu'est-ce que Teradata SQL ? Base de données Architecture

Qu'est-ce que Teradata ?

Teradata est un système de gestion de base de données open source pour le développement d'applications d'entreposage de données à grande échelle. Cet outil prend en charge plusieurs opérations d'entreposage de données simultanément en utilisant le concept de parallélisme. Teradata est un système de traitement massivement ouvert qui prend en charge Unix/Linux/Windows plates-formes de serveurs.

Le logiciel Teradata est développé par Teradata Corporation, une société informatique américaine. Il s'agit d'un fournisseur de plates-formes de données analytiques, d'applications et d'autres services connexes. L'entreprise développe un produit pour consolider les données provenant de diverses sources et rendre les données disponibles pour analyse.

Histoire de Teradata

Teradata était une division de NCR Corporation. Elle a été constituée en 1979 mais s'est séparée de NCR en octobre 2007. Michael Koehler est devenu le premier PDG de Teradata.

Jalons de Teradata Corporation :

  • 1979 – Création de Teradata
  • 1984 – Sortie du premier ordinateur de base de données DBC/1012
  • 1986 – Le magazine Fortune déclare Teradata « Produit de l'année »
  • 1999 – La plus grande base de données construite avec Teradata avec 130 téraoctets
  • 2002 – Sortie de la version Teradata V2R5 avec compression et partition principale
  • 2006 – Lancement de la solution Teradata Master Data Management
  • 2008 – Sortie de Teradata 13.0 avec Active Data Warehousing
  • 2011 – Acquiert Teradata Aster et se lance dans le domaine de l'analyse avancée
  • 2012 – Teradata 14.0 introduit
  • 2014 – Teradata 15.0 introduit
  • 2015 – Teradata achète la plateforme de marketing d'applications Appoxee
  • 2016- Terada s'associe au Big data
  • 2017 - Teradata acquiert StackIQ de San Diego

Pourquoi Teradata ?

  • Teradata propose une suite complète de services axés sur Entreposage de données
  • Le système est construit sur une architecture ouverte. Ainsi, chaque fois que des appareils plus rapides sont mis à disposition, ils peuvent être intégrés à l’architecture déjà construite.
  • Teradata prend en charge plus de 50 pétaoctets de données.
  • Vue d'opération unique pour un grand système multi-nœuds Teradata utilisant Service Workstation
  • Compatible avec une large gamme de Outil de BI pour récupérer des données.
  • Il peut servir de point de contrôle unique permettant au DBA de gérer les Base de données.
  • Hautes performances, requêtes diverses, analyses dans la base de données et gestion sophistiquée de la charge de travail
  • Teradata vous permet d'obtenir les mêmes données sur plusieurs options de déploiement

Ensuite, dans ce didacticiel Teradata, nous découvrirons les fonctionnalités de Teradata.

Fonctionnalités de Teradata SQL

Teradata offre les fonctionnalités puissantes suivantes :

  • Évolutivité linéaire : Offre une évolutivité linéaire lors du traitement de gros volumes de données en ajoutant des nœuds pour augmenter les performances du système.
  • Parallélisme illimité : Teradata est basé sur MPP (Massively Parallel Processing Architecture). Il est donc conçu pour être parallèle depuis le début. Il peut diviser une tâche importante en tâches plus petites et les exécuter en parallèle
  • Optimiseur mature : Teradata Optimizer peut gérer jusqu'à 64 jointures dans une requête.
  • Faible coût total de possession : Les données Tera ont un faible coût total de possession. Il est facile à configurer, à entretenir et à administrer.
  • Utilitaires de chargement et de déchargement : Teradata fournit des utilitaires de chargement et de déchargement pour déplacer des données vers/depuis le système Teradata.
  • Connectivité: Ce système MPP peut se connecter à des systèmes connectés à un canal comme un ordinateur central ou des systèmes connectés au réseau.
  • SQL: Teradata prend en charge SQL pour interagir avec les données stockées dans les tables. Il fournit son extension.
  • Utilitaires robustes : Teradata fournit des utilitaires robustes pour importer/exporter des données depuis/vers les systèmes Teradata tels que FastExport, FastLoad, MultiLoad et TPT.
  • Distribution automatique : Teradata peut distribuer automatiquement les données sur les disques sans intervention manuelle.

Ensuite, dans ce didacticiel Teradata SQL, nous découvrirons Teradata Architecture.

Teradata Architecture

L'architecture Teradata est un traitement massivement parallèle Architecture.

Les trois composants importants de Teradata sont :

  • Moteur d'analyse
  • PARNET
  • Processeurs de module d'accès (AMP)

Stockage Teradata ArchiBase de données de configuration ArchiSchéma de configuration :

Teradata Architecture
Teradata Archidiagramme de structure

Stockage Teradata Architecture

Moteur d'analyse :

Le moteur d'analyse analyse les requêtes et prépare le plan d'exécution. Il gère les sessions des utilisateurs. Il optimise et envoie une demande aux utilisateurs.

Ainsi, lorsque le client exécute des requêtes pour insérer des enregistrements, Parsing Engine envoie les enregistrements à la couche Message Passing. La couche de transmission de messages ou BYNET est un composant logiciel et matériel. Il offre une capacité de mise en réseau. Il récupère également les enregistrements et envoie la ligne à l'AMP cible.

CHA :

AMP signifie Processeur de module d'accès. Il stocke les enregistrements sur ces disques. AMP mène les activités suivantes :

  • Gère une partie de la base de données
  • Gère une partie de chaque table
  • Effectuer toutes les tâches associées à la génération d'un ensemble de résultats telles que le tri, l'agrégation et la jointure
  • Effectuer la gestion des verrous et de l'espace

Récupération de données Teradata Architecture

Lorsque le client exécute des requêtes pour récupérer des enregistrements, le moteur d'analyse envoie une requête à BYNET. BYNET envoie ensuite la demande de récupération aux AMP appropriés.

Les AMP recherchent leurs disques en parallèle, reconnaissent les enregistrements requis et les envoient à BYNET. BYNET envoie les enregistrements à Parsing Engine, qui à son tour seront envoyés au client.

Ensuite, dans ce didacticiel Teradata Database, nous découvrirons les commandes Teradata SQL.

Types de commandes Teradata SQL

Teradata Database prend en charge les commandes SQL de base suivantes :

  1. Commandes du langage de définition de données (DDL)
  2. Commandes du langage de contrôle des données (DCL)
  3. Commandes du langage de manipulation de données (DML)

Commandes du langage de définition de données

COMMAND Description
CREATE Crée une nouvelle base de données, table, utilisateur, etc.
GOUTTE Supprime une nouvelle base de données, une table, un utilisateur, etc.
ALTER Modifie une table, une colonne, un déclencheur, etc.
MODIFIER Modifie une base de données ou une définition d'utilisateur
RENOMMER Change le nom des tables, des vues, des macros, etc.

Commandes du langage de contrôle des données

COMMAND Description
ACCORDER/RÉVOQUER Utilisé pour contrôler les privilèges d'un utilisateur sur un objet
ACCORDER UNE CONNEXION/RÉVOQUER UNE CONNEXION Utilisé pour contrôler les privilèges de connexion à un hôte ou à un groupe d'hôtes
DONNER Utilisé pour donner un objet de base de données à un autre objet de base de données

Commandes du langage de manipulation de données SQL de base de données Teradata

COMMAND Description
EFFACER Supprime une ligne du tableau
ECHO Utilisé pour renvoyer une chaîne ou une commande au client
POINT DE CONTRÔLE Définit un point de récupération dans le journal qui peut être utilisé ultérieurement pour restaurer le contenu de la table
SELECT Utilisé pour renvoyer des données de ligne spécifiques sous forme de tableau
MISE À JOUR Modifie les données dans une ou plusieurs lignes d'un tableau

Applications de la base de données Teradata

Voici les applications Teradata les plus populaires :

  • Gestion des données clients : Aide à maintenir des relations durables avec les clients.
  • Gestion des données de référence: Aide à développer un environnement dans lequel les données de base peuvent être utilisées, synchronisées et stockées.
  • Gestion des finances et des performances : Aide l’organisation à améliorer la rapidité et la qualité des rapports financiers. Il réduit les coûts d'infrastructure financière et gère de manière proactive les performances de l'entreprise.
  • Gestion de la chaîne logistique: Améliorez les opérations de la chaîne d'approvisionnement, ce qui contribue à améliorer le service client, à réduire les temps de cycle et à réduire les stocks.
  • Gestion de la chaîne de demande : Aide à augmenter les niveaux de service client et les ventes. Cela aide également les entreprises à prévoir avec précision la demande pour leurs articles en magasin.

Ensuite, dans ce didacticiel Teradata pour débutants, nous découvrirons la différence entre Teradata et les autres RDBMS.

Différence entre Teradata et les autres SGBDR

Paramètres DONNÉES TERA RDBMS
Architectures Ne suit rien partagé Architecture. Tout partagé et permet les conflits de ressources.
Processus MIPS [millions d'instructions/sec] KIPS [milliers d'établissements/sec]
Index Meilleure distribution et récupération Offre uniquement la récupération FASI
Parallélisme Prend en charge le parallélisme inconditionnel. Le parallélisme est conditionnel et imprévisible
Chargement en vrac Teradata permet le chargement en masse. Permet uniquement un chargement en vrac limité.
Évolutivité Évolutivité linéaire avec une pente de un Évolutivité avec des rendements décroissants
Tampon de base de données Un tampon de base de données unique utilisé par tous les UoP. (Une unité de parallélisme). Un magasin de données unique accessible à tous les UoP Query Controller envoie des fonctions aux UoP qui possèdent les données
Magasins Il stocke TERA BYTES[Billions de lignes] GIGA BYTES[Millions de lignes]

MPP contre SMP

MPP SMP
MPP – Traitement massivement parallèle. Il s’agit d’un système informatique connecté à de nombreuses unités arithmétiques indépendantes ou à des microprocesseurs entiers fonctionnant en parallèle. Multi-traitement symétrique. Dans un système de traitement SMP, les CPU partagent la même mémoire et, par conséquent, le code exécuté dans un système peut affecter la mémoire utilisée par un autre.
Les bases de données peuvent se développer en ajoutant de nouveaux processeurs. Les bases de données SMP utilisent généralement un seul processeur pour effectuer des recherches dans la base de données.
Dans un environnement MPP, les performances sont améliorées car aucune ressource ne doit être partagée entre les ordinateurs physiques. La charge de travail d'une tâche parallèle est répartie entre les processeurs du système.
Les performances d’un système de traitement parallèle massif sont linéaires. Cependant, celui-ci augmentera proportionnellement au nombre de nœuds. Les bases de données SMP peuvent s'exécuter sur plusieurs serveurs. Cependant, partagera une autre ressource.

Résumé

  • Signification de Teradata : Teradata est un logiciel open source Système de gestion de base de données pour développer des applications d’entreposage de données à grande échelle.
  • Teradata était une division de NCR Corporation. Elle a été constituée en 1979 mais s'est séparée de NCR en octobre 2007.
  • Teradata propose une suite complète de services axés sur l'entreposage de données
  • Teradata offre une évolutivité linéaire lorsqu'il s'agit de traiter de gros volumes de données en ajoutant des nœuds pour augmenter les performances du système.
  • Trois composants importants de Teradata sont 1) le moteur d'analyse 2) le MPP 3) les processeurs de module d'accès (AMP)
  • Teradata propose une gamme complète de produits pour répondre aux besoins d'entreposage de données et d'ETL de toute organisation.
  • Application Teradata principalement utilisée pour la gestion de la chaîne d'approvisionnement, la gestion des données de référence, la gestion de la chaîne de la demande, etc.