Teradata-zelfstudie: Wat is Teradata SQL? Database Architectuur

Wat is Teradata?

Teradata is een open-source Database Management System voor het ontwikkelen van grootschalige datawarehousing-applicaties. Deze tool biedt ondersteuning voor meerdere datawarehouse-bewerkingen tegelijkertijd met behulp van het concept van parallelisme. Teradata is een enorm open verwerkingssysteem dat Unix/Linux/Windows serverplatforms.

Teradata-software is ontwikkeld door Teradata Corporation, een Amerikaans IT-bedrijf. Het is een leverancier van analytische dataplatforms, applicaties en andere gerelateerde diensten. Het bedrijf ontwikkelt een product om gegevens uit verschillende bronnen te consolideren en de gegevens beschikbaar te maken voor analyse.

Geschiedenis van Teradata

Teradata was een divisie van NCR Corporation. Het werd opgericht in 1979, maar scheidde zich in oktober 2007 af van NCR. Michael Koehler werd de eerste CEO van Teradata.

Mijlpalen van Teradata Corporation:

  • 1979 – Teradata werd opgericht
  • 1984 – Uitgave van de eerste databasecomputer DBC/1012
  • 1986 – Het tijdschrift Fortune roept Teradata uit tot 'Product van het jaar'
  • 1999 – Grootste database gebouwd met Teradata met 130 terabytes
  • 2002 – Teradata V2R5-versierelease met compressie en Partition Primary
  • 2006 – Lancering van de Teradata Master Data Management-oplossing
  • 2008 – Teradata 13.0 uitgebracht met Active Data Warehousing
  • 2011 – Neemt Teradata Aster over en duikt in de Advanced Analytics Space
  • 2012 – Teradata 14.0 geïntroduceerd
  • 2014 – Teradata 15.0 geïntroduceerd
  • 2015 - Teradata koopt apps-marketingplatform Appoxee
  • 2016- Terada slaat de handen ineen met Big data
  • 2017 - Teradata neemt StackIQ uit San Diego over

Waarom Teradata?

  • Teradata biedt een volledig servicepakket dat zich richt op Data opslagplaats
  • Het systeem is gebouwd op open architectuur. Dus wanneer er snellere apparaten beschikbaar komen, kunnen deze worden opgenomen in de reeds gebouwde architectuur.
  • Teradata ondersteunt meer dan 50 petabytes aan gegevens.
  • Eén bewerkingsweergave voor een groot Teradata-systeem met meerdere knooppunten met behulp van Service Workstation
  • Compatibel met een breed scala aan BI-tool om gegevens op te halen.
  • Het kan fungeren als een enkel controlepunt voor de DBA om de Database.
  • Hoge prestaties, diverse query's, analyses in de database en geavanceerd werklastbeheer
  • Met Teradata kunt u dezelfde gegevens verkrijgen voor meerdere implementatieopties

Vervolgens leren we in deze Teradata-tutorial over de functies van Teradata.

Kenmerken van Teradata SQL

Teradata biedt de volgende krachtige functies:

  • Lineaire schaalbaarheid: Biedt lineaire schaalbaarheid bij het omgaan met grote hoeveelheden gegevens door knooppunten toe te voegen om de prestaties van het systeem te verbeteren.
  • Onbeperkt parallellisme: Teradata is gebaseerd op MPP (Massively Parallel Processing). Archistructuur). Het is dus ontworpen om vanaf het begin parallel te zijn. Het kan een grote taak in kleinere taken verdelen en deze parallel uitvoeren
  • Volwassen optimalisatie: Teradata Optimizer kan maximaal 64 joins in een query verwerken.
  • Lage totale eigendomskosten: Tera-gegevens hebben lage totale eigendomskosten. Het is eenvoudig in te stellen, te onderhouden en te beheren.
  • Hulpprogramma's laden en lossen: Teradata biedt laad- en ontlaadhulpprogramma's om gegevens naar/van het Teradata-systeem te verplaatsen.
  • Connectiviteit: Dit MPP-systeem kan verbinding maken met kanaalgebonden systemen zoals een mainframe of netwerkgebonden systemen.
  • SQL: Teradata ondersteunt SQL om te communiceren met de gegevens die in tabellen zijn opgeslagen. Het zorgt voor de uitbreiding ervan.
  • Robuuste hulpprogramma's: Teradata biedt robuuste hulpprogramma's voor het importeren/exporteren van gegevens van/naar Teradata-systemen zoals FastExport, FastLoad, MultiLoad en TPT.
  • Automatische distributie: Teradata kan de gegevens automatisch naar de schijven distribueren zonder handmatige tussenkomst.

Vervolgens leren we in deze Teradata SQL-tutorial over Teradata Archistructuur.

Teradata Architectuur

Teradata-architectuur is een Massively Parallel Processing Archistructuur.

Drie belangrijke componenten van Teradata zijn:

  • Parseermotor
  • BIJNET
  • Toegangsmoduleprocessors (AMP's)

Teradata-opslag Architectie Database Archistructuur Diagram:

Teradata Architectuur
Teradata Archistructuurdiagram

Teradata-opslag Architectuur

Parseermotor:

De Parsing Engine parseert de query's en bereidt het uitvoeringsplan voor. Het beheert sessies voor gebruikers. Het optimaliseert en stuurt een verzoek naar de gebruikers.

Dus wanneer de client query's uitvoert voor het invoegen van records, stuurt Parsing Engine de records naar de Message Passing-laag. Message Passing Layer of BYNET is een software- en hardwarecomponent. Het biedt netwerkmogelijkheden. Het haalt ook de records op en stuurt de rij naar de doel-AMP.

MPA:

AMP staat voor Access Module Processor. Het slaat records op deze schijven op. AMP voert de volgende activiteiten uit:

  • Beheert een deel van de database
  • Beheert een deel van elke tafel
  • Voer alle taken uit die verband houden met het genereren van resultatensets, zoals sorteren, aggregeren en samenvoegen
  • Voer slot- en ruimtebeheer uit

Teradata ophalen Architectuur

Wanneer de client query's uitvoert om records op te halen, verzendt de parseringsengine een verzoek naar BYNET. Vervolgens stuurt BYNET het ophaalverzoek naar de juiste AMP's.

AMP's doorzoeken hun schijven parallel, herkennen de benodigde records en sturen deze naar BYNET. BYNET stuurt de records naar Parsing Engine, die op zijn beurt naar de client wordt verzonden.

Vervolgens leren we in deze Teradata Database-tutorial meer over Teradata SQL-opdrachten.

Typen Teradata SQL-opdrachten

Teradata Database ondersteunt de volgende basis SQL-opdrachten:

  1. Data Definition Language (DDL)-opdrachten
  2. Data Control Language (DCL)-opdrachten
  3. Data Manipulation Language (DML)-opdrachten

Data Definition Language-opdrachten

COMMAND BESCHRIJVING
CREATE Creëert een nieuwe database, tabel, gebruiker, enz.
DROP Verwijdert een nieuwe database, tabel, gebruiker, enz.
ALTER Wijzigt een tabel, kolom, trigger, enz.
WIJZIGEN Wijzigt een database- of gebruikersdefinitie
RENAME Verandert de naam van tabellen, views, macro's, etc.

Data Control Language-opdrachten

COMMAND BESCHRIJVING
TOELIGEN/INTREKKEN Wordt gebruikt om de rechten van een gebruiker op een object te beheren
AANMELDING VERLENEN/AANMELDING INTREKKEN Wordt gebruikt om aanmeldingsrechten voor een host of hostgroep te beheren
GEVEN Wordt gebruikt om een ​​databaseobject aan een ander databaseobject te geven

Teradata Database SQL-gegevensmanipulatie Taalopdrachten

COMMAND BESCHRIJVING
VERWIJDEREN Verwijdert een rij uit de tabel
ECHO Wordt gebruikt om een ​​string of commando naar de client te echoën
CONTROLEPUNT Definieert een herstelpunt in het journaal dat later kan worden gebruikt om de tabelinhoud te herstellen
SELECT Wordt gebruikt om specifieke rijgegevens in tabelvorm te retourneren
UPDATE Wijzigt gegevens in een of meer rijen van een tabel

Toepassingen van Teradata-database

Hieronder staan ​​de populaire Teradata-applicaties:

  • Beheer van klantgegevens: Helpt bij het onderhouden van langdurige relaties met klanten.
  • Masterdatabeheer: Helpt bij het ontwikkelen van een omgeving waarin stamgegevens kunnen worden gebruikt, gesynchroniseerd en opgeslagen.
  • Financiën en prestatiebeheer: Helpt organisaties de snelheid en kwaliteit van financiële rapportage te verbeteren. Het verlaagt de kosten van de financiële infrastructuur en beheert proactief de bedrijfsprestaties.
  • Voorraadketenbeheer: Verbeter de supply chain-activiteiten, wat leidt tot een betere klantenservice, kortere doorlooptijden en lagere voorraden.
  • Beheer van de vraagketen: Helpt het klantenserviceniveau en de omzet te verhogen. Het helpt bedrijven ook om de vraag naar hun winkelartikelen nauwkeurig te voorspellen.

Vervolgens zullen we in deze Teradata voor beginners-tutorial leren over het verschil tussen Teradata en andere RDBMS.

Verschil tussen Teradata en andere RDBMS

Parameter TERA-GEGEVENS RDBMS
Architexturen Volgt gedeeld niets Archistructuur. Alles gedeeld en bronnenconflicten mogelijk.
Processen MIPS [Miljoenen instructies/sec] KIPS [Duizenden instellingen/sec]
Indexen Betere distributie en terugwinning Biedt alleen FASI Retrieval aan
Parallellisme Ondersteunt onvoorwaardelijk parallellisme. Parallellisme is voorwaardelijk en onvoorspelbaar
Bulklading Teradata maakt bulklading mogelijk. Staat slechts een beperkte bulklading toe.
Schaalbaarheid Lineaire schaalbaarheid met een helling van één Schaalbaarheid met afnemend rendement
Databasebuffer Een enkele databasebuffer die door alle UoP's wordt gebruikt. (Een eenheid van parallelisme). Een enkele gegevensopslag die door alle UoP's wordt benaderd. Query Controller verzendt functies naar UoP's die eigenaar zijn van de gegevens
Winkels Het slaat TERA BYTES op[Billionen van rijen] GIGA BYTES[Miljoenen rijen]

MPP versus SMP

MPP SMP
MPP – Massaal parallelle verwerking. Het is een computersysteem dat is gekoppeld aan vele onafhankelijke rekeneenheden of hele microprocessors, die parallel draaien. Symmetrische multiverwerking. In een SMP-verwerkingssysteem delen de CPU's hetzelfde geheugen, en als gevolg daarvan kan de code die in het ene systeem wordt uitgevoerd, invloed hebben op het geheugen dat door een ander systeem wordt gebruikt.
Databases kunnen worden uitgebreid door nieuwe CPU's toe te voegen. SMP-databases gebruiken doorgaans één CPU om databasezoekopdrachten uit te voeren.
In een MPP-omgeving worden de prestaties verbeterd omdat er geen bronnen tussen fysieke computers hoeven te worden gedeeld. De werklast voor een parallelle taak wordt verdeeld over de processors in het systeem.
De prestaties van een massief parallel verwerkingssysteem zijn lineair. Het zal echter toenemen in verhouding tot het aantal knooppunten. SMP-databases kunnen op meerdere servers draaien. Zal echter een andere bron delen.

Samenvatting

  • Teradata betekenis: Teradata is een open source Databasemanagementsysteem voor het ontwikkelen van grootschalige datawarehousing-applicaties.
  • Teradata was een divisie van NCR Corporation. Het werd opgericht in 1979, maar scheidde zich in oktober 2007 af van NCR
  • Teradata biedt een volledig dienstenpakket dat zich richt op Data Warehousing
  • Teradata biedt lineaire schaalbaarheid bij het omgaan met grote hoeveelheden gegevens door knooppunten toe te voegen om de prestaties van het systeem te verbeteren.
  • Drie belangrijke componenten van Teradata zijn 1) Parsing Engine 2) MPP 3) Access Module Processors (AMP's)
  • Teradata biedt een compleet assortiment productsuites om te voldoen aan de datawarehousing- en ETL-behoeften van elke organisatie
  • Teradata-applicatie voornamelijk gebruikt voor Supply Chain Management, Master Data Management, Demand Chain Management, enz.