Tutorial su Teradata: cos'è Teradata SQL? Banca dati Architectura
Cos'è Teradata?
Teradata è un sistema di gestione di database open source per lo sviluppo di applicazioni di data warehousing su larga scala. Questo strumento fornisce supporto per più operazioni di data warehouse simultaneamente utilizzando il concetto di parallelismo. Teradata è un sistema di elaborazione massivamente aperto che supporta Unix/Linux/Windows piattaforme server.
Il software Teradata è sviluppato da Teradata Corporation, una società IT americana. È un fornitore di piattaforme di dati analitici, applicazioni e altri servizi correlati. L'azienda sviluppa un prodotto per consolidare i dati provenienti da varie fonti e renderli disponibili per l'analisi.
Storia di Teradata
Teradata era una divisione di NCR Corporation. È stata costituita nel 1979 ma si è separata da NCR nell'ottobre 2007. Michael Koehler è diventato il primo CEO di Teradata.
Pietre miliari di Teradata Corporation:
- 1979 – Viene costituita Teradata
- 1984 – Rilascio del primo computer con database DBC/1012
- 1986 – La rivista Fortune dichiara Teradata "Prodotto dell'anno"
- 1999 – Il più grande database creato utilizzando Teradata con 130 Terabyte
- 2002 – Rilascio della versione Teradata V2R5 con compressione e Partition Primary
- 2006 – Lancio della soluzione Teradata Master Data Management
- 2008 – Rilascio di Teradata 13.0 con Active Data Warehousing
- 2011 – Acquisisce Teradata Aster e si tuffa nell'Advanced Analytics Space
- 2012 – Introduzione di Teradata 14.0
- 2014 – Introduzione di Teradata 15.0
- 2015- Teradata acquista la piattaforma di marketing per app Appoxee
- 2016- Terada si unisce ai Big Data
- 2017: Teradata acquisisce StackIQ di San Diego
Perché Teradata?
- Teradata offre una suite completa di servizi incentrati su Conservazione dei dati
- Il sistema è costruito su un'architettura aperta. Quindi, ogni volta che vengono resi disponibili dispositivi più veloci, possono essere incorporati nell'architettura già costruita.
- Teradata supporta oltre 50 petabyte di dati.
- Visualizzazione operazione singola per un sistema multinodo Teradata di grandi dimensioni che utilizza Service Workstation
- Compatibile con un'ampia gamma di Strumento BI per recuperare i dati.
- Può fungere da unico punto di controllo per il DBA per gestire il file Banca Dati.
- Prestazioni elevate, query diversificate, analisi nel database e gestione sofisticata del carico di lavoro
- Teradata ti consente di ottenere gli stessi dati su più opzioni di distribuzione
Successivamente in questo tutorial di Teradata, impareremo le funzionalità di Teradata.
Funzionalità di TeradataSQL
Teradata offre le seguenti potenti funzionalità:
- Scalabilità lineare: Offre scalabilità lineare quando si gestiscono grandi volumi di dati aggiungendo nodi per aumentare le prestazioni del sistema.
- Parallelismo illimitato: Teradata si basa su MPP (Massively Parallel Processing Architecnica). Quindi, è progettato per essere parallelo fin dall'inizio. Può dividere un'attività di grandi dimensioni in attività più piccole ed eseguirle in parallelo
- Ottimizzatore maturo: Teradata Optimizer può gestire fino a 64 join in una query.
- TCO basso: I dati Tera hanno un costo totale di proprietà basso. È facile da configurare, mantenere e amministrare.
- Utilità di carico e scarico: Teradata fornisce utilità di caricamento e scaricamento per spostare i dati nel/dal sistema Teradata.
- Connettività: Questo sistema MPP può connettersi a sistemi collegati al canale come un mainframe o sistemi collegati alla rete.
- SQL: Supporta Teradata SQL per interagire con i dati memorizzati nelle tabelle. Fornisce la sua estensione.
- Utilità robuste: Teradata fornisce potenti utilità per importare/esportare dati da/verso sistemi Teradata come FastExport, FastLoad, MultiLoad e TPT.
- Distribuzione automatica: Teradata può distribuire automaticamente i dati sui dischi senza intervento manuale.
Successivamente in questo tutorial su Teradata SQL, impareremo a conoscere Teradata Architectura.
Teradata Architectura
L'architettura Teradata è un'elaborazione parallela massiva Architectura.
Tre componenti importanti di Teradata sono:
- Motore di analisi
- BYNET
- Processori del modulo di accesso (AMP)
Archiviazione Teradata Archibanca dati della tecnologia ArchiSchema della struttura:
Archiviazione Teradata Architectura
Motore di analisi:
Il Parsing Engine analizza le query e prepara il piano di esecuzione. Gestisce le sessioni per gli utenti. Ottimizza e invia una richiesta agli utenti.
Pertanto, quando il client esegue query per l'inserimento di record, Parsing Engine invia i record al livello di passaggio dei messaggi. Il livello di passaggio dei messaggi o BYNET è un componente software e hardware. Offre funzionalità di rete. Recupera inoltre i record e invia la riga all'AMP di destinazione.
MPA:
AMP sta per Access Module Processor. Memorizza i record su questi dischi. AMP svolge le seguenti attività:
- Gestisce una parte del database
- Gestisce una porzione di ciascuna tabella
- Esegui tutte le attività associate alla generazione di set di risultati come ordinamento, aggregazione e unione
- Esegui il blocco e la gestione dello spazio
Recupero di Teradata Architectura
Quando il client esegue query per recuperare i record, il motore di analisi invia una richiesta a BYNET. Quindi BYNET invia la richiesta di recupero agli AMP appropriati.
Gli AMP cercano nei loro dischi in parallelo e riconoscono i record richiesti e li inviano a BYNET. BYNET invia i record a Parsing Engine, che a sua volta verrà inviato al client.
Successivamente in questo tutorial sul database Teradata, impareremo i comandi SQL Teradata.
Tipi di comandi SQL Teradata
Il database Teradata supporta i seguenti comandi SQL di base:
- Comandi DDL (Data Definition Language).
- Comandi DCL (Data Control Language).
- Comandi DML (Data Manipulation Language).
Comandi del linguaggio di definizione dei dati
COMANDO | Descrizione |
---|---|
CREA | Crea un nuovo database, tabella, utente, ecc. |
GOCCIA | Rimuove un nuovo database, tabella, utente, ecc. |
ETÀ | Modifica una tabella, una colonna, un trigger, ecc. |
MODIFICARE | Modifica un database o una definizione utente |
RINOMINARE | Cambia il nome di tabelle, viste, macro, ecc. |
Comandi del linguaggio di controllo dati
COMANDO | Descrizione |
---|---|
CONCEDERE/REVOCARE | Utilizzato per controllare i privilegi di un utente su un oggetto |
CONCEDI ACCESSO/REVOCA ACCESSO | Utilizzato per controllare i privilegi di accesso a un host o un gruppo host |
DARE | Utilizzato per fornire un oggetto di database a un altro oggetto di database |
Comandi del linguaggio di manipolazione dei dati SQL del database Teradata
COMANDO | Descrizione |
---|---|
DELETE | Rimuove una riga dalla tabella |
ECHO | Utilizzato per inviare una stringa o un comando al client |
PUNTO DI CONTROLLO | Definisce un punto di ripristino nel journal che può essere utilizzato in seguito per ripristinare il contenuto della tabella |
SELEZIONA | Utilizzato per restituire i dati di una riga specifica in un modulo di tabella |
AGGIORNAMENTO | Modifica i dati in una o più righe di una tabella |
Applicazioni del database Teradata
Di seguito sono elencate le applicazioni Teradata più diffuse:
- Gestione dati cliente: Aiuta a mantenere rapporti duraturi con i clienti.
- Gestione dei dati master: Aiuta a sviluppare un ambiente in cui i dati master possono essere utilizzati, sincronizzati e archiviati.
- Gestione delle finanze e delle prestazioni: Aiuta l'organizzazione a migliorare la velocità e la qualità del reporting finanziario. Riduce i costi dell'infrastruttura finanziaria e gestisce in modo proattivo le prestazioni aziendali.
- Gestione della catena di approvvigionamento: Migliorare le operazioni della catena di fornitura che contribuiscono a migliorare il servizio clienti, ridurre i tempi di ciclo e ridurre le scorte.
- Gestione della catena della domanda: Aiuta ad aumentare i livelli di servizio al cliente e le vendite. Aiuta inoltre le aziende a prevedere con precisione la domanda per il loro articolo in negozio.
Successivamente in questo tutorial di Teradata per principianti, impareremo la differenza tra Teradata e altri RDBMS.
Differenza tra Teradata e altri RDBMS
Parametro | DATI TERA | RDBMS |
---|---|---|
Architetture | Segue nulla condiviso Architectura. | Condivide tutto e consente il conflitto delle risorse. |
Processi | MIPS [milioni di istruzioni/sec] | KIPS [Migliaia di istituzioni/sec] |
Indici | Migliore distribuzione e recupero | Offre solo il recupero FASI |
Parallelismo | Supporta il parallelismo incondizionato. | Il parallelismo è condizionato e imprevedibile |
Caricamento in blocco | Teradata consente il caricamento in blocco. | Consente solo un carico di massa limitato. |
Scalabilità | Scalabilità lineare con pendenza pari a uno | Scalabilità con rendimenti decrescenti |
Buffer del database | Un singolo buffer di database utilizzato da tutte le UoP. (Un'unità di parallelismo). Un singolo archivio dati a cui accedono tutte le UoP. | Query Controller fornisce funzioni alle UoP che possiedono i dati |
Negozi | Memorizza TERA BYTE[Billioni di righe] | GIGA BYTE[Milioni di righe] |
MPP contro SMP
MPP | SMP |
---|---|
MPP – Elaborazione massivamente parallela. È un sistema informatico collegato a molte unità aritmetiche indipendenti o interi microprocessori, che funzionano in parallelo. | Multielaborazione simmetrica. In un sistema di elaborazione SMP, le CPU condividono la stessa memoria e, di conseguenza, il codice in esecuzione in un sistema può influire sulla memoria utilizzata da un altro. |
I database possono espandersi aggiungendo nuove CPU. | I database SMP generalmente utilizzano una CPU per eseguire le ricerche nei database. |
In un ambiente MPP, le prestazioni migliorano perché nessuna risorsa deve essere condivisa tra i computer fisici. | Il carico di lavoro per un lavoro parallelo viene distribuito tra i processori nel sistema. |
Le prestazioni di un sistema di elaborazione parallela Massive sono lineari. Tuttavia, aumenterà in proporzione al numero di nodi. | I database SMP possono essere eseguiti su più server. Tuttavia, condividerà un'altra risorsa. |
Sommario
- Significato di Teradata: Teradata è un open source Sistema di gestione del database per lo sviluppo di applicazioni di data warehousing su larga scala.
- Teradata era una divisione di NCR Corporation. È stata costituita nel 1979 ma si è separata da NCR nell'ottobre 2007
- Teradata offre una suite completa di servizi incentrata sul Data Warehousing
- Teradata offre scalabilità lineare quando si gestiscono grandi volumi di dati aggiungendo nodi per aumentare le prestazioni del sistema.
- Tre componenti importanti di Teradata sono 1) Motore di analisi 2) MPP 3) Processori del modulo di accesso (AMP)
- Teradata offre una gamma completa di suite di prodotti per soddisfare le esigenze di data warehousing ed ETL di qualsiasi organizzazione
- Applicazione Teradata utilizzata principalmente per la gestione della supply chain, la gestione dei dati master, la gestione della catena di domanda, ecc.