Tutorial Teradata: O que é Teradata SQL? Base de dados Archiarquitetura

O que é Teradata?

Teradata é um Sistema de Gerenciamento de Banco de Dados de código aberto para desenvolver aplicativos de data warehouse de larga escala. Esta ferramenta fornece suporte para múltiplas operações de data warehouse simultaneamente usando o conceito de paralelismo. Teradata é um sistema de processamento massivamente aberto que suporta Unix/Linux/Windows plataformas de servidores.

O software Teradata é desenvolvido pela Teradata Corporation, uma empresa americana de TI. É um fornecedor de plataformas de dados analíticos, aplicativos e outros serviços relacionados. A empresa desenvolve um produto para consolidar dados de diversas fontes e disponibilizá-los para análise.

História do Teradata

Teradata era uma divisão da NCR Corporation. Foi constituída em 1979, mas se separou da NCR em outubro de 2007. Michael Koehler tornou-se o primeiro CEO da Teradata.

Marcos da Teradata Corporation:

  • 1979 – A Teradata foi incorporada
  • 1984 – Lançamento do primeiro computador de banco de dados DBC/1012
  • 1986 – A revista Fortune declarou o Teradata como 'Produto do Ano'
  • 1999 – Maior banco de dados construído usando Teradata com 130 Terabytes
  • 2002 – Lançamento da versão Teradata V2R5 com compactação e partição primária
  • 2006 – Lançamento da solução Teradata Master Data Management
  • 2008 – Teradata 13.0 lançado com Active Data Warehousing
  • 2011 – Adquire a Teradata Aster e mergulha no espaço de análise avançada
  • 2012 – Lançado o Teradata 14.0
  • 2014 – Lançado o Teradata 15.0
  • 2015- Teradata compra plataforma de marketing de aplicativos Appoxee
  • 2016- Terada dá as mãos ao Big data
  • 2017- Teradata adquire StackIQ de San Diego

Por que Teradata?

  • A Teradata oferece um conjunto completo de serviços com foco em Data warehousing
  • O sistema é construído em arquitetura aberta. Assim, sempre que algum dispositivo mais rápido for disponibilizado, ele poderá ser incorporado à arquitetura já construída.
  • Teradata suporta mais de 50 petabytes de dados.
  • Visualização de operação única para um grande sistema Teradata de vários nós usando Service Workstation
  • Compatível com ampla gama de ferramenta de BI para buscar dados.
  • Pode atuar como um ponto único de controle para o DBA gerenciar o banco de dados.
  • Alto desempenho, consultas diversas, análises no banco de dados e gerenciamento sofisticado de carga de trabalho
  • Teradata permite que você obtenha os mesmos dados em várias opções de implantação

A seguir neste tutorial do Teradata, aprenderemos sobre os recursos do Teradata.

Recursos do Teradata SQL

O Teradata oferece os seguintes recursos poderosos:

  • Escalabilidade linear: Oferece escalabilidade linear ao lidar com grandes volumes de dados, adicionando nós para aumentar o desempenho do sistema.
  • Paralelismo Ilimitado: Teradata é baseado em MPP (Massively Parallel Processing Architextura). Então, ele foi projetado para ser paralelo desde o início. Ele pode dividir uma tarefa grande em tarefas menores e executá-las em paralelo
  • Otimizador maduro: O Teradata Optimizer pode lidar com até 64 junções em uma consulta.
  • Baixo TCO: Os dados Tera têm um baixo custo total de propriedade. É fácil de configurar, manter e administrar.
  • Utilitários de carga e descarga: Teradata fornece utilitários de carga e descarga para mover dados de/para o sistema Teradata.
  • Conectividade: Este sistema MPP pode se conectar a sistemas conectados a canais, como um mainframe ou sistemas conectados à rede.
  • SQL: Suporta Teradata SQL para interagir com os dados armazenados em tabelas. Ele fornece sua extensão.
  • Utilitários robustos: Teradata fornece utilitários robustos para importar/exportar dados de/para sistemas Teradata como FastExport, FastLoad, MultiLoad e TPT.
  • Distribuição Automática: Teradata pode distribuir os dados para os discos automaticamente sem intervenção manual.

A seguir neste tutorial do Teradata SQL, aprenderemos sobre o Teradata Archiarquitetura.

Teradata Archiarquitetura

A arquitetura Teradata é um Processamento Massivamente Paralelo Archiarquitetura.

Três componentes importantes do Teradata são:

  • Mecanismo de análise
  • BYNET
  • Processadores de módulo de acesso (AMPs)

Armazenamento Teradata Archibanco de dados de arquitetura ArchiDiagrama de arquitetura:

Teradata Archiarquitetura
Teradata Archidiagrama de arquitetura

Armazenamento Teradata Archiarquitetura

Mecanismo de análise:

O Mecanismo de Análise analisa as consultas e prepara o plano de execução. Ele gerencia sessões para usuários. Ele otimiza e envia uma solicitação aos usuários.

Assim, quando o cliente executa consultas para inserção de registros, o Parsing Engine envia os registros para a camada Message Passing. Camada de passagem de mensagens ou BYNET é um componente de software e hardware. Oferece capacidade de rede. Ele também recupera os registros e envia a linha para o AMP de destino.

AMP:

AMP significa Processador de Módulo de Acesso. Ele armazena registros nesses discos. A AMP realiza as seguintes atividades:

  • Gerencia uma parte do banco de dados
  • Gerencia uma parte de cada tabela
  • Execute todas as tarefas associadas à geração do conjunto de resultados, como classificação, agregação e junção
  • Execute o gerenciamento de bloqueio e espaço

Recuperação de Teradados Archiarquitetura

Quando o cliente executa consultas para recuperar registros, o mecanismo de análise envia uma solicitação ao BYNET. Em seguida, a BYNET envia a solicitação de recuperação aos AMPs apropriados.

Os AMPs pesquisam seus discos em paralelo, reconhecem os registros necessários e os enviam para a BYNET. BYNET envia os registros para o Parsing Engine, que por sua vez será enviado ao cliente.

A seguir neste tutorial do banco de dados Teradata, aprenderemos sobre os comandos SQL do Teradata.

Tipos de comandos SQL do Teradata

O banco de dados Teradata oferece suporte aos seguintes comandos SQL básicos:

  1. Comandos de linguagem de definição de dados (DDL)
  2. Comandos de linguagem de controle de dados (DCL)
  3. Comandos de linguagem de manipulação de dados (DML)

Comandos da linguagem de definição de dados

COMANDO Descrição
CRIAR Cria um novo banco de dados, tabela, usuário, etc.
GOTA Remove um novo banco de dados, tabela, usuário, etc.
ALTERAR Altera uma tabela, coluna, gatilho, etc.
MODIFICAR Altera um banco de dados ou definição de usuário
RENOMEAR Altera o nome de tabelas, visualizações, macros, etc.

Comandos da linguagem de controle de dados

COMANDO Descrição
CONCEDER/REVOGAR Usado para controlar privilégios de um usuário em um objeto
CONCEDER LOGON/REVOGAR LOGON Usado para controlar privilégios de logon em um host ou grupo de hosts
DAR Usado para fornecer um objeto de banco de dados para outro objeto de banco de dados

Comandos da linguagem de manipulação de dados SQL do banco de dados Teradata

COMANDO Descrição
EXCLUIR Remove uma linha da tabela
ECHO Usado para ecoar uma string ou comando para o cliente
PONTO DE VERIFICAÇÃO Define um ponto de recuperação no diário que pode ser usado posteriormente para restaurar o conteúdo da tabela
SELECIONE Usado para retornar dados de uma linha específica em um formato de tabela
ATUALIZAÇÃO Modifica dados em uma ou mais linhas de uma tabela

Aplicações do banco de dados Teradata

A seguir estão os aplicativos Teradata populares:

  • Gerenciamento de dados do cliente: Ajuda a manter relacionamentos duradouros com os clientes.
  • Gerenciamento de dados mestre: Ajuda a desenvolver um ambiente onde os dados mestres podem ser usados, sincronizados e armazenados.
  • Gestão Financeira e de Desempenho: Ajuda a organização a melhorar a velocidade e a qualidade dos relatórios financeiros. Reduz os custos de infraestrutura financeira e gerencia proativamente o desempenho da empresa.
  • Gestão da Cadeia de Suprimento: Melhore as operações da cadeia de suprimentos, o que ajuda a melhorar o atendimento ao cliente, reduzir os tempos de ciclo e diminuir os estoques.
  • Gestão da Cadeia de Demanda: Ajuda a aumentar os níveis de atendimento ao cliente e as vendas. Também ajuda as empresas a prever com precisão a demanda por itens de sua loja.

A seguir neste tutorial do Teradata para iniciantes, aprenderemos sobre a diferença entre o Teradata e outros RDBMS.

Diferença entre Teradata e outros RDBMS

Parâmetro DADOS DA TERA RDBMS
Architexturas Não segue nada compartilhado Archiarquitetura. Compartilhou tudo e permite a contenção de recursos.
Processos MIPS [milhões de instruções/s] KIPS [milhares de instituições/s]
Índices Melhor distribuição e recuperação Oferece apenas recuperação FASI
Paralelismo Suporta paralelismo incondicional. O paralelismo é condicional e imprevisível
Carga a granel Teradata permite carregamento em massa. Permite apenas carregamento em massa limitado.
Escalabilidade Escalabilidade linear com inclinação de um Escalabilidade com retornos decrescentes
Buffer de banco de dados Um único buffer de banco de dados usado por todas as UoPs. (Uma unidade de paralelismo). Um único armazenamento de dados acessado por todas as UoPs O Query Controller envia funções para UoPs que possuem os dados
Lojas Ele armazena TERA BYTES[Billíons de linhas] GIGA BYTES[Milhões de linhas]

MPP x SMP

MPP SMP
MPP – Processamento Massivamente Paralelo. É um sistema de computador conectado a muitas unidades aritméticas independentes ou microprocessadores inteiros, que funcionam em paralelo. Multiprocessamento simétrico. Em um sistema de processamento SMP, as CPUs compartilham a mesma memória e, como resultado, o código executado em um sistema pode afetar a memória usada por outro.
Os bancos de dados podem ser expandidos adicionando novas CPUs. Os bancos de dados SMP geralmente usam uma CPU para realizar pesquisas no banco de dados.
Em um ambiente MPP, o desempenho é melhorado porque nenhum recurso deve ser compartilhado entre computadores físicos. A carga de trabalho de uma tarefa paralela é distribuída entre os processadores do sistema.
O desempenho de um sistema de processamento paralelo massivo é linear. No entanto, aumentará proporcionalmente ao número de nós. Os bancos de dados SMP podem ser executados em vários servidores. No entanto, compartilhará outro recurso.

Resumo

  • Significado de Teradata: Teradata é um código aberto Sistema de gerenciamento de banco de dados para o desenvolvimento de aplicações de armazenamento de dados em grande escala.
  • Teradata era uma divisão da NCR Corporation. Foi constituída em 1979, mas se separou da NCR em outubro de 2007
  • Teradata oferece um conjunto completo de serviços com foco em Data Warehousing
  • O Teradata oferece escalabilidade linear ao lidar com grandes volumes de dados, adicionando nós para aumentar o desempenho do sistema.
  • Três componentes importantes do Teradata são 1) Mecanismo de análise 2) MPP 3) Processadores de módulo de acesso (AMPs)
  • A Teradata oferece uma gama completa de conjuntos de produtos para atender às necessidades de armazenamento de dados e ETL de qualquer organização
  • Aplicativo Teradata usado principalmente para gerenciamento da cadeia de suprimentos, gerenciamento de dados mestre, gerenciamento da cadeia de demanda, etc.