Tutorial de Teradata: ¿Qué es Teradata SQL? Base de datos Architectura
¿Qué es Teradata?
Teradata es un sistema de gestión de bases de datos de código abierto para desarrollar aplicaciones de almacenamiento de datos a gran escala. Esta herramienta proporciona soporte para múltiples operaciones de almacenamiento de datos simultáneamente utilizando el concepto de paralelismo. Teradata es un sistema de procesamiento masivo y abierto que admite Unix/Linux/Windows plataformas de servidores.
El software Teradata es desarrollado por Teradata Corporation, que es una empresa de TI estadounidense. Es un proveedor de plataformas de datos analíticos, aplicaciones y otros servicios relacionados. La empresa desarrolla un producto para consolidar datos de diversas fuentes y ponerlos a disposición para su análisis.
Historia de Teradata
Teradata era una división de NCR Corporation. Se constituyó en 1979, pero se separó de NCR en octubre de 2007. Michael Koehler se convirtió en el primer director ejecutivo de Teradata.
Hitos de Teradata Corporation:
- 1979 – Se incorpora Teradata
- 1984 – Lanzamiento del primer ordenador de base de datos DBC/1012
- 1986 – La revista Fortune declaró a Teradata como “Producto del año”.
- 1999: la base de datos más grande creada con Teradata con 130 Terabytes
- 2002 – Lanzamiento de la versión Teradata V2R5 con compresión y partición primaria
- 2006 – Lanzamiento de la solución Teradata Master Data Management
- 2008: lanzamiento de Teradata 13.0 con Active Data Warehousing
- 2011 – Adquiere Teradata Aster y se sumerge en el espacio de análisis avanzado
- 2012 – Se introduce Teradata 14.0
- 2014 – Se introduce Teradata 15.0
- 2015- Teradata compra la plataforma de marketing de aplicaciones Appoxee
- 2016- Terada se une a Big data
- 2017- Teradata adquiere StackIQ de San Diego
¿Por qué Teradata?
- Teradata ofrece un conjunto completo de servicios que se centra en Almacenamiento de datos
- El sistema está construido sobre una arquitectura abierta, por lo que, siempre que haya dispositivos más rápidos disponibles, se podrán incorporar a la arquitectura ya construida.
- Teradata admite más de 50 petabytes de datos.
- Vista de operación única para un gran sistema multinodo Teradata que utiliza Service Workstation
- Compatible con una amplia gama de Herramienta de BI para obtener datos.
- Puede actuar como un único punto de control para que el DBA gestione la Database .
- Alto rendimiento, consultas diversas, análisis en la base de datos y gestión sofisticada de la carga de trabajo
- Teradata le permite obtener los mismos datos en múltiples opciones de implementación
A continuación, en este tutorial de Teradata, aprenderemos sobre las características de Teradata.
Características de Teradata SQL
Teradata ofrece las siguientes potentes funciones:
- Escalabilidad lineal: Ofrece escalabilidad lineal al tratar con grandes volúmenes de datos agregando nodos para aumentar el rendimiento del sistema.
- Paralelismo ilimitado: Teradata se basa en MPP (procesamiento masivo paralelo Architectura). Por lo tanto, está diseñado para ser paralelo desde el principio. Puede dividir una tarea grande en tareas más pequeñas y ejecutarlas en paralelo
- Optimizador maduro: Teradata Optimizer puede manejar hasta 64 uniones en una consulta.
- Costo total de propiedad bajo: Tera data tiene un costo total de propiedad bajo. Es fácil de configurar, mantener y administrar.
- Utilidades de carga y descarga: Teradata proporciona utilidades de carga y descarga para mover datos hacia/desde el sistema Teradata.
- Conectividad: Este sistema MPP se puede conectar a sistemas conectados a canales, como una computadora central o sistemas conectados a una red.
- SQL: Soportes de Teradata SQL para interactuar con los datos almacenados en tablas. Proporciona su extensión.
- Utilidades robustas: Teradata proporciona sólidas utilidades para importar/exportar datos desde/hacia sistemas Teradata como FastExport, FastLoad, MultiLoad y TPT.
- Distribución automática: Teradata puede distribuir los datos a los discos automáticamente sin intervención manual.
A continuación, en este tutorial de Teradata SQL, aprenderemos sobre Teradata. Architectura.
Teradata Architectura
La arquitectura de Teradata es un procesamiento masivamente paralelo Architectura.
Tres componentes importantes de Teradata son:
- Motor de análisis
- BYNET
- Procesadores de módulos de acceso (AMP)
Almacenamiento Teradata Archibase de datos de tecnología ArchiDiagrama de tecnología:
Almacenamiento Teradata Architectura
Motor de análisis:
El motor de análisis analiza las consultas y prepara el plan de ejecución. Gestiona las sesiones de los usuarios. Optimiza y envía una solicitud a los usuarios.
Entonces, cuando el cliente ejecuta consultas para insertar registros, Parsing Engine envía los registros a la capa de paso de mensajes. La capa de paso de mensajes o BYNET es un componente de software y hardware. Ofrece capacidad de conexión en red. También recupera los registros y envía la fila al AMP de destino.
AMPERIO:
AMP significa Procesador de módulo de acceso. Almacena registros en estos discos. AMP realiza las siguientes actividades:
- Gestiona una parte de la base de datos.
- Gestiona una parte de cada mesa.
- Realizar todas las tareas asociadas con la generación del conjunto de resultados, como ordenar, agregar y unir.
- Realizar gestión de bloqueo y espacio.
Recuperación de Teradata Architectura
Cuando el cliente ejecuta consultas para recuperar registros, el motor de análisis envía una solicitud a BYNET. Luego BYNET envía la solicitud de recuperación a los AMP correspondientes.
Los AMP buscan en sus discos en paralelo, reconocen los registros requeridos y los envían a BYNET. BYNET envía los registros a Parsing Engine, que a su vez se enviará al cliente.
A continuación, en este tutorial de Teradata Database, aprenderemos sobre los comandos SQL de Teradata.
Tipos de comandos SQL de Teradata
La base de datos Teradata admite los siguientes comandos SQL básicos:
- Comandos del lenguaje de definición de datos (DDL)
- Comandos del lenguaje de control de datos (DCL)
- Comandos del lenguaje de manipulación de datos (DML)
Comandos del lenguaje de definición de datos
COMANDO | Descripciones |
---|---|
CREAR | Crea una nueva base de datos, tabla, usuario, etc. |
DROP | Elimina una nueva base de datos, tabla, usuario, etc. |
ALTER | Cambia una tabla, columna, disparador, etc. |
MODIFICAR | Cambia una base de datos o una definición de usuario |
REBAUTIZAR | Cambia el nombre de tablas, vistas, macros, etc. |
Comandos del lenguaje de control de datos
COMANDO | Descripciones |
---|---|
OTORGAR/REVOCAR | Se utiliza para controlar los privilegios de un usuario sobre un objeto. |
CONCEDER EL INICIO DE SESIÓN/REVOCAR EL INICIO DE SESIÓN | Se utiliza para controlar los privilegios de inicio de sesión en un host o grupo de hosts. |
DAR | Se utiliza para dar un objeto de base de datos a otro objeto de base de datos. |
Comandos del lenguaje de manipulación de datos SQL de Teradata Database
COMANDO | Descripciones |
---|---|
BORRAR | Elimina una fila de la tabla |
ECHO | Se utiliza para hacer eco de una cadena o comando al cliente. |
CONTROL | Define un punto de recuperación en el diario que se puede utilizar más adelante para restaurar el contenido de la tabla. |
SELECT | Se utiliza para devolver datos de una fila específica en forma de tabla. |
ACTUALIZAR | Modifica datos en una o más filas de una tabla. |
Aplicaciones de la base de datos Teradata
Las siguientes son las aplicaciones populares de Teradata:
- Gestión de datos del cliente: Ayuda a mantener relaciones duraderas con los clientes.
- Gestión de datos maestros: Ayuda a desarrollar un entorno donde se puedan utilizar, sincronizar y almacenar datos maestros.
- Gestión financiera y del desempeño: Ayuda a la organización a mejorar la velocidad y la calidad de los informes financieros. Reduce los costos de infraestructura financiera y gestiona de manera proactiva el desempeño empresarial.
- Gestión de la cadena de suministro: Mejorar las operaciones de la cadena de suministro, lo que ayuda a mejorar el servicio al cliente, reducir los tiempos de ciclo y reducir los inventarios.
- Gestión de la cadena de demanda: Ayuda a aumentar los niveles de servicio al cliente y las ventas. También ayuda a las empresas a predecir con precisión la demanda de los artículos de su tienda.
A continuación, en este tutorial de Teradata para principiantes, aprenderemos sobre la diferencia entre Teradata y otros. RDBMS.
Diferencia entre Teradata y otros RDBMS
Parámetro | DATOS DE TERA | RDBMS |
---|---|---|
Architecturas | Sigue Compartido Nada Architectura. | Todo compartido y permite la contención de recursos. |
Procesos | MIPS [Millones de instrucciones/seg] | KIPS [Miles de instituciones/seg] |
Índices | Mejor distribución y recuperación | Sólo ofrece recuperación FASI |
Paralelismo | Admite paralelismo incondicional. | El paralelismo es condicional e impredecible. |
Carga masiva | Teradata permite la carga masiva. | Sólo permite una carga masiva limitada. |
Escalabilidad | Escalabilidad lineal con pendiente de uno | Escalabilidad con rendimientos decrecientes |
Buffer de base de datos | Un único búfer de base de datos utilizado por todas las UoP (una unidad de paralelismo). Un único almacén de datos al que acceden todas las UoP. | Query Controller envía funciones a las UoP que poseen los datos |
Tiendas | Almacena TERA BYTES[Billiones de filas] | GIGA BYTES[Millones de filas] |
MPP frente a SMP
MPP | SMP |
---|---|
MPP: procesamiento masivo en paralelo. Es un sistema informático que está conectado a muchas unidades aritméticas independientes o microprocesadores completos que funcionan en paralelo. | Multiprocesamiento simétrico. En un sistema de procesamiento SMP, las CPU comparten la misma memoria y, como resultado, el código que se ejecuta en un sistema puede afectar la memoria utilizada por otro. |
Las bases de datos se pueden expandir agregando nuevas CPU. | Las bases de datos SMP generalmente utilizan una CPU para realizar búsquedas en la base de datos. |
En un entorno MPP, el rendimiento mejora porque no se deben compartir recursos entre computadoras físicas. | La carga de trabajo de un trabajo paralelo se distribuye entre los procesadores del sistema. |
El rendimiento de un sistema de procesamiento paralelo masivo es lineal. Sin embargo, aumentará en proporción al número de nodos. | Las bases de datos SMP pueden ejecutarse en varios servidores. Sin embargo, compartiremos otro recurso. |
Resumen
- Significado de Teradata: Teradata es un software de código abierto. Sistema de administración de base de datos para desarrollar aplicaciones de almacenamiento de datos a gran escala.
- Teradata era una división de NCR Corporation. Se constituyó en 1979 pero se separó de NCR en octubre de 2007.
- Teradata ofrece un conjunto completo de servicios que se centra en el almacenamiento de datos.
- Teradata ofrece escalabilidad lineal cuando se trata de grandes volúmenes de datos agregando nodos para aumentar el rendimiento del sistema.
- Tres componentes importantes de Teradata son 1) Motor de análisis 2) MPP 3) Procesadores de módulo de acceso (AMP)
- Teradata ofrece una gama completa de productos para satisfacer las necesidades de almacenamiento de datos y ETL de cualquier organización.
- Aplicación Teradata utilizada principalmente para la gestión de la cadena de suministro, gestión de datos maestros, gestión de la cadena de demanda, etc.