Tutorial de Hive para principiantes
Resumen del tutorial de la colmena
Apache Hive ayuda a consultar y administrar grandes conjuntos de datos muy rรกpidamente. Es un Herramienta ETL para el ecosistema Hadoop. En este tutorial de Apache Hive para principiantes, aprenderรก los conceptos bรกsicos de Hive y temas importantes como consultas HQL, extracciones de datos, particiones, contenedores, etc. Esta serie de tutoriales de Hive lo ayudarรก a aprender los conceptos y los conceptos bรกsicos de Hive.
ยฟQuรฉ debo saber?
Para aprender este tutorial de consulta de Hive, necesita conocimientos bรกsicos de sql, Hadoop y el conocimiento de otras bases de datos serรก de ayuda adicional.
Programa del curso de colmena
Introducciรณn
| ๐ Lessel 1 | ยฟQuรฉ es Hive? - ArchiTecnologรญa y modos |
| ๐ Lessel 2 | Descargar e instalar HIVE โ Cรณmo descargar e instalar HIVE en Ubuntu |
| ๐ Lessel 3 | Configuraciรณn del metaalmacรฉn HIVE โ Por quรฉ utilizar MySQL? |
| ๐ Lessel 4 | Tipos de datos de colmena โ Crear y soltar una base de datos en Hive |
cosas avanzadas
| ๐ Lessel 1 | Tabla de creaciรณn de colmena โ Tipos y su uso |
| ๐ Lessel 2 | Particiones y depรณsitos de colmena โ Aprende con el ejemplo |
| ๐ Lessel 3 | รndices y vistas de Hive โ Aprende con el ejemplo |
| ๐ Lessel 4 | Consultas de colmena โ Aprende con el ejemplo |
| ๐ Lessel 5 | Tutorial de uniรณn y subconsulta de Hive โ Aprende con el ejemplo |
| ๐ Lessel 6 | Tutorial del lenguaje de consulta de Hive โ Incorporado Operatoros |
| ๐ Lessel 7 | Funciรณn de colmena โ Funciones integradas y definidas por el usuario |
| ๐ Lessel 8 | Colmena ETL โ Carga de ejemplos de datos de texto, JSON y XML |
| ๐ Lessel 9 | Preguntas de la entrevista de la colmena โ Preguntas y respuestas de la entrevista de los 40 mejores de Hive |
Introducciรณn a la colmena
Hive evolucionรณ como una soluciรณn de almacenamiento de datos construida sobre el marco Hadoop Map-Reduce.
El tamaรฑo de los conjuntos de datos que se recopilan y analizan en la industria para inteligencia empresarial estรก creciendo y, en cierto modo, estรก encareciendo las soluciones tradicionales de almacenamiento de datos. Hadoop con el marco MapReduce, se estรก utilizando como una soluciรณn alternativa para analizar conjuntos de datos de gran tamaรฑo. Sin embargo, Hadoop ha demostrado ser รบtil para trabajar con grandes conjuntos de datos, su marco MapReduce es de muy bajo nivel y requiere que los programadores escriban programas personalizados que son difรญciles de mantener y reutilizar. Hive viene aquรญ para rescatar a los programadores.
motor de colmena compila estas consultas en trabajos de Map-Reduce para que se ejecuten en Hadoop. Ademรกs, tambiรฉn se pueden conectar scripts de Map-Reduce personalizados a las consultas. Hive opera con datos almacenados en tablas que constan de tipos de datos primitivos y tipos de datos de recopilaciรณn como matrices y mapas.
Hive viene con una interfaz de shell de lรญnea de comandos que se puede utilizar para crear tablas y ejecutar consultas.
El lenguaje de consulta de Hive es similar a SQL y admite subconsultas. Con el lenguaje de consulta de Hive, es posible realizar uniones de MapReduce en tablas de Hive. Tiene un soporte para simple Funciones similares a SQLโ CONCAT, SUBSTR, ROUND, etc., y funciones de agregaciรณnโ SUM, COUNT, MAX, etc. Tambiรฉn admite clรกusulas GROUP BY y SORT BY. Tambiรฉn es posible escribir funciones definidas por el usuario en el lenguaje de consulta de Hive.
ยฟQuรฉ es Hive?
Colmena Apache es un marco de almacenamiento de datos para consultar y analizar datos almacenados en HDFS. Estรก desarrollado sobre Hadoop. Hive es un software de cรณdigo abierto para analizar grandes conjuntos de datos en Hadoop. Proporciona un lenguaje declarativo similar a SQL, llamado HiveQL, para expresar consultas. Usando Hive-QL, los usuarios asociados con SQL Puede realizar anรกlisis de datos muy fรกcilmente.
Reducir colmena vs mapa
Antes de elegir una de estas dos opciones, debemos fijarnos en algunas de sus caracterรญsticas.
Al elegir entre Hive y Map reduce se tienen en cuenta los siguientes factores:
- Tipo de datos
- La cantidad de datos
- Complejidad del cรณdigo
ยฟReducir colmena versus mapa?
| Caracterรญstica | Colmena | Mapa reducido |
|---|---|---|
| Idioma | Admite SQL como lenguaje de consulta para interacciรณn y modelado de datos. |
|
| Nivel de abstracciรณn | Mayor nivel de abstracciรณn ademรกs de HDFS | Menor nivel de abstracciรณn |
| Eficiencia en el cรณdigo | Comparativamente menor que la reducciรณn del mapa | Proporciona alta eficiencia |
| extensiรณn del cรณdigo | Less Nรบmero de lรญneas de cรณdigo necesarias para la ejecuciรณn. | Mรกs nรบmero de lรญneas de cรณdigos por definir |
| Tipo de trabajo de desarrollo requerido | Less Trabajo de desarrollo requerido | Se necesita mรกs trabajo de desarrollo |
Haga clic para Siguiente tutorial
