Tutorial de Hive para principiantes

Resumen del tutorial de la colmena


Apache Hive ayuda a consultar y administrar grandes conjuntos de datos muy rรกpidamente. Es un Herramienta ETL para el ecosistema Hadoop. En este tutorial de Apache Hive para principiantes, aprenderรก los conceptos bรกsicos de Hive y temas importantes como consultas HQL, extracciones de datos, particiones, contenedores, etc. Esta serie de tutoriales de Hive lo ayudarรก a aprender los conceptos y los conceptos bรกsicos de Hive.

ยฟQuรฉ debo saber?


Para aprender este tutorial de consulta de Hive, necesita conocimientos bรกsicos de sql, Hadoop y el conocimiento de otras bases de datos serรก de ayuda adicional.

Programa del curso de colmena

Introducciรณn

๐Ÿ‘‰ Lessel 1 ยฟQuรฉ es Hive? - ArchiTecnologรญa y modos
๐Ÿ‘‰ Lessel 2 Descargar e instalar HIVE โ€” Cรณmo descargar e instalar HIVE en Ubuntu
๐Ÿ‘‰ Lessel 3 Configuraciรณn del metaalmacรฉn HIVE โ€” Por quรฉ utilizar MySQL?
๐Ÿ‘‰ Lessel 4 Tipos de datos de colmena โ€” Crear y soltar una base de datos en Hive

cosas avanzadas

๐Ÿ‘‰ Lessel 1 Tabla de creaciรณn de colmena โ€” Tipos y su uso
๐Ÿ‘‰ Lessel 2 Particiones y depรณsitos de colmena โ€” Aprende con el ejemplo
๐Ÿ‘‰ Lessel 3 รndices y vistas de Hive โ€” Aprende con el ejemplo
๐Ÿ‘‰ Lessel 4 Consultas de colmena โ€” Aprende con el ejemplo
๐Ÿ‘‰ Lessel 5 Tutorial de uniรณn y subconsulta de Hive โ€” Aprende con el ejemplo
๐Ÿ‘‰ Lessel 6 Tutorial del lenguaje de consulta de Hive โ€” Incorporado Operatoros
๐Ÿ‘‰ Lessel 7 Funciรณn de colmena โ€” Funciones integradas y definidas por el usuario
๐Ÿ‘‰ Lessel 8 Colmena ETL โ€” Carga de ejemplos de datos de texto, JSON y XML
๐Ÿ‘‰ Lessel 9 Preguntas de la entrevista de la colmena โ€” Preguntas y respuestas de la entrevista de los 40 mejores de Hive

Introducciรณn a la colmena

Hive evolucionรณ como una soluciรณn de almacenamiento de datos construida sobre el marco Hadoop Map-Reduce.

El tamaรฑo de los conjuntos de datos que se recopilan y analizan en la industria para inteligencia empresarial estรก creciendo y, en cierto modo, estรก encareciendo las soluciones tradicionales de almacenamiento de datos. Hadoop con el marco MapReduce, se estรก utilizando como una soluciรณn alternativa para analizar conjuntos de datos de gran tamaรฑo. Sin embargo, Hadoop ha demostrado ser รบtil para trabajar con grandes conjuntos de datos, su marco MapReduce es de muy bajo nivel y requiere que los programadores escriban programas personalizados que son difรญciles de mantener y reutilizar. Hive viene aquรญ para rescatar a los programadores.


motor de colmena compila estas consultas en trabajos de Map-Reduce para que se ejecuten en Hadoop. Ademรกs, tambiรฉn se pueden conectar scripts de Map-Reduce personalizados a las consultas. Hive opera con datos almacenados en tablas que constan de tipos de datos primitivos y tipos de datos de recopilaciรณn como matrices y mapas.

Hive viene con una interfaz de shell de lรญnea de comandos que se puede utilizar para crear tablas y ejecutar consultas.

El lenguaje de consulta de Hive es similar a SQL y admite subconsultas. Con el lenguaje de consulta de Hive, es posible realizar uniones de MapReduce en tablas de Hive. Tiene un soporte para simple Funciones similares a SQLโ€“ CONCAT, SUBSTR, ROUND, etc., y funciones de agregaciรณnโ€“ SUM, COUNT, MAX, etc. Tambiรฉn admite clรกusulas GROUP BY y SORT BY. Tambiรฉn es posible escribir funciones definidas por el usuario en el lenguaje de consulta de Hive.

ยฟQuรฉ es Hive?

Colmena Apache es un marco de almacenamiento de datos para consultar y analizar datos almacenados en HDFS. Estรก desarrollado sobre Hadoop. Hive es un software de cรณdigo abierto para analizar grandes conjuntos de datos en Hadoop. Proporciona un lenguaje declarativo similar a SQL, llamado HiveQL, para expresar consultas. Usando Hive-QL, los usuarios asociados con SQL Puede realizar anรกlisis de datos muy fรกcilmente.

Reducir colmena vs mapa

Antes de elegir una de estas dos opciones, debemos fijarnos en algunas de sus caracterรญsticas.

Al elegir entre Hive y Map reduce se tienen en cuenta los siguientes factores:

  • Tipo de datos
  • La cantidad de datos
  • Complejidad del cรณdigo

ยฟReducir colmena versus mapa?

Caracterรญstica Colmena Mapa reducido
Idioma Admite SQL como lenguaje de consulta para interacciรณn y modelado de datos.
  • Compila un lenguaje con dos tareas principales presentes en รฉl. Una es una tarea de mapa y otra es un reductor.
  • Podemos definir estas tareas usando Java or Python
Nivel de abstracciรณn Mayor nivel de abstracciรณn ademรกs de HDFS Menor nivel de abstracciรณn
Eficiencia en el cรณdigo Comparativamente menor que la reducciรณn del mapa Proporciona alta eficiencia
extensiรณn del cรณdigo Less Nรบmero de lรญneas de cรณdigo necesarias para la ejecuciรณn. Mรกs nรบmero de lรญneas de cรณdigos por definir
Tipo de trabajo de desarrollo requerido Less Trabajo de desarrollo requerido Se necesita mรกs trabajo de desarrollo

Haga clic para Siguiente tutorial

Resumir este post con: