O que é a linguagem de consulta Hive: operadores HiveQL

O que é a linguagem de consulta Hive (HiveQL)?

Linguagem de Consulta do Hive (HiveQL) é uma linguagem de consulta no Apache Hive para processamento e análise de dados estruturados. Ele separa os usuários do complexcapacidade de programação do Map Reduce. Ele reutiliza conceitos comuns de bancos de dados relacionais, como tabelas, linhas, colunas e esquemas, para facilitar o aprendizado. O Hive fornece uma CLI para gravação de consultas do Hive usando Hive Query Language (HiveQL).

A maioria das interações tende a ocorrer por meio de uma interface de linha de comando (CLI). Geralmente, a sintaxe do HiveQL é semelhante à SQL sintaxe com a qual a maioria dos analistas de dados está familiarizada. O Hive suporta quatro formatos de arquivo: TEXTFILE, SEQUENCEFILE, ORC e ​​RCFILE (Record Columnar File).

O Hive usa banco de dados derby para armazenamento de metadados de usuário único e, para metadados de vários usuários ou caso de metadados compartilhados, o Hive usa MYSQL.

Operadores integrados do HiveQL

O Hive fornece operadores integrados para operações de dados a serem implementadas nas tabelas presentes no armazém do Hive.

Esses operadores são utilizados para operações matemáticas em operandos e retornarão valores específicos de acordo com a lógica aplicada.

Abaixo estão os principais tipos de operadores integrados no HiveQL:

  • Operadores Relacionais
  • Operadores aritméticos
  • Operadores lógicos
  • Operadores em Complex tipos
  • Complex construtores de tipo

Operadores relacionais no Hive SQL

Usamos operadores relacionais para comparações de relacionamento entre dois operandos.

  • Operadores como igual, diferente, menor que, maior que… etc.
  • Os tipos de operandos são todos tipos de números nesses Operadores.

O seguintewing A tabela nos dará details sobre operadores relacionais e seu uso no HiveQL:

Operador integrado Descrição Operando
X = Y VERDADEIRO

se a expressão X for equivalente à expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X! = S VERDADEIRO

se a expressão X não for equivalente à expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X<Y VERDADEIRO

se a expressão X for menor que a expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X <= Y VERDADEIRO

se a expressão X for menor ou igual à expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X>Y VERDADEIRO

se a expressão X for maior que a expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X>= S VERDADEIRO

se a expressão X for maior ou igual à expressão Y

Caso contrário, FALSO.

Leva todos os tipos primitivos
X É NULO TRUE se a expressão X for avaliada como NULL, caso contrário, FALSE. Leva todos os tipos
X NÃO É NULO FALSE

Se a expressão X for avaliada como NULL, caso contrário, será TRUE.

Leva todos os tipos
X COMO Y VERDADEIRO

Se o padrão de string X corresponder a Y, caso contrário, FALSO.

Leva apenas cordas
X R COMO Y NULL se X ou Y for NULL, TRUE se qualquer substring de X corresponder ao Java expressão regular Y, caso contrário FALSE. Leva apenas cordas
X REGEXPY O mesmo que RLIKE. Leva apenas cordas

Operadores Aritméticos HiveQL

Usamos operadores aritméticos para realizar operações aritméticas em operandos

  • Operações aritméticas como adição, subtração, multiplicação e divisão entre operandos utilizamos esses Operadores.
  • Todos os tipos de operandos são tipos de números nesses operadores

Exemplo de exemplo:

2 + 3 dá o resultado 5.

Neste exemplo, '+' é o operador e 2 e 3 são operandos. O valor de retorno é 5

O seguintewing A tabela nos dará details sobre operadores aritméticos em Hive Query Language:

Operador integrado Descrição Operando
X + Y Ele retornará a saída da adição dos valores X e Y. Leva todos os tipos de números
X - Y Ele retornará a saída da subtração de Y do valor de X. Leva todos os tipos de números
X*Y Ele retornará a saída da multiplicação dos valores X e Y. Leva todos os tipos de números
X/Y Ele retornará a saída da divisão de Y de X. Leva todos os tipos de números
X % Y Ele retornará o restante resultante da divisão de X por Y. Leva todos os tipos de números
X e Y Ele retornará a saída de AND bit a bit de X e Y. Leva todos os tipos de números
X | S Ele retornará a saída de OR bit a bit de X e Y. Leva todos os tipos de números
X^Y Ele retornará a saída de XOR bit a bit de X e Y. Leva todos os tipos de números
~X Ele retornará a saída bit a bit NOT de X. Leva todos os tipos de números

Operadores lógicos Hive QL

Usamos operadores lógicos para realizar operações lógicas em operandos

  • Operações lógicas como AND, OR, NOT entre operandos usamos esses Operadores.
  • Todos os tipos de operandos são do tipo BOOLEAN nestes operadores

O seguintewing A tabela nos dará details sobre operadores lógicos no HiveSQL:

Operadores Descrição Operandos
X E Y VERDADEIRO se X e Y forem VERDADEIROS, caso contrário, FALSO. Somente tipos booleanos
X && Y O mesmo que X E Y, mas aqui usamos o símbolo && Somente tipos booleanos
X OU Y VERDADEIRO se X ou Y ou ambos forem VERDADEIROS, caso contrário FALSO. Somente tipos booleanos
X || S O mesmo que X OR Y, mas aqui usamos || símbolo Somente tipos booleanos
NÃO X VERDADEIRO se X for FALSO, caso contrário, FALSO. Somente tipos booleanos
!X O mesmo que NOT X, mas aqui estamos usando! símbolo Somente tipos booleanos

Operadores em Complex Tipos

O seguintewing A tabela nos dará details sobre Complex Digite Operadores. São operadores que fornecerão um mecanismo diferente para acessar elementos em comunicaçãoplex tipos.

Operadores Operandos Descrição
Um] A é um array en é um tipo inteiro Ele retornará o enésimo elemento no array A. O primeiro elemento tem índice 0
M[chave] M é um mapa e a chave tem tipo K Ele retornará os valores pertencentes à chave no mapa

Complex Construtores de tipo

O seguintewing A tabela nos dará details sobre Complex digite Construtores. Ele construirá instâncias em complex tipos de dados. Estes são de complex tipos de dados, como tipos Array, Map e Struct em Colméia.

Nesta seção, veremos as operações realizadas no Complex digite Construtores.

Operadores Operandos Descrição
ordem (val1, val2,…) Ele criará um array com os elementos fornecidos conforme mencionado como val1, val2
Criar_ união (etiqueta, val1, val2,…) Ele criará um tipo de união com os valores que estão sendo mencionados pelo parâmetro tag
mapa, (chave1, valor1, chave2, valor2,…) Ele criará um mapa com os pares chave/valor fornecidos mencionados nos operandos
Estrutura_nomeada (nome1, val1, nome2, val2,…) Ele criará um Struct com os nomes de campo fornecidos e os valores mencionados nos operandos
ESTRUTURA (val1, val2, val3,…) Cria uma estrutura com os valores de campo fornecidos. Os nomes dos campos estruturais serão col1, col2, .

Resumo

  • Hive Query Language (HiveQL) é uma linguagem de consulta em apache Hive para processamento e análise de dados estruturados.
  • O Hive fornece operadores integrados para operações de dados a serem implementadas nas tabelas presentes no armazém do Hive.
  • Os tipos de operadores integrados no HiveQL são:
  • Operadores Relacionais
  • Operadores aritméticos
  • Operadores lógicos
  • Operadores em Complex tipos
  • Complex construtores de tipo