Come installare HIVE su Ubuntu (Guida al download e alla configurazione)

Prima dell'installazione di Apache Hive è necessario un servizio dedicato Hadoop installazione, attivo e funzionante con tutti i demoni Hadoop.

Per l'installazione di Hadoop, controlla questo link

Una volta che tutti i demoni Hadoop funzionano correttamente, avvia l'installazione della parte Hive.

Processo di installazione di HIVE-

  1. Installazione di Hive
  2. Comandi della shell Hive

Come installare Hive su Ubuntu

Di seguito è riportato un processo passo passo su come installare Hive in Ubuntu:

Passaggio 1) Scarica e installa Hive su Ubuntu

Per scaricare la configurazione stabile di Hive fare riferimento Apache URL come indicato di seguito

http://www.apache.org/dyn/closer.cgi/hive/. Vai all'URL e seleziona il collegamento per il download del mirror Apache.

Installa Hive su Ubuntu

Seleziona la versione più recente della configurazione Hive. (Nel mio caso attuale è hive – 3.1.2)

Installa Hive su Ubuntu

Fare clic sul file bin e verrà avviato il download.

Installa Hive su Ubuntu

Passaggio 2) Estrarre il file tar

Vai alla posizione del file Tar scaricato -> estrai il file tar utilizzando il seguente comando per installare Hive Ubuntu sul tuo sistema

tar –xvf  apache-hive-3.1.2-bin.tar.gz

Installa Hive su Ubuntu

Passaggio 3) Posiziona diverse proprietà di configurazione in Apache Hive

In questo passaggio faremo due cose

  1. Inserimento del percorso Home Hive nel file bashrc
  2. Inserimento della posizione del percorso Home Hadoop in hive-config.sh
  1. Menzione Percorso Hive ~/.bashrc

Installa Hive su Ubuntu

  • Apri il file bashrc come mostrato nello screenshot sopra
  • Menziona il percorso home di Hive, ad esempio il percorso HIVE_HOME nel file bashrc ed esportalo come mostrato di seguito

Installa Hive su Ubuntu

Codice da inserire in bashrc

export HIVE_HOME="/home/guru99hive/apache-hive-1.2.0-bin"
export PATH=$PATH:$HIVE_HOME/bin
  1. Esportazione Percorso Hadoop in Hive-config.sh (Per comunicare con l'ecosistema Hadoop stiamo definendo il percorso Hadoop Home nel campo di configurazione hive)Apri hive-config.sh come mostrato di seguito

Installa Hive su Ubuntu

Mention the HADOOP_HOME Path  in hive-config.sh file as shown in below  ( HADOOP_HOME Path)

Installa Hive su Ubuntu

Passaggio 4) Crea directory Hive in Hadoop

Per comunicare con Hadoop, dobbiamo creare directory in Hadoop come mostrato di seguito.

Installa Hive su Ubuntu

Concedere i permessi di root per creare cartelle Hive in Hadoop. Se non genera alcun messaggio di errore, significa che Hadoop ha concesso con successo le autorizzazioni alle cartelle Hive.

Installa Hive su Ubuntu

Passaggio 5) Accedi alla shell Hive

Entrare nella shell Hive inserendo '. /alveare' comando come mostrato di seguito.

Installa Hive su Ubuntu

Comandi della shell Hive

Qui creeremo una tabella di esempio utilizzando il comando "crea" della shell Hive con i nomi delle colonne.

Codice di esempio per la creazione di database in Hive

Comandi della shell dell'alveare

Dallo screenshot qui sopra possiamo osservare quanto segue:

  1. Creazione di una tabella di esempio con nomi di colonne in Hive
  • Qui il nome della tabella è "prodotto" con tre nomi di colonne prodotto, nome e prezzo
  • I tre nomi di colonna indicati dal rispettivo tipo di dati
  • Tutti i campi terminano con una virgola ', '
  1. Visualizzazione delle informazioni sulla tabella Hive
  • Utilizzando il comando "descrivi" possiamo vedere le informazioni della tabella presenti in Hive
  • Qui vengono visualizzati i nomi delle colonne con i rispettivi tipi di dati presenti nello schema della tabella
  • Alla fine, verrà visualizzato il tempo necessario per eseguire questo comando e il numero di righe recuperate

Codice di esempio per la creazione di un database in Alveare (Per l'autocontrollo)

1) Crea la tabella prodotto (prodotto int, stringa pname, prezzo float)

Row format delimited
Fields terminated by ',';

2)descrivi il prodotto: