Hive Tabel maken: interne tabel, wijzigen, neerzetten met voorbeelden

Tabelbewerkingen zoals Creëren, veranderen en laten vallen tabellen in Hive kunt u in deze zelfstudie bekijken.

In de onderstaande schermafbeelding maken we een tabel met kolommen en wijzigen we de tabelnaam.

1. Tabel guru_sample maken met twee kolomnamen zoals “empid” en “empname”

2. Tabellen weergeven die aanwezig zijn in de guru99-database

3. Guru_sample wordt weergegeven onder tabellen

4. Tabel “guru_sample” wijzigen als “guru_sampleNew”

5. Nogmaals, wanneer u de opdracht “show” uitvoert, wordt de nieuwe naam Guru_sampleNew weergegeven

Hive Tabel maken

Dropping table guru_sampleNew:

Hive Tabel maken

Tabeltypen en het gebruik ervan

Komt naar Tafels het is net als de manier waarop we creëren in traditionele relationele databases. De functionaliteiten zoals filteren, joins kunnen op de tabellen worden uitgevoerd.

Bijenkorf behandelt twee soorten tabelstructuren, zoals Intern en extern tabellen, afhankelijk van het laden en ontwerp van het schema in Hive.

Interne tabellen

  • Interne Tabel is nauw gekoppeld van aard. Bij dit type tabel moeten we eerst een tabel maken en de gegevens laden.
  • We kunnen deze noemen als gegevens over schema.
  • Als u deze tabel verwijdert, worden zowel de gegevens als het schema verwijderd.
  • De opgeslagen locatie van deze tabel is /user/hive/warehouse.

Wanneer kies je voor een interne tafel?

  • Als de verwerkingsgegevens beschikbaar zijn in het lokale bestandssysteem
  • Als we willen dat Hive de volledige levenscyclus van gegevens beheert, inclusief de verwijdering

Voorbeeldcodefragment voor interne tabel

1. Om de interne tabel te maken

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);
	 Row format delimited 
	 Fields terminated by '\t';

2. Laad de gegevens in de interne tabel

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Geef de inhoud van de tabel weer

    Hive>select * from guruhive_internaltable;

4. Om de interne tabel te verwijderen

    Hive>DROP TABLE guruhive_internaltable;

Als u de guruhive_internaltable hebt verwijderd, worden de metagegevens en de gegevens ervan uit Hive verwijderd.

Van de volgendewing screenshot, kunnen we de uitvoer observeren

Interne tabellen

In bovenstaande code en uit screenshot doen we following dingen,

  • Maak de interne tabel
  • Laad de gegevens in de interne tabel
  • Geef de inhoud van de tabel weer
  • Om de interne tabel te verwijderen

Externe tabellen

  • Externe tabel is losjes gekoppeld van aard. Gegevens zullen beschikbaar zijn in HDFS. De tabel zal worden gemaakt op basis van HDFS-gegevens.
  • Op een andere manier kunnen we zeggen dat het creëert schema op gegevens.
  • Op het moment dat de tabel wordt verwijderd, wordt alleen het schema verwijderd. De gegevens zijn nog steeds beschikbaar in HDFS, net als voorheen.
  • Externe tabellen bieden een optie om meerdere schema's te maken voor de gegevens die zijn opgeslagen in HDFS, in plaats van de gegevens elke keer te verwijderen wanneer het schema wordt bijgewerkt

Wanneer kiest u voor een externe tafel?

  • Bij het verwerken van gegevens die beschikbaar zijn in HDFS
  • Handig wanneer de bestanden buiten Hive worden gebruikt

Voorbeeldcodefragment voor externe tabel

1. Maak een externe tabel

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)
	 Row format delimited
	 Fields terminated by '\t'
	 LOCATION '/user/guru99hive/guruhive_external;

2. Als we de locatie niet opgeven op het moment dat de tabel wordt gemaakt, kunnen we de gegevens handmatig laden

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Geef de inhoud van de tabel weer

  Hive>select * from guruhive_external;

4. Om de interne tabel te verwijderen

  Hive>DROP TABLE guruhive_external;

Van de volgendewing screenshot, kunnen we de uitvoer observeren

Externe tabellen

In bovenstaande code doen we following spullen

  • Maak de externe tabel
  • Laad de gegevens in de externe tabel
  • Geef de inhoud van de tabel weer
  • Externe tabel laten vallen

Verschil tussen interne versus externe tabellen

Kenmerk Intern Extern
Schema Gegevens over schema Schema over gegevens
Opslaglocatie /usr/hive/magazijn HDFS-locatie
Beschikbaarheid van data Binnen het lokale bestandssysteem Binnen HDFS