Hive-Tabelle erstellen: Interne Tabelle, ändern, löschen mit Beispielen

Tisch Operationen wie Erstellen, Ändern und Löschen Tabellen in Hive können in diesem Tutorial beobachtet werden.

Im folgenden Screenshot erstellen wir eine Tabelle mit Spalten und ändern den Tabellennamen.

1. Erstellen der Tabelle guru_sample mit zwei Spaltennamen wie „empid“ und „empname“

2. Anzeigen der in der Guru99-Datenbank vorhandenen Tabellen

3. Guru_sample wird unter Tabellen angezeigt

4. Tabelle „guru_sample“ in „guru_sampleNew“ ändern

5. Wenn Sie den Befehl „show“ ausführen, wird erneut der neue Name Guru_sampleNew angezeigt

Hive Tabelle erstellen

Dropping table guru_sampleNew:

Hive Tabelle erstellen

Tabellentypen und ihre Verwendung

Kommen zu Tische Es ist genau wie die Art und Weise, wie wir in herkömmlichen relationalen Datenbanken erstellen. Die Funktionalitäten wie Filterung und Verknüpfungen können für die Tabellen ausgeführt werden.

Bienenstock befasst sich mit zwei Arten von Tabellenstrukturen wie Intern und extern Tabellen abhängig vom Laden und Design des Schemas in Hive.

Interne Tabellen

  • Der interne Tisch ist von Natur aus eng miteinander verbunden. Bei diesem Tabellentyp müssen wir zunächst eine Tabelle erstellen und die Daten laden.
  • Wir können dieses als nennen Daten zum Schema.
  • Durch das Löschen dieser Tabelle werden sowohl Daten als auch Schema entfernt.
  • Der Speicherort dieser Tabelle ist /user/hive/warehouse.

Wann sollte man eine interne Tabelle wählen?

  • Wenn die Verarbeitungsdaten im lokalen Dateisystem verfügbar sind
  • Wenn wir möchten, dass Hive den gesamten Lebenszyklus der Daten einschließlich der Löschung verwaltet

Beispielcode-Snippet für interne Tabelle

1. So erstellen Sie die interne Tabelle

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);
	 Row format delimited 
	 Fields terminated by '\t';

2. Laden Sie die Daten in die interne Tabelle

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Zeigen Sie den Inhalt der Tabelle an

    Hive>select * from guruhive_internaltable;

4. Die interne Tabelle löschen

    Hive>DROP TABLE guruhive_internaltable;

Wenn Sie die guruhive_internaltable gelöscht haben, werden einschließlich ihrer Metadaten und Daten aus Hive gelöscht.

Im folgenden Screenshot können wir die Ausgabe beobachten

Interne Tabellen

Im obigen Code und im Screenshot machen wir folgende Dinge:

  • Erstellen Sie die interne Tabelle
  • Laden Sie die Daten in die interne Tabelle
  • Zeigen Sie den Inhalt der Tabelle an
  • Um die interne Tabelle zu löschen

Externe Tische

  • Der externe Tisch ist von Natur aus lose gekoppelt. Die Daten werden in HDFS verfügbar sein. Die Tabelle wird auf HDFS-Daten erstellt.
  • Auf andere Weise können wir sagen, dass es erschafft Schema für Daten.
  • Zum Zeitpunkt des Löschens der Tabelle wird nur das Schema gelöscht. Die Daten sind weiterhin wie zuvor in HDFS verfügbar.
  • Externe Tabellen bieten die Möglichkeit, mehrere Schemata für die in HDFS gespeicherten Daten zu erstellen, anstatt die Daten jedes Mal zu löschen, wenn das Schema aktualisiert wird

Wann sollte man sich für einen externen Tisch entscheiden?

  • Wenn Verarbeitungsdaten in HDFS verfügbar sind
  • Nützlich, wenn die Dateien außerhalb von Hive verwendet werden

Beispielcode-Snippet für externe Tabelle

1. Erstellen Sie eine externe Tabelle

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)
	 Row format delimited
	 Fields terminated by '\t'
	 LOCATION '/user/guru99hive/guruhive_external;

2. Wenn wir den Speicherort zum Zeitpunkt der Tabellenerstellung nicht angeben, können wir die Daten manuell laden

    Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Zeigen Sie den Inhalt der Tabelle an

  Hive>select * from guruhive_external;

4. Die interne Tabelle löschen

  Hive>DROP TABLE guruhive_external;

Im folgenden Screenshot können wir die Ausgabe beobachten

Externe Tabellen

Im obigen Code machen wir folgende Dinge

  • Erstellen Sie die externe Tabelle
  • Laden Sie die Daten in die externe Tabelle
  • Zeigen Sie den Inhalt der Tabelle an
  • Externe Tabelle löschen

Unterschied zwischen internen und externen Tabellen

Merkmal Intern Extern
Schema Daten zum Schema Schema zu Daten
Lagerraum /usr/hive/warehouse HDFS-Standort
Datenverfügbarkeit Innerhalb des lokalen Dateisystems Innerhalb von HDFS

Täglicher Guru99-Newsletter

Beginnen Sie Ihren Tag mit den neuesten und wichtigsten KI-Nachrichten, die jetzt geliefert werden.