Hive-Tabelle erstellen: Interne Tabelle, ändern, löschen mit Beispielen
Tisch Operationen wie Erstellen, Ändern und Löschen Tabellen in Hive können in diesem Tutorial beobachtet werden.
Im folgenden Screenshot erstellen wir eine Tabelle mit Spalten und ändern den Tabellennamen.
1. Erstellen der Tabelle guru_sample mit zwei Spaltennamen wie „empid“ und „empname“
2. Anzeigen der in der Guru99-Datenbank vorhandenen Tabellen
3. Guru_sample wird unter Tabellen angezeigt
4. Tabelle „guru_sample“ in „guru_sampleNew“ ändern
5. Wenn Sie den Befehl „show“ ausführen, wird erneut der neue Name Guru_sampleNew angezeigt
Dropping table guru_sampleNew:
Tabellentypen und ihre Verwendung
Kommen zu Tische Es ist genau wie die Art und Weise, wie wir in herkömmlichen relationalen Datenbanken erstellen. Die Funktionalitäten wie Filterung und Verknüpfungen können für die Tabellen ausgeführt werden.
Bienenstock befasst sich mit zwei Arten von Tabellenstrukturen wie Intern und extern Tabellen abhängig vom Laden und Design des Schemas in Hive.
Interne Tabellen
- Der interne Tisch ist von Natur aus eng miteinander verbunden. Bei diesem Tabellentyp müssen wir zunächst eine Tabelle erstellen und die Daten laden.
- Wir können dieses als nennen Daten zum Schema.
- Durch das Löschen dieser Tabelle werden sowohl Daten als auch Schema entfernt.
- Der Speicherort dieser Tabelle ist /user/hive/warehouse.
Wann sollte man eine interne Tabelle wählen?
- Wenn die Verarbeitungsdaten im lokalen Dateisystem verfügbar sind
- Wenn wir möchten, dass Hive den gesamten Lebenszyklus der Daten einschließlich der Löschung verwaltet
Beispielcode-Snippet für interne Tabelle
1. So erstellen Sie die interne Tabelle
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING); Row format delimited Fields terminated by '\t';
2. Laden Sie die Daten in die interne Tabelle
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Zeigen Sie den Inhalt der Tabelle an
Hive>select * from guruhive_internaltable;
4. Die interne Tabelle löschen
Hive>DROP TABLE guruhive_internaltable;
Wenn Sie die guruhive_internaltable gelöscht haben, werden einschließlich ihrer Metadaten und Daten aus Hive gelöscht.
Im folgenden Screenshot können wir die Ausgabe beobachten
Im obigen Code und im Screenshot machen wir folgende Dinge:
- Erstellen Sie die interne Tabelle
- Laden Sie die Daten in die interne Tabelle
- Zeigen Sie den Inhalt der Tabelle an
- Um die interne Tabelle zu löschen
Externe Tische
- Der externe Tisch ist von Natur aus lose gekoppelt. Die Daten werden in HDFS verfügbar sein. Die Tabelle wird auf HDFS-Daten erstellt.
- Auf andere Weise können wir sagen, dass es erschafft Schema für Daten.
- Zum Zeitpunkt des Löschens der Tabelle wird nur das Schema gelöscht. Die Daten sind weiterhin wie zuvor in HDFS verfügbar.
- Externe Tabellen bieten die Möglichkeit, mehrere Schemata für die in HDFS gespeicherten Daten zu erstellen, anstatt die Daten jedes Mal zu löschen, wenn das Schema aktualisiert wird
Wann sollte man sich für einen externen Tisch entscheiden?
- Wenn Verarbeitungsdaten in HDFS verfügbar sind
- Nützlich, wenn die Dateien außerhalb von Hive verwendet werden
Beispielcode-Snippet für externe Tabelle
1. Erstellen Sie eine externe Tabelle
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING) Row format delimited Fields terminated by '\t' LOCATION '/user/guru99hive/guruhive_external;
2. Wenn wir den Speicherort zum Zeitpunkt der Tabellenerstellung nicht angeben, können wir die Daten manuell laden
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Zeigen Sie den Inhalt der Tabelle an
Hive>select * from guruhive_external;
4. Die interne Tabelle löschen
Hive>DROP TABLE guruhive_external;
Im folgenden Screenshot können wir die Ausgabe beobachten
Im obigen Code machen wir folgende Dinge
- Erstellen Sie die externe Tabelle
- Laden Sie die Daten in die externe Tabelle
- Zeigen Sie den Inhalt der Tabelle an
- Externe Tabelle löschen
Unterschied zwischen internen und externen Tabellen
Merkmal | Intern | Extern |
---|---|---|
Schema | Daten zum Schema | Schema zu Daten |
Lagerraum | /usr/hive/warehouse | HDFS-Standort |
Datenverfügbarkeit | Innerhalb des lokalen Dateisystems | Innerhalb von HDFS |