Hive vodič za početnike
Sažetak vodiča za Hive
Apache Hive pomaže pri postavljanju upita i brzom upravljanju velikim skupovima podataka. To je ETL alat za Hadoop ekosustav. U ovom vodiču za Apache Hive za početnike naučit ćete osnove Hivea i važne teme kao što su HQL upiti, ekstrakcije podataka, particije, spremnici i tako dalje. Ova serija vodiča za Hive pomoći će vam da naučite koncepte i osnove Hivea.
Što bih trebao znati?
Da biste naučili ovaj vodič za Hive upite, potrebno vam je osnovno znanje o SQL, Hadoop a od dodatne pomoći će biti i poznavanje drugih baza podataka.
Nastavni plan tečaja Hive
Uvod
👍 Lessna 1 | Što je Hive? - Architekstura i načini rada |
👍 Lessna 2 | Preuzmite i instalirajte HIVE — Kako preuzeti i instalirati HIVE na Ubuntu |
👍 Lessna 3 | HIVE Metastore konfiguracija — Zašto koristiti MySQL? |
👍 Lessna 4 | Vrste podataka košnice — Stvorite i ispustite bazu podataka u Hive |
Napredne stvari
👍 Lessna 1 | Hive Create Table — Vrste i njihova uporaba |
👍 Lessna 2 | Pregrade i kante za košnice — Učite s primjerom |
👍 Lessna 3 | Indeksi košnice i prikaz — Učite s primjerom |
👍 Lessna 4 | Hive Queries — Učite s primjerom |
👍 Lessna 5 | Hive Join & SubQuery Vodič — Učite s primjerom |
👍 Lessna 6 | Hive Query Language Tutorial — Ugrađeni Operaulagatelji |
👍 Lessna 7 | Funkcija košnice — Ugrađene i korisnički definirane funkcije |
👍 Lessna 8 | ETL košnice — Učitavanje JSON, XML, primjeri tekstualnih podataka |
Uvod u Hive
Hive se razvio kao rješenje za skladištenje podataka izgrađeno na temelju okvira Hadoop Map-Reduce.
Veličina skupova podataka koji se prikupljaju i analiziraju u industriji za Poslovna inteligencija raste i na neki način poskupljuje tradicionalna rješenja za skladištenje podataka. Hadoop s okvirom MapReduce, koristi se kao alternativno rješenje za analizu skupova podataka velike veličine. Iako se Hadoop pokazao korisnim za rad na ogromnim skupovima podataka, njegov okvir MapReduce vrlo je niske razine i zahtijeva od programera pisanje prilagođenih programa koje je teško održavati i ponovno koristiti. Hive dolazi ovdje kako bi spasio programere.
Motor košnice sastavlja ove upite u Map-Reduce poslove koji se izvršavaju na Hadoopu. Osim toga, prilagođene Map-Reduce skripte također se mogu uključiti u upite. Košnica radi s podacima pohranjenima u tablicama koje se sastoje od primitivnih tipova podataka i skupnih tipova podataka poput nizova i mapa.
Hive dolazi sa sučeljem ljuske naredbenog retka koje se može koristiti za stvaranje tablica i izvršavanje upita.
Jezik upita Hive sličan je SQL-u pri čemu podržava podupite. Pomoću Hive jezika upita, moguće je uzeti MapReduce spojeve preko Hive tablica. Ima podršku za jednostavne Funkcije slične SQL-u– CONCAT, SUBSTR, ROUND itd., i funkcije agregacije– SUM, COUNT, MAX itd. Također podržava klauzule GROUP BY i SORT BY. Također je moguće pisati korisnički definirane funkcije u upitnom jeziku Hive.
Što je Hive?
Apache košnica je okvir skladišta podataka za upite i analizu podataka pohranjenih u HDFS-u. Razvijen je na temelju Hadoopa. Hive je softver otvorenog koda za analizu velikih skupova podataka na Hadoopu. Omogućuje deklarativni jezik sličan SQL-u, nazvan HiveQL, za izražavanje upita. Koristeći Hive-QL, korisnici povezani s SQL može vrlo jednostavno izvršiti analizu podataka.
Hive vs Map Reduce
Prije nego što odaberemo jednu od ove dvije opcije, moramo pogledati neke od njihovih karakteristika.
Prilikom odabira između Hive i Map reduciranja uzimaju se u obzir sljedeći čimbenici;
- Vrsta podataka
- Količina podataka
- Složenost koda
Hive vs Map Reduce?
svojstvo | Košnica | Map Reduce |
---|---|---|
Jezik | Podržava upitni jezik sličan SQL-u za interakciju i modeliranje podataka |
|
Razina apstrakcije | Viša razina apstrakcije na vrhu HDFS-a | Niža razina apstrakcije |
Učinkovitost u kodu | Usporedno manje od smanjenja karte | Pruža visoku učinkovitost |
Opseg koda | Less broj redaka koda potrebnih za izvođenje | Treba definirati još nekoliko redaka kodova |
Potrebna vrsta razvojnog rada | Less Potreban razvojni rad | Potrebno je više rada na razvoju |
Kliknite za Sljedeći vodič