Hive-opetusohjelma aloittelijoille

Hive opetusohjelman yhteenveto


Apache Hive auttaa suurten tietojoukkojen kyselyissä ja hallinnassa todella nopeasti. Se on ETL työkalu Hadoop-ekosysteemille. Tässä aloittelijoille tarkoitetussa Apache Hive -opetusohjelmassa opit Hiven perusteet ja tärkeitä aiheita, kuten HQL-kyselyitä, tiedonpoiminta, osiot, kauhat ja niin edelleen. Tämä Hiven opetusohjelmasarja auttaa sinua oppimaan Hiven käsitteitä ja perusteita.

Mitä minun pitäisi tietää?


Jotta voit oppia tämän Hive-kyselyn opetusohjelman, tarvitset perustiedot SQL, Hadoop ja muiden tietokantojen tuntemus on lisäapua.

Hive-kurssin opetusohjelma

esittely

👍 Lesson 1 Mikä on Hive? - Architecture & Modes
👍 Lesson 2 Lataa ja asenna HIVE - Kuinka ladata ja asentaa HIVE Ubuntu
👍 Lesson 3 HIVE-metastoren määritys – Miksi käyttää MySQL?
👍 Lesson 4 Hive-tietotyypit - Luo ja pudota tietokanta Hiveen

Edistynyttä tavaraa

👍 Lesson 1 Hive Luo taulukko - Tyypit ja niiden käyttö
👍 Lesson 2 Pesien väliseinät ja kauhat – Opi esimerkin avulla
👍 Lesson 3 Hive-indeksit ja -näkymä – Opi esimerkin avulla
👍 Lesson 4 Hive kyselyt – Opi esimerkin avulla
👍 Lesson 5 Hive Join & SubQuery Tutorial – Opi esimerkin avulla
👍 Lesson 6 Hive Query Language Tutorial – Sisäänrakennettu OperaTors
👍 Lesson 7 Hive-toiminto — Sisäänrakennetut ja käyttäjän määrittämät toiminnot
👍 Lesson 8 Hive ETL — Ladataan JSON-, XML- ja tekstitietoesimerkkejä

Johdatus Hiveen

Hive kehittyi tietovarastoratkaisuksi, joka on rakennettu Hadoop Map-Reduce -kehyksen päälle.

Toimialalla kerättävien ja analysoitavien tietokokonaisuuksien koko bisnesvaisto kasvaa ja tavallaan se tekee perinteisistä tietovarastointiratkaisuista kalliimpia. Hadoop MapReduce-kehyksen kanssa, käytetään vaihtoehtoisena ratkaisuna valtavan kokoisten tietojoukkojen analysointiin. Vaikka Hadoop on osoittautunut hyödylliseksi työskenneltäessä valtavien tietojoukkojen parissa, sen MapReduce-kehys on erittäin matalatasoinen ja vaatii ohjelmoijia kirjoittamaan mukautettuja ohjelmia, joita on vaikea ylläpitää ja käyttää uudelleen. Hive tulee tänne pelastamaan ohjelmoijia.


Hiven moottori kokoaa nämä kyselyt Map-Reduce-töihin, jotka suoritetaan Hadoopissa. Lisäksi kyselyihin voidaan liittää myös mukautettuja Map-Reduce-skriptejä. Hive toimii taulukoihin tallennetulla tiedolla, joka koostuu primitiivisistä tietotyypeistä ja kokoelmatietotyypeistä, kuten taulukoista ja kartoista.

Hiven mukana tulee komentorivikäyttöliittymä, jota voidaan käyttää taulukoiden luomiseen ja kyselyjen suorittamiseen.

Hive-kyselykieli on samanlainen kuin SQL, jossa se tukee alikyselyitä. Hiven kyselykielellä on mahdollista tehdä MapReduce-liitoksia Hive-taulukoiden välillä. Siinä on tuki yksinkertaiselle SQL:n kaltaiset toiminnot– CONCAT, SUBSTR, ROUND jne. ja yhdistämistoiminnot– SUM, COUNT, MAX jne. Se tukee myös GROUP BY- ja SORT BY -lauseita. On myös mahdollista kirjoittaa käyttäjän määrittämiä toimintoja Hive-kyselykielellä.

Mikä on Hive?

Apache Hive on tietovarastokehys HDFS:ään tallennettujen tietojen kyselyyn ja analysointiin. Se on kehitetty Hadoopin päälle. Hive on avoimen lähdekoodin ohjelmisto, joka analysoi suuria tietojoukkoja Hadoopissa. Se tarjoaa SQL:n kaltaisen deklaratiivisen kielen, nimeltään HiveQL, kyselyjen ilmaisemiseen. Hive-QL:n avulla käyttäjät liittyvät SQL voi suorittaa data-analyysin erittäin helposti.

Hive vs Map Reduce

Ennen kuin valitsemme toisen näistä kahdesta vaihtoehdosta, meidän on tarkasteltava joitain niiden ominaisuuksia.

Valittaessa Hiven ja Map vähentää seuraavat tekijät otetaan huomioon;

  • Tietojen tyyppi
  • Tietojen määrä
  • Koodin monimutkaisuus

Hive vs kartta vähentää?

Ominaisuus Hive Kartta Pienennä
Kieli Se tukee SQL:n kaltaista kyselykieltä vuorovaikutukseen ja tietojen mallintamiseen
  • Se kokoaa kielen, jossa on kaksi päätehtävää. Yksi on karttatehtävä ja toinen on vähennys.
  • Voimme määritellä nämä tehtävät käyttämällä Java or Python
Abstraktion taso Korkeampi abstraktiotaso HDFS:n päällä Alempi abstraktiotaso
Tehokkuus koodissa Suhteellisesti vähemmän kuin Map vähentää Tarjoaa korkean tehokkuuden
Koodin laajuus Less suorittamiseen vaadittava rivimäärä koodi Lisää koodirivejä määriteltävä
Vaadittava kehitystyön tyyppi Less Kehitystyötä tarvitaan Kehitystyötä tarvitaan lisää

Napsauta nähdäksesi Seuraava opetusohjelma