HBase'i õpetus algajatele: mis on HBase? Õppige 3 päevaga!
HBase'i õpetuse kokkuvõte
Hbase on veerule orienteeritud andmebaasihaldussüsteem, mis töötab HDFS-i (Hadoop Distributed File System) peal. Selles algajatele mõeldud HBase'i õpetuses saate teada Apache HBase'i põhitõdesid ja täiustatud kontseptsioone. See HBase'i kursus sisaldab kõiki HBase'i põhitõdesid alates sissejuhatusest, installimisest, arhitektuurist kuni täiustatud asjadeni.
Mis on HBase?
HBase on avatud lähtekoodiga veerule orienteeritud hajutatud andmebaasisüsteem a hadoop keskkond. Algselt oli see Google Big Table, hiljem; see nimetati ümber kui HBase ja see on peamiselt kirjutatud Java. Apache HBase on vajalik reaalajas suurandmete rakenduste jaoks.
HBase suudab salvestada tohutul hulgal andmeid terabaitidest petabaitideni. HBase'is olevad tabelid koosnevad miljarditest ridadest, millel on miljoneid veerge. HBase on loodud madala latentsusajaga toimingute jaoks, millel on traditsiooniliste relatsioonimudelitega võrreldes mõned eripärad.
HBase'i koolituse ainekava
Siin on see, mida me selles Apache HBase'i koolitusjuhendis käsitleme
👉 Lessaasta 1 | ArchiHBase'i struktuur - HBase Architektuur, komponendid ja andmemudel |
👉 Lessaasta 2 | HBase'i installimine — HBase'i installimine on sisse lülitatud Ubuntu |
👉 Lessaasta 3 | HBase Shelli käsud — Õppige näitega |
👉 Lessaasta 4 | HBase Loo tabel — HBase'is tabeli loomise sammud kasutades Java API |
👉 Lessaasta 5 | Andmete sisestamine ja toomine HBase'is — get(), pane(), scan() Näited |
👉 Lessaasta 6 | HBase'i jõudluse kitsaskohad — HBase'i eelised ja piirangud |
👉 Lessaasta 7 | Hbase'i intervjuu küsimused — 30 parimat Hbase'i intervjuu küsimust ja vastust |
Mida saate sellest HBase'i õpetusest algajatele teada?
Sellest HBase'i õpetusest algajatele saate teada, mis on Apache HBase ArchiHBase'i tehnoloogia, HBase'i installimine, HBase'i tabeli loomise sammud, HBase'i eelised ja piirangud jne.
Miks valida HBase?
Populaarse veebirakenduse tabel võib koosneda miljarditest ridadest. Kui tahame otsida konkreetset rida nii suure hulga andmete hulgast, on HBase ideaalne valik, kuna päringu toomise aeg on lühem. Enamik veebianalüütikarakendusi kasutab HBase'i.
Traditsioonilised relatsioonilised andmemudelid ei vasta väga suurte andmebaaside jõudlusnõuetele. Neid jõudluse ja töötlemise piiranguid saab ületada Apache HBase.
Apache HBase'i funktsioonid
- HBase on loodud madala latentsusega toimingute jaoks
- HBase'i kasutatakse laialdaselt juhuslike lugemis- ja kirjutamisoperatsioonide jaoks
- HBase salvestab suure hulga andmeid tabelite kujul
- Pakub lineaarset ja modulaarset skaleeritavust klastrikeskkonnas
- Lugemis- ja kirjutamistoimingud on rangelt järjekindlad
- Tabelite automaatne ja konfigureeritav jagamine
- Automaatne tõrkesiirde tugi piirkonna serverite vahel
- Mugavad baasklassid toetamiseks Hadoop MapReduce töökohad HBase'i tabelites
- Lihtne kasutada Java API kliendi juurdepääsuks
- Blokeeri vahemälu ja Bloomi filtrid reaalajas päringute jaoks
- Päringu predikaat surub serveripoolsete filtrite kaudu alla.
NoSQL-i andmebaaside tähtsus Hadoopis
Suurandmete analüütikas hadoop mängib olulist rolli tüüpiliste äriprobleemide lahendamisel, haldades suuri andmekogumeid ja pakub parimaid lahendusi analüüsivaldkonnas.
Hadoopi ökosüsteemis mängib iga komponent oma ainulaadset rolli
-
Andmetöötlus
-
Andmete valideerimine
-
Andmete salvestamine
Struktureerimata, poolstruktureeritud andmete salvestamise ja selliste andmete otsimise seisukohalt on relatsiooniandmebaasid vähem kasulikud. Samuti on keeruline ülesanne tulemuste toomine, rakendades päringuid Hadoopi salvestusruumi salvestatud tohututele andmekogumitele. NoSQL-i salvestustehnoloogiad pakuvad parimat lahendust tohutute andmekogumite kiiremaks päringute tegemiseks.
Muu NoSQL-i salvestustüüp Andmebaasid
Mõned turul olevad NoSQL-i mudelid on Cassandra, MongoDBja CouchDB. Kõigil neil mudelitel on erinevad salvestusmehhanismid.
Näiteks MongoDB on dokumendile orienteeritud andmebaas NoSQL sugupuust. Võrreldes traditsiooniliste andmebaasidega pakub see jõudluse, saadavuse ja skaleeritavuse osas parimaid funktsioone. See on avatud lähtekoodiga dokumendile orienteeritud andmebaas ja see on sisse kirjutatud C++.
Cassandra on ka avatud lähtekoodiga Apache tarkvara hajutatud andmebaas, mis on loodud käsitlema tohutul hulgal kaubaserverites salvestatud andmeid. Cassandra tagab kõrge kättesaadavuse ilma ühe tõrkepunktita.
Kui CouchDB on dokumendile orienteeritud andmebaas, milles kõik dokumendiväljad on salvestatud võtmeväärtuste kaartidel.
Mille poolest HBase erineb teistest NoSQL-i mudelitest
HBase'i salvestusmudel erineb teistest ülalpool käsitletud NoSQL-i mudelitest. Seda võib väita järgmiselt.
-
HBase salvestab andmed võtme/väärtuse paaride kujul veergmudelis. Selles mudelis on kõik veerud rühmitatud veergude perekondadeks.
-
HBase pakub paindlikku andmemudelit ja madala latentsusega juurdepääsu väikestele andmemahtudele, mis on salvestatud suurtesse andmekogumitesse.
-
Hadoopi peal olev HBase suurendab hajutatud klastri seadistamise läbilaskevõimet ja jõudlust. See omakorda pakub kiiremaid juhuslikke lugemis- ja kirjutamistoiminguid.
Millist NoSQL-i andmebaasi valida?
MongoDB, CouchDBja Cassandra on NoSQL-tüüpi andmebaasid, mis on funktsioonispetsiifilised ja mida kasutatakse vastavalt nende ärivajadustele. Siin oleme vastavalt nende kasutusjuhtumitele välja toonud erinevad NoSQL-i andmebaasid.
Andmebaasi tüüp Põhineb funktsioonil | Andmebaasi näide | Kasutusjuhtum (millal kasutada) |
---|---|---|
Võti/ väärtus | Redis, MemcacheDB | Vahemällu salvestamine, järjekorda seadmine, teabe levitamine |
Veerule orienteeritud | Cassandra, HBase | Skaleerimine, struktureerimata hoidmine, püsimatu |
Dokumendile orienteeritud | MongoDB, diivanialus | Pesastatud teave, JavaSkriptisõbralik |
Graafikupõhine | OrientDB, Neo4J | Keerulise relatsiooniteabe käsitlemine. Modelleerimise ja käitlemise klassifikatsioon. |
HBase vs. Taru
FUNKTSIOONID | HBase | Mesilaspere |
---|---|---|
Andmebaasi mudel | Laia kolonni pood | Relatsiooniline DBMS |
Andmeskeem | Skeemivaba | Skeemiga |
SQL-i tugi | Ei | Jah, see kasutab HQL-i (Hive päringukeel) |
Jaotamise meetodid | Varjutamine | Varjutamine |
Järjepidevuse tase | Vahetu järjepidevus | Lõplik järjepidevus |
Sekundaarsed indeksid | Ei | Jah |
Replikatsioonimeetodid | Valitav replikatsioonitegur | Valitav replikatsioonitegur |
HBase vs. RDBMS
Võrreldes HBase'i traditsiooniliste relatsiooniandmebaasidega, peame arvestama kolme põhivaldkonnaga. Need on andmemudel, andmesalvestus ja andmete mitmekesisus.
HBASE | RDBMS |
---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
kokkuvõte
HBase pakub ainulaadseid funktsioone ja lahendab tüüpilised tööstusliku kasutuse juhtumid. Veerule orienteeritud salvestusruumina pakub see kiiret päringuid, tulemuste toomist ja suurt hulka andmesalvestust. See kursus on HBase'i täielik samm-sammult tutvustus.