초보자를 위한 HBase 튜토리얼: HBase란 무엇입니까? 3일만에 배워보세요!
HBase 튜토리얼 요약
Hbase는 HDFS(Hadoop Distributed File System) 위에서 실행되는 열 지향 데이터베이스 관리 시스템입니다. 초보자를 위한 이 HBase 튜토리얼에서는 Apache HBase 기본 사항과 고급 개념을 배우게 됩니다. 이 HBase 과정에는 소개, 설치, 아키텍처부터 고급 사항까지 모든 HBase 기본 사항이 포함되어 있습니다.
HBase 란 무엇입니까?
HBase는 오픈 소스 열 기반 분산 데이터베이스 시스템입니다. 하둡 환경입니다. 처음에는 Google Big Table이었고 나중에 HBase로 이름이 바뀌었으며 주로 다음으로 작성되었습니다. Java. 아파치 실시간 빅데이터 애플리케이션에는 HBase가 필요합니다.
HBase는 테라바이트에서 페타바이트까지 방대한 양의 데이터를 저장할 수 있습니다. HBase에 있는 테이블은 수백만 개의 열이 있는 수십억 개의 행으로 구성됩니다. HBase는 낮은 대기 시간 작업을 위해 구축되었으며, 기존 관계형 모델과 비교하여 몇 가지 특정 기능이 있습니다.
HBase 교육 강의 계획서
Apache HBase 교육 가이드에서 다루는 내용은 다음과 같습니다.
👉 Less1에 | ArchiHBase의 구조 — H베이스 Archi강의, 구성 요소 및 데이터 모델 |
👉 Less2에 | HBase 설치 — HBase 설치 Ubuntu |
👉 Less3에 | HBase 셸 명령 — 예를 들어 배우기 |
👉 Less4에 | HBase 생성 테이블 — 다음을 사용하여 HBase에 테이블을 생성하는 단계 Java API |
👉 Less5에 | HBase에 데이터 삽입 및 검색 — get(), put(), scan() 예 |
👉 Less6에 | HBase의 성능 병목 현상 — HBase의 장점과 한계 |
👉 Less7에 | Hbase 인터뷰 질문 — 상위 30개 Hbase 인터뷰 질문 및 답변 |
초보자를 위한 HBase 튜토리얼에서는 무엇을 배우나요?
초보자를 위한 이 HBase 튜토리얼에서는 Apache HBase가 무엇인지, ArchiHBase 강의, HBase 설치 방법, HBase 테이블 생성 단계, HBase 장점 및 제한사항 등
HBase를 선택하는 이유는 무엇입니까?
인기 있는 웹 애플리케이션의 테이블은 수십억 개의 행으로 구성될 수 있습니다. 이렇게 방대한 양의 데이터에서 특정 행을 검색하려면 HBase가 이상적인 선택입니다. 쿼리 페치 시간이 짧기 때문입니다. 대부분의 온라인 분석 애플리케이션은 HBase를 사용합니다.
기존의 관계형 데이터 모델은 매우 큰 데이터베이스의 성능 요구 사항을 충족하지 못합니다. 이러한 성능 및 처리 제한은 Apache HBase를 통해 극복할 수 있습니다.
아파치 HBase 기능
- HBase는 저지연 작업을 위해 구축되었습니다.
- HBase는 무작위 읽기 및 쓰기 작업에 광범위하게 사용됩니다.
- HBase는 테이블 형태로 많은 양의 데이터를 저장합니다.
- 클러스터 환경에서 선형적이고 모듈식 확장성을 제공합니다.
- 읽기 및 쓰기 작업에 엄격하게 일관성이 있음
- 테이블의 자동 및 구성 가능한 샤딩
- 지역 서버 간 자동 장애 조치 지원
- 지원을 위한 편리한 기본 클래스 하둡 맵리듀스 HBase 테이블의 작업
- 쉬운 사용 Java 클라이언트 액세스를 위한 API
- 실시간 쿼리를 위한 블록 캐시 및 블룸 필터
- 쿼리 조건자는 서버 측 필터를 통해 푸시다운됩니다.
Hadoop에서 NoSQL 데이터베이스의 중요성
빅데이터 분석에서는 하둡 대규모 데이터 세트를 관리하여 일반적인 비즈니스 문제를 해결하는 데 중요한 역할을 하며 분석 영역에서 최고의 솔루션을 제공합니다.
Hadoop 생태계에서 각 구성 요소는 고유한 역할을 수행합니다.
-
데이터 처리
-
데이터 유효성 검사
-
데이터 저장
비정형, 반정형 데이터 저장 및 이러한 데이터 검색 측면에서 관계형 데이터베이스는 덜 유용합니다. 또한 Hadoop 스토리지에 저장된 대규모 데이터 세트에 쿼리를 적용하여 결과를 가져오는 것도 어려운 작업입니다. NoSQL 스토리지 기술은 대규모 데이터 세트에 대한 더 빠른 쿼리를 위한 최상의 솔루션을 제공합니다.
기타 NoSQL 스토리지 유형 데이터베이스
시장에 존재하는 일부 NoSQL 모델은 다음과 같습니다. Cassandra, MongoDB및 CouchDB. 각 모델에는 다양한 저장 메커니즘 방식이 있습니다.
예를 들어, MongoDB NoSQL 계열 트리의 문서 지향 데이터베이스입니다. 기존 데이터베이스와 비교하여 성능, 가용성, 확장성 측면에서 최고의 기능을 제공합니다. 오픈 소스 문서 지향 데이터베이스이며 다음 언어로 작성되었습니다. C++.
Cassandra 또한 상용 서버에 저장된 엄청난 양의 데이터를 처리하도록 설계된 오픈 소스 Apache 소프트웨어의 분산 데이터베이스입니다. Cassandra 단일 장애 지점 없이 고가용성을 제공합니다.
DaVinci에는 CouchDB 각 문서 필드가 키-값 맵에 저장되는 문서 중심 데이터베이스입니다.
HBase는 다른 NoSQL 모델과 어떻게 다른가요?
HBase 스토리지 모델은 위에서 설명한 다른 NoSQL 모델과 다릅니다. 이는 다음과 같이 말할 수 있습니다.
-
HBase는 열 모델의 키/값 쌍 형식으로 데이터를 저장합니다. 이 모델에서는 모든 기둥이 기둥군으로 그룹화됩니다.
-
HBase는 대규모 데이터 세트에 저장된 소량의 데이터에 대한 유연한 데이터 모델과 짧은 대기 시간 액세스를 제공합니다.
-
Hadoop 위에 있는 HBase는 분산 클러스터 설정의 처리량과 성능을 증가시킵니다. 차례로, 더 빠른 랜덤 읽기 및 쓰기 작업을 제공합니다.
어떤 NoSQL 데이터베이스를 선택해야 할까요?
MongoDB, CouchDB및 Cassandra 기능에 따라 다르며 비즈니스 요구에 따라 사용되는 NoSQL 유형 데이터베이스입니다. 여기에서는 사용 사례에 따라 다양한 NoSQL 데이터베이스를 나열했습니다.
기능에 따른 데이터베이스 유형 | 데이터베이스의 예 | 사용 사례(사용 시기) |
---|---|---|
핵심 가치 | 레디스, 멤캐시DB | 캐싱, 큐잉, 정보 배포 |
열 지향 | Cassandra, H베이스 | 확장, 비구조화, 비휘발성 유지 |
문서 지향 | MongoDB, 카우치베이스 | 중첩된 정보, Java스크립트 친화적 |
그래프 기반 | OrientDB, Neo4J | 복잡한 관계 정보 처리. 모델링 및 분류 처리. |
HBase 대. 하이브
기능 | H베이스 | 하이브 |
---|---|---|
데이터베이스 모델 | 와이드 컬럼 매장 | 관계형 DBMS |
데이터 스키마 | 스키마 없음 | 스키마 포함 |
SQL 지원 | 아니 | 예, HQL(Hive 쿼리 언어)을 사용합니다. |
파티션 방법 | 샤딩 | 샤딩 |
일관성 수준 | 즉각적인 일관성 | 최종 일관성 |
보조 인덱스 | 아니 | 가능 |
복제 방법 | 선택 가능한 복제 인자 | 선택 가능한 복제 인자 |
HBase 대. RDBMS
HBase를 기존 관계형 데이터베이스와 비교할 때 세 가지 핵심 영역을 고려해야 합니다. 그것은 데이터 모델, 데이터 저장, 데이터 다양성입니다.
HBASE | RDBMS |
---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
요약
HBase는 고유한 기능을 제공하며 일반적인 산업 사용 사례를 해결합니다. 열 기반 저장소로서 빠른 쿼리, 결과 가져오기 및 많은 양의 데이터 저장소를 제공합니다. 이 과정은 HBase에 대한 완전한 단계별 소개입니다.