초보자를 위한 HBase 튜토리얼: HBase란 무엇입니까? 3일만에 배워보세요!

HBase 튜토리얼 요약

Hbase는 HDFS(Hadoop 분산 파일 시스템) 위에서 실행되는 열 중심 데이터베이스 관리 시스템입니다. 초보자를 위한 이 HBase 튜토리얼에서는 Apache HBase 기본 및 고급 개념을 학습합니다. 이 HBase 과정에는 소개, 설치, 아키텍처부터 고급 내용까지 모든 HBase 기본 사항이 포함되어 있습니다.

HBase 란 무엇입니까?

HBase는 오픈 소스 열 기반 분산 데이터베이스 시스템입니다. 하둡 환경. 처음에는 Google Big Table이었지만 이후에는 Google Big Table이었습니다. HBase로 이름이 바뀌었고 주로 Java로 작성되었습니다.  아파치 실시간 빅데이터 애플리케이션에는 HBase가 필요합니다.

HBase는 테라바이트에서 페타바이트까지 엄청난 양의 데이터를 저장할 수 있습니다. HBase에 있는 테이블은 수백만 개의 열을 가진 수십억 개의 행으로 구성됩니다. HBase는 기존 관계형 모델에 비해 몇 가지 특정 기능을 갖춘 짧은 대기 시간 작업을 위해 구축되었습니다.

HBase 교육 강의 계획서

Apache HBase 교육 가이드에서 다루는 내용은 다음과 같습니다.

👉 1 강의 HBase의 아키텍처 — HBase 아키텍처, 구성 요소 및 데이터 모델
👉 2 강의 HBase 설치 — Ubuntu에 HBase 설치
👉 3 강의 HBase 셸 명령 — 예를 들어 배우기
👉 4 강의 HBase 생성 테이블 — Java API를 사용하여 HBase에서 테이블을 생성하는 단계
👉 5 강의 HBase에 데이터 삽입 및 검색 — get(), put(), scan() 예
👉 6 강의 HBase의 성능 병목 현상 — HBase의 장점과 한계
👉 7 강의 Hbase 인터뷰 질문 — 상위 30개 Hbase 인터뷰 질문 및 답변

초보자를 위한 HBase 튜토리얼에서는 무엇을 배우나요?

초보자를 위한 이 HBase 튜토리얼에서는 Apache HBase가 무엇인지, HBase의 아키텍처, HBase 설치 방법, HBase에서 테이블을 생성하는 단계, HBase의 장점 및 제한 사항 등을 학습합니다.

HBase를 선택하는 이유는 무엇입니까?

널리 사용되는 웹 애플리케이션의 테이블은 수십억 개의 행으로 구성될 수 있습니다. 이렇게 방대한 양의 데이터에서 특정 행을 검색하려면 쿼리 가져오기 시간이 짧기 때문에 HBase가 이상적인 선택입니다. 대부분의 온라인 분석 애플리케이션은 HBase를 사용합니다.

기존의 관계형 데이터 모델은 매우 큰 데이터베이스의 성능 요구 사항을 충족하지 못합니다. 이러한 성능 및 처리 제한은 Apache HBase를 통해 극복할 수 있습니다.

아파치 HBase 기능

  • HBase는 대기 시간이 짧은 작업을 위해 구축되었습니다.
  • HBase는 임의 읽기 및 쓰기 작업에 광범위하게 사용됩니다.
  • HBase는 테이블 형태로 많은 양의 데이터를 저장합니다.
  • 클러스터 환경에 대한 선형 및 모듈식 확장성을 제공합니다.
  • 읽기 및 쓰기 작업에 대한 엄격한 일관성
  • 테이블의 자동 및 구성 가능한 샤딩
  • 지역 서버 간 자동 장애 조치 지원
  • 지원을 위한 편리한 기본 클래스 하둡 맵리듀스 HBase 테이블의 작업
  • 쉬운 사용 자바 클라이언트 액세스를 위한 API
  • 실시간 쿼리를 위한 블록 캐시 및 블룸 필터
  • 쿼리 조건자는 서버 측 필터를 통해 푸시다운됩니다.

Hadoop에서 NoSQL 데이터베이스의 중요성

빅데이터 분석에서는 하둡 대규모 데이터 세트를 관리하여 일반적인 비즈니스 문제를 해결하는 데 중요한 역할을 하며 분석 영역에서 최고의 솔루션을 제공합니다.

하둡에서 ecos시스템에서 각 구성 요소는 고유한 역할을 수행합니다.

  • 데이터 처리
  • 데이터 유효성 검사
  • 데이터 저장

비정형, 반정형 데이터 저장 및 이러한 데이터 검색 측면에서 관계형 데이터베이스는 덜 유용합니다. 또한 Hadoop 스토리지에 저장된 대규모 데이터 세트에 쿼리를 적용하여 결과를 가져오는 것도 어려운 작업입니다. NoSQL 스토리지 기술은 대규모 데이터 세트에 대한 더 빠른 쿼리를 위한 최상의 솔루션을 제공합니다.

기타 NoSQL 스토리지 유형 데이터베이스

시장에 존재하는 일부 NoSQL 모델은 다음과 같습니다. 카산드라, 몽고DB, 카우치DB. 각 모델에는 다양한 저장 메커니즘 방식이 있습니다.

예를 들어 MongoDB는 NoSQL 계열 트리의 문서 지향 데이터베이스입니다. 기존 데이터베이스와 비교하여 성능, 가용성, 확장성 측면에서 최고의 기능을 제공합니다. 오픈 소스 문서 지향 데이터베이스이며 C++로 작성되었습니다.

Cassandra는 또한 상용 서버에 저장된 엄청난 양의 데이터를 처리하도록 설계된 오픈 소스 Apache 소프트웨어의 분산 데이터베이스입니다. Cassandra는 단일 실패 지점 없이 고가용성을 제공합니다.

CouchDB는 각 문서 필드가 키-값 맵에 저장되는 문서 지향 데이터베이스입니다.

HBase는 다른 NoSQL 모델과 어떻게 다른가요?

HBase 스토리지 모델은 위에서 설명한 다른 NoSQL 모델과 다릅니다. 이는 다음과 같이 말할 수 있습니다.

  • HBase는 열 모델의 키/값 쌍 형식으로 데이터를 저장합니다. 이 모델에서는 모든 기둥이 기둥군으로 그룹화됩니다.
  • HBase는 대규모 데이터 세트에 저장된 소량의 데이터에 대한 유연한 데이터 모델과 짧은 대기 시간 액세스를 제공합니다.
  • Hadoop 위에 HBase를 설치하면 분산 클러스터 설정의 처리량과 성능이 향상됩니다. 결과적으로 더 빠른 임의 읽기 및 쓰기 작업을 제공합니다.

어떤 NoSQL 데이터베이스를 선택해야 할까요?

MongoDB, CouchDB 및 Cassandra는 특정 기능을 제공하고 비즈니스 요구에 따라 사용되는 NoSQL 유형 데이터베이스입니다. 여기에서는 사용 사례에 따라 다양한 NoSQL 데이터베이스를 나열했습니다.

기능에 따른 데이터베이스 유형 데이터베이스의 예 사용 사례(사용 시기)
핵심 가치 레디스, 멤캐시DB 캐싱, 큐잉, 정보 배포
열 지향 카산드라, HBase 확장, 비구조화, 비휘발성 유지
문서 지향 몽고DB, 카우치베이스 중첩된 정보, JavaScript 친화적
그래프 기반 오리엔트DB, Neo4J 컴 취급plex 관계 정보. 모델링 및 취급 분류.

HBase 대. 하이브

특징 H베이스 하이브
데이터베이스 모델 와이드 컬럼 매장 관계형 DBMS
데이터 스키마 스키마 없음 스키마 포함
SQL 지원 아니 예, HQL(Hive 쿼리 언어)을 사용합니다.
파티션 방법 샤딩 샤딩
일관성 수준 즉각적인 일관성 최종 일관성
보조 인덱스 아니 가능
복제 방법 선택 가능한 복제 인자 선택 가능한 복제 인자

HBase 대. RDBMS

HBase를 기존 관계형 데이터베이스와 비교할 때 세 가지 핵심 영역을 고려해야 합니다. 그것은 데이터 모델, 데이터 저장, 데이터 다양성입니다.

HBASE RDBMS
  • 데이터베이스에 스키마가 없음
  • 데이터베이스에 고정된 스키마가 있음
  • 열 지향 데이터베이스
  • 행 기반 데이터 저장소
  • 비정규화된 데이터를 저장하도록 설계됨
  • 정규화된 데이터를 저장하도록 설계됨
  • HBase에 존재하는 넓고 인구 밀도가 낮은 테이블
  • 데이터베이스에 씬 테이블이 포함되어 있습니다.
  • 자동 파티셔닝 지원
  • 파티셔닝을 기본적으로 지원하지 않습니다.
  • OLAP 시스템에 매우 적합
  • OLTP 시스템에 매우 적합
  • 데이터베이스에서 관련 데이터만 읽기
  • 한 번에 하나의 행을 검색하므로 행의 데이터 중 일부만 필요한 경우 불필요한 데이터를 읽을 수 있습니다.
  • HBase를 사용하여 정형 및 반구조 데이터를 저장하고 처리할 수 있습니다.
  • RDBMS를 사용하여 구조화된 데이터를 저장하고 처리할 수 있습니다.
  • 여러 행과 열에 대한 집계를 활성화합니다.
  • 집계는 비용이 많이 드는 작업입니다.

요약

HBase는 고유한 기능을 제공하며 일반적인 산업 사용 사례를 해결합니다. 열 기반 저장소로서 빠른 쿼리, 결과 가져오기 및 많은 양의 데이터 저장소를 제공합니다. 이 과정은 HBase에 대한 완전한 단계별 소개입니다.