OLAP이란 무엇입니까? 큐브, 분석 Opera데이터 웨어하우스의 기능

OLAP이란 무엇입니까?

온라인 분석 처리(OLAP) 사용자가 동시에 여러 데이터베이스 시스템의 정보를 분석할 수 있는 소프트웨어 범주입니다. 분석가가 다양한 관점에서 비즈니스 데이터를 추출하고 볼 수 있도록 하는 기술입니다.

분석가는 종종 데이터를 그룹화, 집계 및 조인해야 합니다. 데이터 마이닝에서 이러한 OLAP 작업은 리소스를 많이 사용합니다. OLAP을 사용하면 데이터를 미리 계산하고 미리 집계할 수 있어 분석이 더 빨라집니다.

OLAP 데이터베이스는 하나 이상의 큐브로 나뉩니다. 큐브는 보고서를 쉽게 만들고 볼 수 있도록 설계되었습니다. OLAP은 Online Analytical Processing의 약자입니다.

OLAP 큐브

OLAP 큐브
OLAP 큐브

OLAP 개념의 핵심에는 OLAP 큐브가 있습니다. OLAP 큐브는 매우 빠른 작업에 최적화된 데이터 구조입니다. 데이터 분석.

OLAP 큐브는 차원별로 분류된 측정값이라는 숫자 사실로 구성됩니다. OLAP 큐브라고도 합니다. 하이퍼큐브.

일반적으로 데이터 작업과 분석은 데이터 값이 행과 열 형식으로 정렬된 간단한 스프레드시트를 사용하여 수행됩니다. 이는 2차원 데이터에 이상적입니다. 그러나 OLAP에는 다차원 데이터가 포함되어 있으며, 일반적으로 데이터는 다르고 관련 없는 소스에서 가져옵니다. 스프레드시트를 사용하는 것은 최적의 옵션이 아닙니다. 큐브는 논리적이고 질서 있는 방식으로 다차원 데이터를 저장하고 분석할 수 있습니다.

어떻게 진행합니까?

데이터 웨어하우스는 텍스트 파일, 엑셀 시트, 멀티미디어 파일 등과 같은 여러 데이터 소스 및 형식에서 정보를 추출합니다.

추출된 데이터는 정리되고 변환됩니다. 데이터는 추가 분석을 위해 정보가 미리 계산되는 OLAP 서버(또는 OLAP 큐브)에 로드됩니다.

OLAP의 기본 분석 작업

분석 OLAP 작업에는 다음과 같은 네 가지 유형이 있습니다.

  1. 롤업
  2. 드릴다운
  3. 슬라이스 및 주사위
  4. 피벗(회전)

1) 롤업:

롤업은 "통합" 또는 "집계"라고도 합니다. 롤업 작업은 2가지 방법으로 수행할 수 있습니다.

  1. 차원 축소
  2. 개념 계층 구조를 올라갑니다. 개념 계층 구조는 순서나 수준에 따라 사물을 그룹화하는 시스템입니다.

다음 다이어그램을 고려하십시오.

OLAP에서의 롤업 작업
OLAP에서의 롤업 작업
  • 이 예에서는 도시 New Jersey와 Lost Angles를 국가 USA로 합산했습니다.
  • 뉴저지와 로스앤젤레스의 판매량은 각각 440과 1560이다. 롤업하면 2000이 됨
  • 이 집계 프로세스에서 데이터는 위치 계층 구조로 도시에서 국가로 이동합니다.
  • 롤업 프로세스에서는 하나 이상의 차원을 제거해야 합니다. 이 예에서는 도시 측정기준이 제거되었습니다.

2) 드릴다운

드릴다운에서 데이터는 더 작은 부분으로 조각화됩니다. 이는 롤업 프로세스와 반대입니다. 그것은 다음을 통해 이루어질 수 있습니다.

  • 개념 계층 구조 아래로 이동
  • 차원 늘리기
OLAP에서의 드릴다운 작업
OLAP에서의 드릴다운 작업

위의 다이어그램을 고려하십시오

  • 1분기 XNUMX분기는 XNUMX월, XNUMX월, XNUMX월로 드릴다운됩니다. 해당 판매도 등록됩니다.
  • 이 예에서는 월 차원이 추가됩니다.

3) 슬라이스:

여기에서는 하나의 차원이 선택되고 새 하위 큐브가 생성됩니다.

다음 다이어그램은 슬라이스 작업이 수행되는 방식을 설명합니다.

OLAP에서의 슬라이스 작업
OLAP에서의 슬라이스 작업
  • 차원 시간은 Q1을 필터로 사용하여 조각화됩니다.
  • 새로운 큐브가 완전히 생성됩니다.

주사위:

이 작업은 슬라이스와 비슷합니다. 주사위의 차이점은 하위 큐브를 만드는 2개 이상의 차원을 선택한다는 것입니다.

OLAP에서의 주사위 연산
OLAP에서의 주사위 연산

4) 피벗

피벗에서는 데이터 축을 회전하여 데이터의 대체 표현을 제공합니다.

다음 예에서 피벗은 항목 유형을 기반으로 합니다.

OLAP에서의 피벗 작업
OLAP에서의 피벗 작업

OLAP 시스템 유형

OLAP 계층 구조

OLAP 시스템의 종류
OLAP 시스템의 종류
OLAP 유형 설명
관계형 OLAP(ROLAP): ROLAP은 표준 관계형 연산을 수행하기 위해 다차원 데이터 매핑을 갖춘 확장된 RDBMS입니다.
다차원 OLAP(MOLAP) MOLAP은 다차원 데이터에서 작업을 구현합니다.
하이브리드 온라인 분석 처리(HOLAP) HOLAP 접근 방식에서는 집계된 합계가 다차원 데이터베이스에 저장되고 세부 데이터는 관계형 데이터베이스에 저장됩니다. 이는 ROLAP 모델의 데이터 효율성과 MOLAP 모델의 성능을 모두 제공합니다.
데스크톱 OLAP(DOLAP) Desktop OLAP에서 사용자는 데이터베이스에서 로컬로 또는 데스크탑에서 데이터의 일부를 다운로드하여 분석합니다.

DOLAP은 다른 OLAP 시스템에 비해 제공하는 기능이 매우 적기 때문에 구축 비용이 비교적 저렴합니다.

웹 OLAP(WOLAP) 웹 브라우저를 통해 접근할 수 있는 OLAP 시스템인 웹 OLAP. WOLAP은 3계층 아키텍처입니다. 클라이언트, 미들웨어, 데이터베이스 서버라는 세 가지 구성 요소로 구성됩니다.
모바일 OLAP: 모바일 OLAP은 사용자가 모바일 장치를 사용하여 OLAP 데이터에 액세스하고 분석할 수 있도록 도와줍니다.
공간 OLAP: SOLAP는 지리정보시스템(GIS)에서 공간 및 비공간 데이터 모두의 관리를 용이하게 하기 위해 만들어졌습니다.

롤랩

ROLAP은 관계형 데이터베이스에 존재하는 데이터와 함께 작동합니다. 팩트와 차원 테이블은 관계형 테이블로 저장됩니다. 또한 데이터의 다차원 분석을 허용하며 가장 빠르게 성장하는 OLAP입니다.

ROLAP 모델의 장점:

  • 높은 데이터 효율성. 특히 다차원 데이터 분석에 최적화된 쿼리 성능과 접근 언어를 제공하므로 높은 데이터 효율성을 제공합니다.
  • 확장 성. 이러한 유형의 OLAP 시스템은 대용량 데이터를 관리할 수 있는 확장성을 제공하며, 데이터가 꾸준히 증가하는 경우에도 마찬가지입니다.

ROLAP 모델의 단점:

  • 더 높은 자원에 대한 수요: ROLAP은 인력, 소프트웨어, 하드웨어 자원의 높은 활용도를 필요로 합니다.
  • 종합적인 데이터 제한. ROLAP 도구 사용 SQL 집계 데이터의 모든 계산을 위해. 그러나 계산 처리에 대해 설정된 제한은 없습니다.
  • 쿼리 성능이 느립니다. 이 모델의 쿼리 성능은 MOLAP에 비해 느립니다.

몰랍

MOLAP은 배열 기반 다차원 스토리지 엔진을 사용하여 데이터의 다차원 보기를 표시합니다. 기본적으로 OLAP 큐브를 사용합니다.

MOLAP에 대해 자세히 알아보기 LINK

하이브리드 OLAP

하이브리드 OLAP은 ROLAP과 MOLAP이 혼합된 것입니다. MOLAP의 빠른 계산과 ROLAP의 더 높은 확장성을 제공합니다. HOLAP은 두 개의 데이터베이스를 사용합니다.

  1. 집계되거나 계산된 데이터는 다차원 OLAP 큐브에 저장됩니다.
  2. 자세한 정보는 관계형 데이터베이스에 저장됩니다.

하이브리드 OLAP의 이점:

  • 이러한 종류의 OLAP은 디스크 공간을 절약하는 데 도움이 되며 컴팩트한 상태를 유지하므로 액세스 속도 및 편의성과 관련된 문제를 방지하는 데 도움이 됩니다.
  • Hybrid HOLAP은 큐브 기술을 사용하여 모든 유형의 데이터에 대해 더 빠른 성능을 제공합니다.
  • ROLAP은 즉시 업데이트되며 HOLAP 사용자는 실시간으로 즉시 업데이트되는 데이터에 액세스할 수 있습니다. MOLAP은 데이터 정리 및 변환을 제공하여 데이터 관련성을 향상시킵니다. 이는 두 세계의 장점을 모두 가져옵니다.

하이브리드 OLAP의 단점:

  • 더 높은 복잡성 수준: HOLAP 시스템의 주요 단점은 ROLAP 및 MOLAP 도구와 애플리케이션을 모두 지원한다는 것입니다. 따라서 매우 복잡합니다.
  • 잠재적인 중복: 특히 기능이 중복될 가능성이 더 높습니다.

OLAP의 장점

  • OLAP은 계획, 예산 책정, 보고, 분석을 포함한 모든 유형의 비즈니스를 위한 플랫폼입니다.
  • 정보와 계산은 OLAP 큐브에서 일관됩니다. 이는 매우 중요한 이점입니다.
  • "만약" 시나리오를 신속하게 생성 및 분석
  • 광범위하거나 특정 용어에 대한 OLAP 데이터베이스를 쉽게 검색할 수 있습니다.
  • OLAP은 비즈니스 모델링 도구, 데이터 마이닝 도구, 성과 보고 도구를 위한 구성 요소를 제공합니다.
  • 사용자가 다양한 차원, 측정값 및 필터를 사용하여 큐브 데이터를 쪼개고 쪼개는 작업을 수행할 수 있습니다.
  • 시계열 분석에 좋습니다.
  • OLAP을 사용하면 클러스터와 이상치를 쉽게 찾을 수 있습니다.
  • 더 빠른 응답 시간을 제공하는 강력한 시각화 온라인 분석 프로세스 시스템입니다.

OLAP의 단점

  • OLAP에서는 데이터를 별형 또는 눈송이 스키마로 구성해야 합니다. 이러한 스키마는 구현 및 관리가 복잡합니다.
  • 단일 OLAP 큐브에는 많은 수의 차원을 가질 수 없습니다.
  • OLAP 시스템에서는 트랜잭션 데이터에 접근할 수 없습니다.
  • OLAP 큐브를 수정하려면 큐브 전체를 업데이트해야 합니다. 이는 시간이 많이 걸리는 과정입니다.

요약

  • OLAP 데이터웨어 하우스 분석가가 다양한 관점에서 비즈니스 데이터를 추출하고 볼 수 있도록 하는 기술입니다.
  • OLAP 개념의 핵심에는 OLAP 큐브가 있습니다.
  • 다양한 비즈니스 애플리케이션과 기타 데이터 운영에는 OLAP Cube를 사용해야 합니다.
  • 데이터웨어하우스에는 1가지 주요 분석 OLAP 작업 유형이 있습니다. 2) 롤업 3) 드릴다운 4) 슬라이스 5) 다이스 XNUMX) 피벗
  • 널리 사용되는 OLAP 시스템에는 MOLAP, ROLAP 및 Hybrid OLAP의 세 가지 유형이 있습니다.
  • 데스크탑 OLAP, 웹 OLAP 및 모바일 OLAP은 다른 유형의 OLAP 시스템입니다.