데이터 웨어하우스의 차원 모델링이란 무엇입니까? 유형 알아보기
차원 모델링
차원 모델링(DM) 데이터 웨어하우스의 데이터 저장에 최적화된 데이터 구조 기술입니다. 차원 모델링의 목적은 데이터를 보다 빠르게 검색할 수 있도록 데이터베이스를 최적화하는 것입니다. 차원 모델링의 개념은 Ralph Kimball이 개발했으며 "사실" 테이블과 "차원" 테이블로 구성됩니다.
데이터웨어하우스의 차원 모델은 데이터웨어하우스에서 값, 잔액, 개수, 가중치 등과 같은 숫자 정보를 읽고, 요약하고, 분석하도록 설계되었습니다. 반면, 관계 모델은 실시간 온라인 거래 시스템에서 데이터를 추가, 업데이트 및 삭제하도록 최적화되었습니다.
이러한 차원 및 관계형 모델에는 특별한 장점이 있는 고유한 데이터 저장 방식이 있습니다.
예를 들어 관계형 모드에서는 정규화 및 ER 모델이 데이터의 중복성을 줄입니다. 반대로 데이터 웨어하우스의 차원 모델은 정보를 더 쉽게 검색하고 보고서를 생성할 수 있는 방식으로 데이터를 정렬합니다.
따라서 차원 모델은 다음과 같은 경우에 사용됩니다. 데이터 웨어하우스 시스템 관계형 시스템에는 적합하지 않습니다.
차원 데이터 모델의 요소
사실
사실은 비즈니스 프로세스의 측정/지표 또는 사실입니다. 판매 비즈니스 프로세스의 경우 측정값은 분기별 판매 번호입니다.
외형 치수
Dimension은 비즈니스 프로세스 이벤트와 관련된 컨텍스트를 제공합니다. 간단히 말해서 누가, 무엇을, 어디서 사실을 제공합니다. 판매 비즈니스 프로세스에서 팩트 분기별 판매량에 대한 차원은 다음과 같습니다.
- 누구 – 고객 이름
- 어디에 - 위치
- 무엇 – 제품 이름
즉, 차원은 사실의 정보를 볼 수 있는 창입니다.
Attributes
속성은 차원 데이터 모델링에서 차원의 다양한 특성입니다.
위치 차원에서 속성은 다음과 같습니다.
- 주 정부
- 국가
- 우편번호 등
속성은 사실을 검색, 필터링 또는 분류하는 데 사용됩니다. 차원 테이블에는 속성이 포함됩니다.
팩트 테이블
팩트 테이블은 차원 모델링의 기본 테이블입니다.
팩트 테이블에는 다음이 포함됩니다.
- 측정/사실
- 차원 테이블에 대한 외래 키
치수 표
- 차원 테이블에는 팩트의 차원이 포함됩니다.
- 외래 키를 통해 팩트 테이블에 조인됩니다.
- 차원 테이블은 비정규화된 테이블입니다.
- 차원 속성은 차원 테이블의 다양한 열입니다.
- 차원은 해당 속성을 사용하여 사실에 대한 설명적 특성을 제공합니다.
- 차원 수에 대해 설정된 제한이 설정되지 않았습니다.
- 차원에는 하나 이상의 계층 관계가 포함될 수도 있습니다.
데이터 웨어하우스의 차원 유형
다음은 데이터 웨어하우스의 차원 유형:
- 준수 치수
- 아우트리거 치수
- 축소된 차원
- 롤플레잉 차원
- 치수 대 치수 테이블
- 정크 차원
- 퇴화된 차원
- 교체 가능한 차원
- 단계 차원
차원 모델링 단계
차원 모델링 생성의 정확성이 데이터 웨어하우스 구현의 성공 여부를 결정합니다. 차원 모델을 생성하는 단계는 다음과 같습니다.
- 비즈니스 프로세스 식별
- 그레인 식별(세부 수준)
- 차원 식별
- 사실 확인
- 빌드스타
모델은 비즈니스 프로세스의 이유, 양, 언제/어디서/누구 및 무엇을 설명해야 합니다.
1단계) 비즈니스 프로세스 파악
데이터 저장소가 다루어야 하는 실제 비즈니스 프로세스를 식별합니다. 이는 마케팅, 영업, HR 등이 될 수 있습니다. 데이터 분석 조직의 필요. 비즈니스 프로세스 선택은 해당 프로세스에 사용 가능한 데이터 품질에 따라 달라집니다. 이는 데이터 모델링 프로세스의 가장 중요한 단계이며, 여기서 실패하면 연쇄적이고 복구할 수 없는 결함이 발생합니다.
비즈니스 프로세스를 설명하려면 일반 텍스트를 사용하거나 기본 BPMN(비즈니스 프로세스 모델링 표기법) 또는 통합 모델링 언어(UML).
2단계) 곡물 식별
그레인은 비즈니스 문제/솔루션의 세부 수준을 설명합니다. 이는 데이터 웨어하우스의 모든 테이블에 대한 가장 낮은 수준의 정보를 식별하는 프로세스입니다. 테이블에 매일의 판매 데이터가 포함되어 있으면 일일 단위로 세분화되어야 합니다. 테이블에 매월 총 판매 데이터가 포함되어 있으면 월 단위로 세분성이 있는 것입니다.
이 단계에서는 다음과 같은 질문에 답합니다.
- 사용 가능한 모든 제품을 저장해야 합니까, 아니면 몇 가지 유형의 제품만 저장해야 합니까? 이 결정은 Datawarehouse에 선택된 비즈니스 프로세스를 기반으로 합니다.
- 상품 판매 정보를 월별, 주별, 일별, 시간별로 저장하나요? 이 결정은 경영진이 요청한 보고서의 성격에 따라 달라집니다.
- 위의 두 가지 선택 사항은 데이터베이스 크기에 어떤 영향을 줍니까?
곡물의 예:
다국적 기업의 CEO는 매일 다양한 위치에서 특정 제품의 판매량을 확인하려고 합니다.
그래서 그 알갱이는 “요일별 장소별 상품판매정보”이다.
3단계) 차원 식별
차원은 날짜, 매장, 재고 등과 같은 명사입니다. 이러한 차원은 모든 데이터가 저장되어야 하는 위치입니다. 예를 들어 날짜 측정기준에는 연도, 월, 요일과 같은 데이터가 포함될 수 있습니다.
치수의 예:
다국적 기업의 CEO는 매일 다양한 위치에서 특정 제품의 판매량을 확인하려고 합니다.
차원: 제품, 위치 및 시간
속성: 제품의 경우: 제품 키(외래 키), 이름, 유형, 사양
계층 구조: 위치: 국가, 주, 도시, 거리 주소, 이름
4단계) 사실 확인
이 단계는 데이터 웨어하우스에 저장된 데이터에 액세스할 수 있는 단계이므로 시스템의 비즈니스 사용자와 공동으로 연관됩니다. 팩트 테이블 행의 대부분은 가격이나 단위당 비용 등과 같은 숫자 값입니다.
사실의 예:
다국적 기업의 CEO는 매일 다양한 위치에서 특정 제품의 판매량을 확인하려고 합니다.
여기서 사실은 제품별, 지역별, 시간별 매출 합계입니다.
5단계) 스키마 구축
이 단계에서는 차원 모델을 구현합니다. 스키마는 데이터베이스 구조(테이블 배열)에 불과합니다. 두 가지 인기 있는 스키마가 있습니다.
- 스타 스키마
스타 스키마 아키텍처는 설계하기 쉽습니다. 다이어그램이 별과 비슷하고, 점이 중심에서 방사형으로 뻗어 있기 때문에 스타 스키마라고 합니다. 별의 중심은 팩트 테이블로 구성되고, 별의 점은 차원 테이블입니다.
차원 테이블이 비정규화되는 반면 세 번째 정규 형식인 스타 스키마의 팩트 테이블입니다.
- 눈송이 스키마
눈송이 스키마는 스타 스키마의 확장입니다. 눈송이 스키마에서 각 차원은 정규화되어 더 많은 차원 테이블에 연결됩니다.
또한 확인:- 모델 예제가 포함된 데이터 웨어하우스의 별 및 눈송이 스키마
차원 모델링 규칙
차원 모델링의 규칙과 원칙은 다음과 같습니다.
- 원자 데이터를 차원 구조로 로드합니다.
- 비즈니스 프로세스를 중심으로 차원 모델을 구축합니다.
- 모든 사실 테이블에 연관된 날짜 차원 테이블이 있는지 확인해야 합니다.
- 단일 팩트 테이블의 모든 팩트가 동일한 세부 수준 또는 세부 수준에 있는지 확인하세요.
- 차원 테이블에 보고서 라벨과 필터 도메인 값을 저장하는 것이 중요합니다.
- 차원 테이블이 서로게이트 키를 사용하는지 확인해야 함
- 요구 사항과 현실의 균형을 지속적으로 유지하여 의사 결정을 지원하는 비즈니스 솔루션을 제공합니다.
차원 모델링의 이점
- 차원을 표준화하면 비즈니스 영역 전반에 걸쳐 쉽게 보고할 수 있습니다.
- 차원 테이블은 차원 정보의 기록을 저장합니다.
- 이를 통해 팩트 테이블을 크게 중단하지 않고 완전히 새로운 차원을 도입할 수 있습니다.
- 또한 데이터가 데이터베이스에 저장되면 데이터에서 정보를 검색하기가 더 쉽도록 데이터를 저장하는 차원적 방법도 있습니다.
- 정규화된 모델의 치수표에 비해 이해하기 쉽습니다.
- 정보는 명확하고 간단한 비즈니스 카테고리로 그룹화됩니다.
- 차원 모델은 비즈니스에서 매우 이해하기 쉽습니다. 이 모델은 비즈니스 용어를 기반으로 하므로 비즈니스는 각 사실, 차원 또는 속성의 의미를 알 수 있습니다.
- 차원 모델은 빠른 데이터 쿼리를 위해 변형되고 최적화되었습니다. 많은 관계형 데이터베이스 플랫폼은 이 모델을 인식하고 쿼리 실행 계획을 최적화하여 성능을 지원합니다.
- 데이터 웨어하우스의 차원 모델링은 고성능에 최적화된 스키마를 생성합니다. 이는 조인 수가 적고 데이터 중복을 최소화하는 데 도움이 됩니다.
- 차원 모델은 쿼리 성능을 높이는 데도 도움이 됩니다. 더 비정규화되었으므로 쿼리에 최적화되어 있습니다.
- 차원 모델은 변화를 편안하게 수용할 수 있습니다. 차원 테이블은 이러한 테이블을 사용하는 기존 비즈니스 인텔리전스 응용 프로그램에 영향을 주지 않고 더 많은 열을 추가할 수 있습니다.
데이터 웨어하우스의 다차원 데이터 모델이란 무엇입니까?
다차원 데이터 모델 데이터 웨어하우스에서는 데이터를 데이터 큐브 형태로 표현하는 모델입니다. 이를 통해 데이터를 여러 차원으로 모델링하고 볼 수 있으며 차원과 사실로 정의됩니다. 다차원 데이터 모델은 일반적으로 중심 주제를 중심으로 분류되고 팩트 테이블로 표시됩니다.
요약
- 차원 모델은 다음에 최적화된 데이터 구조 기술입니다. 데이터 웨어하우징 도구.
- 사실은 비즈니스 프로세스의 측정/지표 또는 사실입니다.
- Dimension은 비즈니스 프로세스 이벤트와 관련된 컨텍스트를 제공합니다.
- 속성은 차원 모델링의 다양한 특성입니다.
- 팩트 테이블은 차원 모델의 기본 테이블입니다.
- 차원 테이블에는 팩트의 차원이 포함됩니다.
- 사실에는 세 가지 유형이 있습니다. 1. 첨가물 2. 비첨가물 3. 반첨가물.
- 차원 유형에는 준수, 아웃리거, 축소, 롤플레잉, 차원 대 차원 테이블, 정크, 퇴화, 교환 가능 및 단계 차원이 있습니다.
- 차원 모델링의 1단계는 2. 비즈니스 프로세스 식별 3. 세부 사항 식별(세부 수준) 4. 차원 식별 5. 사실 식별 XNUMX. 별 구축
- 데이터 웨어하우스의 차원 모델링의 경우 모든 사실 테이블에 연결된 날짜 차원 테이블이 있는지 확인해야 합니다.