Pentaho 데이터 통합 ​​튜토리얼: Pentaho ETL 도구란?

펜타호 BI란?

펜타 호 고객에게 광범위한 비즈니스 인텔리전스 솔루션을 제공하는 비즈니스 인텔리전스 도구입니다. 보고, 데이터 분석, 데이터 통합, 데이터 마이닝 등이 가능합니다. Pentaho는 또한 비즈니스 성과와 효율성을 향상시킬 수 있는 포괄적인 BI 기능 세트를 제공합니다.

펜타호의 특징

Pentaho의 중요한 기능은 다음과 같습니다.

  • 비즈니스 인텔리전스 요구에 맞는 ETL 기능
  • Pentaho 리포트 디자이너 이해하기
  • 제품 전문성
  • 병렬 하위 보고서 제공
  • 새로운 기능 잠금 해제
  • 전문 지원
  • 쿼리 및 보고
  • 향상된 기능 제공
  • 데이터 소스의 전체 런타임 메타데이터 지원

펜타호 BI 스위트

이제 이 Pentaho 튜토리얼에서 Pentaho BI 제품군에 대해 알아 보겠습니다.

펜타호 BI 스위트
펜타호 BI 스위트

Pentaho BI Suite에는 다음 구성 요소가 포함되어 있습니다.

펜타호 리포팅

Pentaho Reporting은 JFreeReport 프로젝트에 의존합니다. 이는 귀하의 비즈니스 보고 요구 사항을 충족하는 데 도움이 됩니다. 또한 이 구성 요소는 XLS, PDF, TXT, HTML 등 널리 사용되는 형식으로 예약된 보고서 게시와 주문형 보고서 게시를 모두 제공합니다.

분석

피벗 테이블 보기를 포함하는 광범위한 기능을 통해 광범위한 분석을 제공합니다. 이 도구는 향상된 GUI 기능(Flash 또는 SVG 사용), 통합 대시보드 위젯, 포털 및 워크플로 통합을 제공합니다.

또한 Pentaho 스프레드시트 서비스를 통해 사용자는 MS Excel 내에서 차트를 검색하고 피벗하고 사용할 수 있습니다.

대시 보드

대시보드는 Pentaho Dashboards에 콘텐츠를 제공하는 보고 및 분석을 제공합니다. 셀프 서비스 대시보드 디자이너에는 광범위한 내장 대시보드 템플릿과 레이아웃이 포함되어 있습니다. 이를 통해 비즈니스 사용자는 약간의 교육만으로도 개인화된 대시보드를 구축할 수 있습니다.

데이터 마이닝

데이터 마이닝 도구 미래 성과의 숨겨진 패턴과 지표를 발견합니다. 클러스터링, 의사결정 트리, 랜덤 포레스트, 주성분 분석, 신경망을 포함하는 Weka 프로젝트의 가장 포괄적인 머신 러닝 알고리즘 세트를 제공합니다.

이를 통해 데이터를 그래픽으로 보고, 프로그래밍 방식으로 상호 작용하거나, 보고서, 추가 분석 및 기타 프로세스를 위해 여러 데이터 소스를 사용할 수 있습니다.

Pentaho 데이터 통합

이 구성 요소는 데이터가 존재하는 모든 곳을 통합하는 데 사용됩니다.

150개 이상의 즉시 사용 가능한 매핑 객체를 갖춘 풍부한 변환 라이브러리입니다.

30개 이상의 오픈 소스 및 독점 데이터베이스 플랫폼, 플랫 파일을 포함하는 광범위한 데이터 소스를 지원합니다. 그것은 또한 도움이 된다 빅 데이터 분석 Hadoop 데이터를 통합하고 관리합니다.

펜타호 BI는 누가 사용하고 있나요?

Pentaho BI는 다음과 같은 소프트웨어 전문가가 널리 사용하는 도구입니다.

  • 오픈 소스 소프트웨어 프로그램
  • 비즈니스 분석가 및 연구원
  • 대학생들
  • 비즈니스 인텔리전스 위원

AWS에 Pentaho를 설치하는 방법

다음은 AWS에 Pentaho를 설치하는 방법에 대한 단계별 프로세스입니다.

단계 1) 구독하려면 계속을 클릭하세요.
We Buy Orders 신청서를 클릭하세요. https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro 그리고 계속을 클릭하세요

AWS에 Pentaho 설치

단계 2) 이용 약관 동의
다음 페이지에서 라이센스 계약 동의

AWS에 Pentaho 설치

단계 3) 구성 계속을 클릭하세요.
구성을 진행하세요

AWS에 Pentaho 설치

단계 4) 시작하려면 계속을 클릭하세요.
설정을 기본값으로 유지하고 클릭하여 실행하세요.

AWS에 Pentaho 설치

단계 5) 인스턴스가 시작될 때까지 5분 동안 기다립니다.
이용안내를 확인하고 기다려주세요

AWS에 Pentaho 설치

단계 6) 공개 IP 받기
인스턴스의 퍼블릭 IP를 복사합니다.

AWS에 Pentaho 설치

단계 7) 로그인에 공용 IP 사용
Pentaho에 접속하려면 해당 인스턴스의 공인 IP를 붙여넣으세요.

AWS에 Pentaho 설치

펜타호의 전제조건

  • 하드웨어 요구 사항
  • 소프트웨어 요구 사항
  • Bl 제품군 다운로드 및 설치
  • Bl 제품군 시작하기
  • Bl 제품군 관리

하드웨어 요구 사항

Pentaho Bl Suite 소프트웨어는 최소 소프트웨어 요구 사항을 충족할 수 있는 한 컴퓨터나 네트워크 하드웨어에 대한 수정 제한이 없습니다. 이 비즈니스 인텔리전스 도구를 설치하는 것은 쉽습니다. 그러나 권장되는 시스템 사양은 다음과 같습니다.

최소 2GB
하드 드라이브 공간 최소 1GB
프로세서 듀얼 코어 EM64T 또는 AMD64

소프트웨어 요구 사항

  • Sun JRE 5.0 설치
  • 환경은 32비트 또는 64비트일 수 있습니다.
  • 지원 Opera시스템: Linux, Solaris, Windows, 맥
  • Chrome, Internet Explorer와 같은 최신 웹 브라우저 인터페이스를 갖춘 워크스테이션 Firefox

Bl 서버를 시작하려면

  • On Windows 처음부터 Bl 서버 시작 아이콘을 클릭하세요.
  • Linux OS의 경우 /biserver-ce/directory에서 start-pentaho 스크립트를 실행합니다.

관리자 서버를 시작하려면

  • On Windows 시작 버튼에서 Bl 엔터프라이즈 서버 시작을 클릭합니다.
  • Linux의 경우: 명령 창으로 이동하여 /biserver-ce/administration-console/directory에서 시작 스크립트를 실행합니다.

관리자 서버를 중지하려면

  • Windows에서 서버를 중지하려면 Bi-Server 중지 아이콘을 클릭하세요.
  • 리눅스에서. 터미널로 이동하여 설치된 디렉토리로 이동하여 stop.bat를 실행해야 합니다.

Pentaho 관리 콘솔

보고서 디자이너

고급 보고서 작성 도구입니다. 이는 완전한 데이터 드라이브 보고서를 작성하려는 경우 이상적인 도구입니다. 이 도구는 Pentaho 사용자 콘솔의 임시 보고 기능보다 더 많은 유연성과 기능을 제공합니다.

디자인 스튜디오

이것은 Eclipse기반 도구. 이를 통해 보고서나 분석을 직접 편집할 수 있습니다. 보고서 디자이너로 추가할 수 없는 기존 보고서에 수정 사항을 추가하는 데 널리 사용됩니다.

집계 디자이너

이 그래픽 도구를 사용하면 몬드리안 큐브 효율성을 향상시킬 수 있습니다.

메타 데이터 편집기

기존 데이터 소스에 사용자 정의 메타데이터 레이어를 추가하는 데 사용됩니다.

Pentaho 데이터 통합

Kettle 추출, 변환 및 로드(ETL) 도구는 다음을 가능하게 합니다.

Pentaho Tool과 BI 스택 비교

펜타호 도구 BI 스택
데이터 통합(PDI) ETL
메타데이터 편집기를 제공합니다 메타데이터 관리 기능을 제공합니다.
펜타호 BA 통계 분석
보고서 디자이너 Opera선택적 보고
사이쿠 임시 보고
CDE 대시 보드
펜타호 사용자 콘솔(PUC) 거버넌스/모니터링

펜타호의 장점

이제 이 Pentaho 데이터 통합 ​​튜토리얼에서는 Pentaho 비즈니스 인텔리전스 도구의 몇 가지 장점에 대해 알아봅니다.

  • Pentaho BI는 매우 직관적인 도구입니다. 몇 가지 기본 개념을 사용하면 작업할 수 있습니다.
  • 간단하고 사용하기 쉬운 비즈니스 인텔리전스 도구
  • 보고, 대시보드, 대화형 분석, 데이터 통합, 데이터 마이닝 등을 포함하는 광범위한 BI 기능을 제공합니다.
  • 사용자 친화적인 인터페이스와 함께 제공되며 여러 데이터 소스에서 데이터를 검색할 수 있는 다양한 도구를 제공합니다.
  • 데이터 작업을 위한 단일 패키지 제공
  • 많은 기여자가 참여한 커뮤니티 에디션과 엔터프라이즈 에디션이 있습니다.
  • Hadoop 클러스터에서 실행하는 기능
  • Java단계 구성 요소에 작성된 스크립트 코드는 다른 구성 요소에서 재사용될 수 있습니다.

펜타호의 단점

Pentaho BI 도구 사용의 단점/단점은 다음과 같습니다.

  • 인터페이스 디자인이 약할 수 있으며 모든 구성 요소에 대한 통일된 인터페이스가 없습니다.
  • 다른 BI 도구에 비해 도구 발전 속도가 훨씬 느립니다.
  • Pentaho Business 분석은 제한된 수의 구성 요소를 제공합니다.
  • 커뮤니티 지원이 부족합니다. 따라서 작동하는 구성 요소를 얻지 못하면 다음 버전이 출시될 때까지 기다려야 합니다.

요약

  • Pentaho는 다양한 기능을 제공하는 비즈니스 인텔리전스 도구입니다. 비즈니스 인텔리전스 고객을 위한 솔루션
  • 비즈니스 인텔리전스 요구 사항에 맞는 ETL 기능을 제공합니다.
  • Pentaho 제품군은 보고서, 분석, 대시보드 및 데이터 마이닝과 같은 구성 요소를 제공합니다.
  • Pentaho Business Intelligence는 1) 비즈니스 분석가, 2) 오픈 소스 소프트웨어 프로그래머, 3) 연구원, 4) 대학생이 널리 사용합니다.
  • Pentaho 설치 프로세스에는 1) 하드웨어 요구 사항 2) 소프트웨어 요구 사항 3) Bl 제품군 다운로드 4) Bl 제품군 시작 5) Bl 제품군 관리가 포함됩니다.
  • Pentaho Administration 콘솔의 주요 구성 요소는 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration입니다.
  • Pentaho는 데이터 통합(PDI) 도구인 반면 BI 스택은 ETL 도구.
  • Pentaho의 가장 큰 장점은 비즈니스 인텔리전스 도구가 간단하고 사용하기 쉽다는 것입니다.
  • Pentaho의 가장 큰 단점은 다른 BI 도구에 비해 도구 진화가 훨씬 느리다는 것입니다.