Samouczek dotyczący integracji danych Pentaho: Co to jest narzędzie Pentaho ETL

Co to jest Pentaho BI?

Pentaho to narzędzie Business Intelligence, które dostarcza klientom szeroką gamę rozwiązań Business Intelligence. Umożliwia raportowanie, analizę danych, integrację danych, eksplorację danych itp. Pentaho oferuje również kompleksowy zestaw funkcji BI, które pozwalają poprawić wydajność i efektywność biznesową.

Cechy Pentaho

Oto najważniejsze cechy Pentaho:

  • Możliwości ETL na potrzeby analityki biznesowej
  • Zrozumienie projektanta raportów Pentaho
  • Ekspertyza produktowa
  • Oferuje podraporty side-by-side
  • Odblokowanie nowych możliwości
  • Profesjonalne wsparcie
  • Zapytania i raportowanie
  • Oferuje zwiększoną funkcjonalność
  • Pełna obsługa metadanych środowiska wykonawczego ze źródeł danych

Pakiet Pentaho BI

Teraz dowiemy się o pakiecie Pentaho BI w tym samouczku Pentaho:

Pakiet Pentaho BI
Pakiet Pentaho BI

Pakiet Pentaho BI Suite zawiera następujące komponenty:

Sprawozdawczość Pentaho

Pentaho Reporting zależy od projektu JFreeReport. Pomaga spełnić Twoje potrzeby w zakresie raportowania biznesowego. Komponent ten umożliwia także publikowanie raportów zaplanowanych i na żądanie w popularnych formatach, takich jak XLS, PDF, TXT i HTML.

Analiza

Oferuje szeroki zakres analiz, szeroki zakres funkcji, w tym widok tabeli przestawnej. Narzędzie zapewnia ulepszone funkcje GUI (przy użyciu Flash lub SVG), zintegrowane widżety pulpitu nawigacyjnego, portal i integrację przepływu pracy.

Co więcej, usługi arkuszy kalkulacyjnych Pentaho umożliwiają użytkownikowi przeglądanie, przestawianie i używanie wykresów z poziomu programu MS Excel.

Pulpity

Pulpit nawigacyjny oferuje raporty i analizy, które dostarczają treści do pulpitów Pentaho. Samoobsługowy projektant pulpitów nawigacyjnych zawiera rozbudowane wbudowane szablony i układy pulpitów nawigacyjnych. Umożliwia użytkownikom biznesowym tworzenie spersonalizowanych pulpitów nawigacyjnych po niewielkim przeszkoleniu.

Data Mining

Narzędzie do eksploracji danych odkrywa ukryte wzorce i wskaźniki przyszłej wydajności. Oferuje najbardziej kompleksowy zestaw algorytmów uczenia maszynowego z projektu Weka, który obejmuje klasteryzacja, drzewa decyzyjne, lasy losowe, analizę głównych składowych, sieci neuronowe.

Umożliwia graficzne przeglądanie danych, programową interakcję z nimi lub korzystanie z wielu źródeł danych na potrzeby raportów, dalszych analiz i innych procesów.

Integracja danych Pentaho

Komponent ten służy do integracji danych, gdziekolwiek one istnieją.

Bogata biblioteka transformacji zawierająca ponad 150 gotowych obiektów mapowania.

Obsługuje szeroką gamę źródeł danych, która obejmuje ponad 30 platform baz danych typu open source i zastrzeżonych, plików płaskich. To także pomaga Analityka Big Data z integracją i zarządzaniem danymi Hadoop.

Kto korzysta z Pentaho BI?

Pentaho BI jest powszechnie używanym narzędziem przez wielu profesjonalistów zajmujących się oprogramowaniem, takich jak:

  • Oprogramowanie typu open source
  • Analityk biznesowy i badacz
  • Studenci
  • Radca ds. wywiadu gospodarczego

Jak zainstalować Pentaho w AWS

Poniżej przedstawiono krok po kroku proces instalacji Pentaho w AWS.

Krok 1) Kliknij Kontynuuj subskrypcję
Iść do https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro i kliknij Kontynuuj

Zainstaluj Pentaho w AWS

Krok 2) Zaakceptuj regulamin
Na następnej stronie zaakceptuj umowę licencyjną

Zainstaluj Pentaho w AWS

Krok 3) Kliknij Kontynuuj konfigurację
Przejdź do konfiguracji

Zainstaluj Pentaho w AWS

Krok 4) Kliknij Kontynuuj, aby uruchomić
Zachowaj ustawienia domyślne i kliknij, aby uruchomić

Zainstaluj Pentaho w AWS

Krok 5) Poczekaj na przykład 5 minut na uruchomienie
Sprawdź instrukcję obsługi i poczekaj

Zainstaluj Pentaho w AWS

Krok 6) Uzyskaj publiczny adres IP
Skopiuj publiczny adres IP instancji.

Zainstaluj Pentaho w AWS

Krok 7) Użyj publicznego adresu IP do logowania
Wklej publiczny adres IP instancji, aby uzyskać dostęp do Pentaho.

Zainstaluj Pentaho w AWS

Warunek wstępny Pentaho

  • wymagania sprzętowe
  • Wymagania Systemowe
  • Pobieranie i instalowanie pakietu Bl
  • Rozpoczęcie pakietu Bl
  • Administracja apartamentem Bl

Wymagania sprzętowe

Oprogramowanie Pentaho Bl Suite nie ma żadnych ograniczeń dotyczących poprawek na komputerze lub sprzęcie sieciowym, o ile można spełnić minimalne wymagania oprogramowania. Zainstalowanie tego narzędzia Business Intelligence jest łatwe. Jednakże zalecany zestaw specyfikacji systemu:

RAM Minimum 2 GB
Miejsce na dysku twardym Minimum 1 GB
Procesor Dwurdzeniowy EM64T lub AMD64

Wymagania Systemowe

  • Instalacja Sun JRE 5.0
  • Środowisko może być 32-bitowe lub 64-bitowe
  • Utrzymany Operasystemy operacyjne: Linux, Solaris, Windows, Mac
  • Stacja robocza posiadająca interfejs nowoczesnej przeglądarki internetowej typu Chrome, Internet Explorer, Firefox

Aby uruchomić serwer Bl

  • On Windows od początku kliknij przycisk Uruchom ikonę serwera Bl.
  • W systemie operacyjnym Linux uruchom skrypt start-pentaho w katalogu /biserver-ce/

Aby uruchomić serwer administratora

  • On Windows od przycisku Start kliknij przycisk Start Serwer korporacyjny Bl.
  • W systemie Linux: przejdź do okna poleceń i uruchom skrypt startowy w katalogu /biserver-ce/administration-console/directory.

Aby zatrzymać serwer administratora

  • Aby zatrzymać serwer w systemie Windows, kliknij ikonę Stop Bi-server.
  • Na Linuksie. Musisz udać się do terminala, przejść do zainstalowanego katalogu i uruchomić stop.bat

Konsola administracyjna Pentaho

Projektant raportów

Jest to zaawansowane narzędzie do tworzenia raportów. Jest to idealne narzędzie dla Ciebie, jeśli chcesz zbudować kompletny raport dotyczący dysku danych. To narzędzie oferuje większą elastyczność i funkcjonalność niż możliwości raportowania ad hoc w Konsoli Użytkownika Pentaho.

Studio projektowe

To jest Eclipsenarzędzie oparte. Umożliwia ręczną edycję raportu lub analizy. Jest powszechnie używany do dodawania modyfikacji do istniejącego raportu, których nie można dodać za pomocą Projektanta raportów.

Projektant agregacji

To graficzne narzędzie pozwala poprawić wydajność kostki Mondriana.

Edytor metadanych

Służy do dodawania niestandardowej warstwy metadanych do dowolnego istniejącego źródła danych.

Integracja danych Pentaho

Narzędzie Kettle do wyodrębniania, przekształcania i ładowania (ETL), które umożliwia

Narzędzie Pentaho kontra stos BI

Narzędzie Pentaho Stos BI
Integracja danych (PDI) ETL
Oferuje edytor metadanych Zapewnia zarządzanie metadanymi
Pentaho BA Analityka
Projektant raportów OperaSprawozdawczość narodowa
Saiku Raportowanie ad hoc
CDE Pulpity
Konsola użytkownika Pentaho (PUC) Zarządzanie/Monitorowanie

Zalety Pentaho

W tym samouczku dotyczącym integracji danych Pentaho dowiemy się o niektórych zaletach narzędzia Pentaho Business Intelligence Tool:

  • Pentaho BI to bardzo intuicyjne narzędzie. Przy kilku podstawowych koncepcjach możesz z nim pracować.
  • Proste i łatwe w użyciu narzędzie Business Intelligence
  • Oferuje szeroki zakres możliwości BI, który obejmuje raportowanie, dashboard, interaktywną analizę, integrację danych, eksplorację danych itp.
  • Posiada przyjazny dla użytkownika interfejs i zapewnia różne narzędzia do pobierania danych z wielu źródeł danych
  • Oferuje pojedynczy pakiet do pracy na danych
  • Dostępna jest również edycja społecznościowa z dużą liczbą współpracowników, a także edycja Enterprise.
  • Możliwość uruchomienia w klastrze Hadoop
  • JavaKod skryptu napisany w komponentach kroków może zostać ponownie wykorzystany w innych komponentach.

Wady Pentaho

Oto wady/wady korzystania z narzędzia Pentaho BI:

  • Projekt interfejsu może być słaby i nie ma ujednoliconego interfejsu dla wszystkich komponentów.
  • Znacznie wolniejsza ewolucja narzędzia w porównaniu do innych narzędzi BI.
  • Pentaho Business Analytics oferuje ograniczoną liczbę komponentów.
  • Słabe wsparcie społeczności. Więc jeśli nie otrzymasz działającego komponentu, musisz czekać, aż zostanie wydana następna wersja.

Podsumowanie

  • Pentaho to narzędzie Business Intelligence, które zapewnia szeroki zakres business intelligence rozwiązań klientom
  • Oferuje możliwości ETL na potrzeby analityki biznesowej.
  • Pakiety Pentaho oferują komponenty takie jak raport, analiza, pulpit nawigacyjny i eksploracja danych
  • Pentaho Business Intelligence jest powszechnie używany przez 1) analityków biznesowych, 2) programistów oprogramowania open source, 3) badaczy i 4) studentów.
  • Proces instalacji Pentaho obejmuje: 1) wymagania sprzętowe 2) wymagania programowe, 3) pobranie pakietu Bl, 4) uruchomienie pakietu Bl oraz 5) administrowanie pakietem Bl
  • Ważnymi komponentami konsoli administracyjnej Pentaho są: 1) Projektant raportów, 2) Studio projektowe, 3) Projektant agregacji 4) Edytor metadanych 5) Integracja danych Pentaho
  • Pentaho to narzędzie do integracji danych (PDI), natomiast stos BI to narzędzie Narzędzie ETL.
  • Największą zaletą Pentaho jest to, że jest to proste i łatwe w obsłudze narzędzie Business Intelligence.
  • Główną wadą Pentaho jest to, że ewoluuje znacznie wolniej w porównaniu do innych narzędzi BI