Samouczek dotyczący integracji danych Pentaho: Co to jest narzędzie Pentaho ETL
Co to jest Pentaho BI?
Pentaho to narzędzie Business Intelligence, które dostarcza klientom szeroką gamę rozwiązań Business Intelligence. Umożliwia raportowanie, analizę danych, integrację danych, eksplorację danych itp. Pentaho oferuje również kompleksowy zestaw funkcji BI, które pozwalają poprawić wydajność i efektywność biznesową.
Cechy Pentaho
Oto najważniejsze cechy Pentaho:
- Możliwości ETL na potrzeby analityki biznesowej
- Zrozumienie projektanta raportów Pentaho
- Ekspertyza produktowa
- Oferuje podraporty side-by-side
- Odblokowanie nowych możliwości
- Profesjonalne wsparcie
- Zapytania i raportowanie
- Oferuje zwiększoną funkcjonalność
- Pełna obsługa metadanych środowiska wykonawczego ze źródeł danych
Pakiet Pentaho BI
Teraz dowiemy się o pakiecie Pentaho BI w tym samouczku Pentaho:
Pakiet Pentaho BI Suite zawiera następujące komponenty:
Sprawozdawczość Pentaho
Pentaho Reporting zależy od projektu JFreeReport. Pomaga spełnić Twoje potrzeby w zakresie raportowania biznesowego. Komponent ten umożliwia także publikowanie raportów zaplanowanych i na żądanie w popularnych formatach, takich jak XLS, PDF, TXT i HTML.
Analiza
Oferuje szeroki zakres analiz, szeroki zakres funkcji, w tym widok tabeli przestawnej. Narzędzie zapewnia ulepszone funkcje GUI (przy użyciu Flash lub SVG), zintegrowane widżety pulpitu nawigacyjnego, portal i integrację przepływu pracy.
Co więcej, usługi arkuszy kalkulacyjnych Pentaho umożliwiają użytkownikowi przeglądanie, przestawianie i używanie wykresów z poziomu programu MS Excel.
Pulpity
Pulpit nawigacyjny oferuje raporty i analizy, które dostarczają treści do pulpitów Pentaho. Samoobsługowy projektant pulpitów nawigacyjnych zawiera rozbudowane wbudowane szablony i układy pulpitów nawigacyjnych. Umożliwia użytkownikom biznesowym tworzenie spersonalizowanych pulpitów nawigacyjnych po niewielkim przeszkoleniu.
Data Mining
Narzędzie do eksploracji danych odkrywa ukryte wzorce i wskaźniki przyszłej wydajności. Oferuje najbardziej kompleksowy zestaw algorytmów uczenia maszynowego z projektu Weka, który obejmuje klasteryzacja, drzewa decyzyjne, lasy losowe, analizę głównych składowych, sieci neuronowe.
Umożliwia graficzne przeglądanie danych, programową interakcję z nimi lub korzystanie z wielu źródeł danych na potrzeby raportów, dalszych analiz i innych procesów.
Integracja danych Pentaho
Komponent ten służy do integracji danych, gdziekolwiek one istnieją.
Bogata biblioteka transformacji zawierająca ponad 150 gotowych obiektów mapowania.
Obsługuje szeroką gamę źródeł danych, która obejmuje ponad 30 platform baz danych typu open source i zastrzeżonych, plików płaskich. To także pomaga Analityka Big Data z integracją i zarządzaniem danymi Hadoop.
Kto korzysta z Pentaho BI?
Pentaho BI jest powszechnie używanym narzędziem przez wielu profesjonalistów zajmujących się oprogramowaniem, takich jak:
- Oprogramowanie typu open source
- Analityk biznesowy i badacz
- Studenci
- Radca ds. wywiadu gospodarczego
Jak zainstalować Pentaho w AWS
Poniżej przedstawiono krok po kroku proces instalacji Pentaho w AWS.
Krok 1) Kliknij Kontynuuj subskrypcję
Iść do https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro i kliknij Kontynuuj
Krok 2) Zaakceptuj regulamin
Na następnej stronie zaakceptuj umowę licencyjną
Krok 3) Kliknij Kontynuuj konfigurację
Przejdź do konfiguracji
Krok 4) Kliknij Kontynuuj, aby uruchomić
Zachowaj ustawienia domyślne i kliknij, aby uruchomić
Krok 5) Poczekaj na przykład 5 minut na uruchomienie
Sprawdź instrukcję obsługi i poczekaj
Krok 6) Uzyskaj publiczny adres IP
Skopiuj publiczny adres IP instancji.
Krok 7) Użyj publicznego adresu IP do logowania
Wklej publiczny adres IP instancji, aby uzyskać dostęp do Pentaho.
Warunek wstępny Pentaho
- wymagania sprzętowe
- Wymagania Systemowe
- Pobieranie i instalowanie pakietu Bl
- Rozpoczęcie pakietu Bl
- Administracja apartamentem Bl
Wymagania sprzętowe
Oprogramowanie Pentaho Bl Suite nie ma żadnych ograniczeń dotyczących poprawek na komputerze lub sprzęcie sieciowym, o ile można spełnić minimalne wymagania oprogramowania. Zainstalowanie tego narzędzia Business Intelligence jest łatwe. Jednakże zalecany zestaw specyfikacji systemu:
RAM | Minimum 2 GB |
Miejsce na dysku twardym | Minimum 1 GB |
Procesor | Dwurdzeniowy EM64T lub AMD64 |
Wymagania Systemowe
- Instalacja Sun JRE 5.0
- Środowisko może być 32-bitowe lub 64-bitowe
- Utrzymany Operasystemy operacyjne: Linux, Solaris, Windows, Mac
- Stacja robocza posiadająca interfejs nowoczesnej przeglądarki internetowej typu Chrome, Internet Explorer, Firefox
Aby uruchomić serwer Bl
- On Windows od początku kliknij przycisk Uruchom ikonę serwera Bl.
- W systemie operacyjnym Linux uruchom skrypt start-pentaho w katalogu /biserver-ce/
Aby uruchomić serwer administratora
- On Windows od przycisku Start kliknij przycisk Start Serwer korporacyjny Bl.
- W systemie Linux: przejdź do okna poleceń i uruchom skrypt startowy w katalogu /biserver-ce/administration-console/directory.
Aby zatrzymać serwer administratora
- Aby zatrzymać serwer w systemie Windows, kliknij ikonę Stop Bi-server.
- Na Linuksie. Musisz udać się do terminala, przejść do zainstalowanego katalogu i uruchomić stop.bat
Konsola administracyjna Pentaho
Projektant raportów
Jest to zaawansowane narzędzie do tworzenia raportów. Jest to idealne narzędzie dla Ciebie, jeśli chcesz zbudować kompletny raport dotyczący dysku danych. To narzędzie oferuje większą elastyczność i funkcjonalność niż możliwości raportowania ad hoc w Konsoli Użytkownika Pentaho.
Studio projektowe
To jest Eclipsenarzędzie oparte. Umożliwia ręczną edycję raportu lub analizy. Jest powszechnie używany do dodawania modyfikacji do istniejącego raportu, których nie można dodać za pomocą Projektanta raportów.
Projektant agregacji
To graficzne narzędzie pozwala poprawić wydajność kostki Mondriana.
Edytor metadanych
Służy do dodawania niestandardowej warstwy metadanych do dowolnego istniejącego źródła danych.
Integracja danych Pentaho
Narzędzie Kettle do wyodrębniania, przekształcania i ładowania (ETL), które umożliwia
Narzędzie Pentaho kontra stos BI
Narzędzie Pentaho | Stos BI |
---|---|
Integracja danych (PDI) | ETL |
Oferuje edytor metadanych | Zapewnia zarządzanie metadanymi |
Pentaho BA | Analityka |
Projektant raportów | OperaSprawozdawczość narodowa |
Saiku | Raportowanie ad hoc |
CDE | Pulpity |
Konsola użytkownika Pentaho (PUC) | Zarządzanie/Monitorowanie |
Zalety Pentaho
W tym samouczku dotyczącym integracji danych Pentaho dowiemy się o niektórych zaletach narzędzia Pentaho Business Intelligence Tool:
- Pentaho BI to bardzo intuicyjne narzędzie. Przy kilku podstawowych koncepcjach możesz z nim pracować.
- Proste i łatwe w użyciu narzędzie Business Intelligence
- Oferuje szeroki zakres możliwości BI, który obejmuje raportowanie, dashboard, interaktywną analizę, integrację danych, eksplorację danych itp.
- Posiada przyjazny dla użytkownika interfejs i zapewnia różne narzędzia do pobierania danych z wielu źródeł danych
- Oferuje pojedynczy pakiet do pracy na danych
- Dostępna jest również edycja społecznościowa z dużą liczbą współpracowników, a także edycja Enterprise.
- Możliwość uruchomienia w klastrze Hadoop
- JavaKod skryptu napisany w komponentach kroków może zostać ponownie wykorzystany w innych komponentach.
Wady Pentaho
Oto wady/wady korzystania z narzędzia Pentaho BI:
- Projekt interfejsu może być słaby i nie ma ujednoliconego interfejsu dla wszystkich komponentów.
- Znacznie wolniejsza ewolucja narzędzia w porównaniu do innych narzędzi BI.
- Pentaho Business Analytics oferuje ograniczoną liczbę komponentów.
- Słabe wsparcie społeczności. Więc jeśli nie otrzymasz działającego komponentu, musisz czekać, aż zostanie wydana następna wersja.
Podsumowanie
- Pentaho to narzędzie Business Intelligence, które zapewnia szeroki zakres business intelligence rozwiązań klientom
- Oferuje możliwości ETL na potrzeby analityki biznesowej.
- Pakiety Pentaho oferują komponenty takie jak raport, analiza, pulpit nawigacyjny i eksploracja danych
- Pentaho Business Intelligence jest powszechnie używany przez 1) analityków biznesowych, 2) programistów oprogramowania open source, 3) badaczy i 4) studentów.
- Proces instalacji Pentaho obejmuje: 1) wymagania sprzętowe 2) wymagania programowe, 3) pobranie pakietu Bl, 4) uruchomienie pakietu Bl oraz 5) administrowanie pakietem Bl
- Ważnymi komponentami konsoli administracyjnej Pentaho są: 1) Projektant raportów, 2) Studio projektowe, 3) Projektant agregacji 4) Edytor metadanych 5) Integracja danych Pentaho
- Pentaho to narzędzie do integracji danych (PDI), natomiast stos BI to narzędzie Narzędzie ETL.
- Największą zaletą Pentaho jest to, że jest to proste i łatwe w obsłudze narzędzie Business Intelligence.
- Główną wadą Pentaho jest to, że ewoluuje znacznie wolniej w porównaniu do innych narzędzi BI