Pentaho-Datenintegrations-Tutorial: Was ist das Pentaho ETL-Tool?

Was ist Pentaho BI?

Pentaho ist ein Business-Intelligence-Tool, das seinen Kunden eine breite Palette von Business-Intelligence-Lösungen bietet. Es ist in der Lage, Berichterstellung, Datenanalyse, Datenintegration, Data Mining usw. durchzuführen. Pentaho bietet außerdem einen umfassenden Satz an BI-Funktionen, mit denen Sie die Geschäftsleistung und -effizienz verbessern können.

Merkmale von Pentaho

Following, sind wichtige Merkmale von Pentaho:

  • ETL-Funktionen für Business-Intelligence-Anforderungen
  • Pentaho Report Designer verstehen
  • Produktkompetenz
  • Bietet nebeneinander liegende Unterberichte
  • Neue Fähigkeiten freischalten
  • Professionelle Unterstützung
  • Abfrage und Berichterstellung
  • Bietet erweiterte Funktionalität
  • Vollständige Laufzeitmetadatenunterstützung aus Datenquellen

Pentaho BI-Suite

In diesem Pentaho-Tutorial lernen wir nun die Pentaho BI-Suite kennen:

Pentaho BI Suite
Pentaho BI Suite

Die Pentaho BI Suite umfasst Folgendes:wing Komponenten:

Pentaho-Berichterstattung

Pentaho Reporting hängt vom JFreeReport-Projekt ab. Es hilft Ihnen, Ihre Geschäftsberichtsanforderungen zu erfüllen. Diese Komponente ermöglicht außerdem die Veröffentlichung von Berichten sowohl nach Zeitplan als auch nach Bedarf in gängigen Formaten wie XLS, PDF, TXT und HTML.

Analyse

Es bietet ein breites Analysespektrum und zahlreiche Funktionen, einschließlich einer Pivot-Tabellenansicht. Das Tool bietet erweiterte GUI-Funktionen (mit Flash oder SVG), integrierte Dashboard-Widgets, Portal und Workflow-Integration.

Darüber hinaus ermöglicht Pentaho Spreadsheet Services einem Benutzer das Durchsuchen, Pivotieren und Verwenden von Diagrammen in MS Excel.

Armaturenbretter

Das Dashboard bietet Berichte und Analysen, die Inhalte zu Pentaho Dashboards beitragen. Der Self-Service-Dashboard-Designer umfasst umfangreiche integrierte Dashboard-Vorlagen und -Layouts. Es ermöglicht Geschäftsanwendern, mit wenig Schulung personalisierte Dashboards zu erstellen.

Data Mining

Data-Mining-Tool entdeckt verborgene Muster und Indikatoren für die zukünftige Leistung. Es bietet den umfassendsten Satz an Algorithmen für maschinelles Lernen aus dem Weka-Projekt, einschließlich Clustering, Entscheidungsbäumen, Zufallswäldern, Hauptkomponentenanalyse und neuronalen Netzen.

Es ermöglicht Ihnen, Daten grafisch anzuzeigen, programmgesteuert mit ihnen zu interagieren oder mehrere Datenquellen für Berichte, weitere Analysen und andere Prozesse zu verwenden.

Pentaho-Datenintegration

Diese Komponente wird verwendet, um Daten zu integrieren, wo immer sie vorhanden sind.

Umfangreiche Transformationsbibliothek mit über 150 innovativenbox Objekte abbilden.

Es unterstützt eine breite Palette von Datenquellen, darunter mehr als 30 Open-Source- und proprietäre Datenbankplattformen sowie Flatfiles. Es hilft auch Big Data Analytics mit Integration und Verwaltung von Hadoop-Daten.

Wer nutzt Pentaho BI?

Pentaho BI ist ein weit verbreitetes Tool von vielen Software-Experten wie:

  • Open-Source-Softwareprogramme
  • Wirtschaftsanalytiker und Forscher
  • College Studenten
  • Berater für Wirtschaftsintelligenz

So installieren Sie Pentaho in AWS

Following ist ein schrittweiser Prozess zur Installation von Pentaho in AWS.

Schritt 1) Klicken Sie auf „Weiter zum Abonnieren“.
Gehen Sie zu https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro und klicken Sie auf Weiter

Installieren Sie Pentaho in AWS

Schritt 2) Akzeptieren Sie die Allgemeinen Geschäftsbedingungen
Akzeptieren Sie auf der nächsten Seite die Lizenzvereinbarung

Installieren Sie Pentaho in AWS

Schritt 3) Klicken Sie auf Weiter zur Konfiguration
Fahren Sie mit der Konfiguration fort

Installieren Sie Pentaho in AWS

Schritt 4) Klicken Sie auf „Weiter zum Starten“.
Behalten Sie die Standardeinstellungen bei und klicken Sie zum Starten

Installieren Sie Pentaho in AWS

Schritt 5) Warten Sie beispielsweise 5 Minuten, um zu starten
Überprüfen Sie die Gebrauchsanweisung und warten Sie

Installieren Sie Pentaho in AWS

Schritt 6) Holen Sie sich öffentliche IP
Kopieren Sie die öffentliche IP der Instanz.

Installieren Sie Pentaho in AWS

Schritt 7) Verwenden Sie die öffentliche IP für die Anmeldung
Fügen Sie die öffentliche IP der Instanz ein, um auf Pentaho zuzugreifen.

Installieren Sie Pentaho in AWS

Voraussetzung für Pentaho

  • Hardware-Anforderungen
  • Software Anforderungen
  • Herunterladen und Installieren der Bl-Suite
  • Starten der Bl-Suite
  • Verwaltung der Bl-Suite

Hardware-Anforderung

Für die Pentaho Bl Suite-Software gibt es keine festen Beschränkungen auf einem Computer oder einer Netzwerkhardware, solange Sie die Mindestanforderungen an die Software erfüllen können. Die Installation dieses Business-Intelligence-Tools ist einfach. Allerdings ein empfohlener Satz von Systemspezifikationen:

RAM Mindestens 2 GB
Speicherplatz auf der Festplatte Mindestens 1 GB
Prozessor Dual-Core EM64T oder AMD64

Software Anforderungen

  • Installation von Sun JRE 5.0
  • Die Umgebung kann entweder 32-Bit oder 64-Bit sein
  • Unterstützte Betriebssysteme: Linux, Solaris, Windows, Mac
  • Eine Workstation mit einer modernen Webbrowser-Oberfläche wie Chrome, Internet Explorer, Firefox

Bl-Server starten

  • On Windows Klicken Sie von Anfang an auf das Symbol „Bl-Server starten“.
  • Führen Sie unter Linux das Skript start-pentaho im Verzeichnis /biserver-ce/aus

Zum Starten des Administratorservers

  • On Windows Klicken Sie auf der Schaltfläche „Start“ auf „Bl-Unternehmensserver starten“.
  • Für Linux: Gehen Sie zum Befehlsfenster und führen Sie das Startskript im Verzeichnis /biserver-ce/administration-console/aus.

So stoppen Sie den Administratorserver

  • Um den Server anzuhalten windows, klicken Sie auf die Symbole „Bi-Server stoppen“.
  • Unter Linux. Sie müssen zum Terminal gehen, in das Installationsverzeichnis wechseln und stop.bat ausführen

Pentaho-Verwaltungskonsole

Berichts-Designer

Es handelt sich um ein erweitertes Tool zur Berichterstellung. Dies ist ein ideales Tool für Sie, wenn Sie einen vollständigen Datenlaufwerksbericht erstellen möchten. Dieses Tool bietet viel mehr Flexibilität und Funktionalität als die Ad-hoc-Berichtsfunktionen der Pentaho-Benutzerkonsole.

Design Studio

Es ist eine Eclipse-basiertes Tool. Es ermöglicht Ihnen, einen Bericht oder eine Analyse manuell zu bearbeiten. Es wird häufig verwendet, um Änderungen an einem vorhandenen Bericht vorzunehmen, die mit Report Designer nicht hinzugefügt werden können.

Aggregationsdesigner

Mit diesem grafischen Tool können Sie die Effizienz des Mondrian-Würfels verbessern.

Metadaten-Editor

Es wird verwendet, um einer vorhandenen Datenquelle eine benutzerdefinierte Metadatenebene hinzuzufügen.

Pentaho-Datenintegration

Das Kettle-Tool zum Extrahieren, Transformieren und Laden (ETL), das dies ermöglicht

Pentaho Tool vs. BI-Stack

Pentaho-Werkzeug BI-Stack
Datenintegration (PDI) ETL
Es bietet einen Metadaten-Editor Es bietet Metadatenverwaltung
Pentaho BA Analyse
Berichts-Designer Operative Berichterstattung
Saiku Ad-hoc-Berichterstattung
CDE Armaturenbretter
Pentaho-Benutzerkonsole (PUC) Governance/Überwachung

Vorteile von Pentaho

In diesem Tutorial zur Pentaho-Datenintegration lernen wir nun einige Vorteile des Pentaho Business Intelligence Tool kennen:

  • Pentaho BI ist ein sehr intuitives Tool. Mit einigen Grundkonzepten können Sie damit arbeiten.
  • Einfaches und benutzerfreundliches Business-Intelligence-Tool
  • Bietet eine breite Palette von BI-Funktionen, darunter Berichterstellung, Dashboard, interaktive Analyse, Datenintegration, Data Mining usw.
  • Verfügt über eine benutzerfreundliche Oberfläche und bietet verschiedene Tools zum Abrufen von Daten aus mehreren Datenquellen
  • Bietet ein Einzelpaket für die Arbeit an Daten
  • Verfügt neben der Enterprise-Edition über eine Community-Edition mit vielen Mitwirkenden.
  • Die Fähigkeit, auf dem Hadoop-Cluster ausgeführt zu werden
  • In den Schrittkomponenten geschriebener JavaScript-Code kann in anderen Komponenten wiederverwendet werden.

Nachteile von Pentaho

Hier sind die Vor- und Nachteile der Verwendung des Pentaho BI-Tools:

  • Das Design der Schnittstelle kann schwach sein und es gibt keine einheitliche Schnittstelle für alle Komponenten.
  • Viel langsamere Tool-Entwicklung im Vergleich zu anderen BI-Tools.
  • Pentaho Business Analytics bietet eine begrenzte Anzahl von Komponenten.
  • Schlechte Community-Unterstützung. Wenn Sie also keine funktionierende Komponente erhalten, müssen Sie warten, bis die nächste Version veröffentlicht wird.

Zusammenfassung

  • Pentaho ist ein Business-Intelligence-Tool, das eine breite Palette von Funktionen bietet Business Intelligence Lösungen für die Kunden
  • Es bietet ETL-Funktionen für Business-Intelligence-Anforderungen.
  • Pentaho-Suiten bieten Komponenten wie Berichte, Analysen, Dashboards und Data Mining
  • Pentaho Business Intelligence wird häufig von 1) Wirtschaftsanalysten, 2) Open-Source-Softwareprogrammierern, 3) Forschern und 4) Studenten verwendet.
  • Der Installationsprozess von Pentaho umfasst: 1) Hardwareanforderungen, 2) Softwareanforderungen, 3) Herunterladen der Bl-Suite, 4) Starten der Bl-Suite und 5) Verwaltung der Bl-Suite
  • Wichtige Komponenten der Pentaho Administration Console sind 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
  • Pentaho ist ein Datenintegrationstool (PDI), während der BI-Stack ein Tool ist ETL-Tool.
  • Der größte Vorteil von Pentaho besteht darin, dass es ein einfaches und benutzerfreundliches Business-Intelligence-Tool ist.
  • Der Hauptnachteil von Pentaho besteht darin, dass es sich im Vergleich zu anderen BI-Tools deutlich langsamer weiterentwickelt