Pentaho-Datenintegrations-Tutorial: Was ist das Pentaho ETL-Tool?
Was ist Pentaho BI?
Pentaho ist ein Business-Intelligence-Tool, das seinen Kunden eine breite Palette von Business-Intelligence-Lösungen bietet. Es ist in der Lage, Berichterstellung, Datenanalyse, Datenintegration, Data Mining usw. durchzuführen. Pentaho bietet außerdem einen umfassenden Satz an BI-Funktionen, mit denen Sie die Geschäftsleistung und -effizienz verbessern können.
Merkmale von Pentaho
Im Folgenden sind die wichtigen Funktionen von Pentaho aufgeführt:
- ETL-Funktionen für Business-Intelligence-Anforderungen
- Pentaho Report Designer verstehen
- Produktkompetenz
- Bietet nebeneinander liegende Unterberichte
- Neue Fähigkeiten freischalten
- Professionelle Unterstützung
- Abfrage und Berichterstellung
- Bietet erweiterte Funktionalität
- Vollständige Laufzeitmetadatenunterstützung aus Datenquellen
Pentaho BI-Suite
In diesem Pentaho-Tutorial lernen wir nun die Pentaho BI-Suite kennen:
Pentaho BI Suite umfasst die folgenden Komponenten:
Pentaho-Berichterstattung
Pentaho Reporting hängt vom JFreeReport-Projekt ab. Es hilft Ihnen, Ihre Geschäftsberichtsanforderungen zu erfüllen. Diese Komponente ermöglicht außerdem die Veröffentlichung von Berichten sowohl nach Zeitplan als auch nach Bedarf in gängigen Formaten wie XLS, PDF, TXT und HTML.
Analyse
Es bietet ein breites Analysespektrum und zahlreiche Funktionen, einschließlich einer Pivot-Tabellenansicht. Das Tool bietet erweiterte GUI-Funktionen (mit Flash oder SVG), integrierte Dashboard-Widgets, Portal und Workflow-Integration.
Darüber hinaus ermöglicht Pentaho Spreadsheet Services einem Benutzer das Durchsuchen, Pivotieren und Verwenden von Diagrammen in MS Excel.
Armaturenbretter
Das Dashboard bietet Berichte und Analysen, die Inhalte zu Pentaho Dashboards beitragen. Der Self-Service-Dashboard-Designer umfasst umfangreiche integrierte Dashboard-Vorlagen und -Layouts. Es ermöglicht Geschäftsanwendern, mit wenig Schulung personalisierte Dashboards zu erstellen.
Data Mining
Data-Mining-Tool entdeckt versteckte Muster und Indikatoren für zukünftige Leistungen. Es bietet den umfassendsten Satz an Algorithmen für maschinelles Lernen aus dem Weka-Projekt, der Clustering, Entscheidungsbäume, Random Forests, Hauptkomponentenanalyse und neuronale Netzwerke umfasst.
Es ermöglicht Ihnen, Daten grafisch anzuzeigen, programmgesteuert mit ihnen zu interagieren oder mehrere Datenquellen für Berichte, weitere Analysen und andere Prozesse zu verwenden.
Pentaho-Datenintegration
Diese Komponente wird verwendet, um Daten zu integrieren, wo immer sie vorhanden sind.
Umfangreiche Transformationsbibliothek mit über 150 sofort einsatzbereiten Mapping-Objekten.
Es unterstützt eine breite Palette von Datenquellen, darunter mehr als 30 Open-Source- und proprietäre Datenbankplattformen sowie Flatfiles. Es hilft auch Big Data Analytics mit Integration und Verwaltung von Hadoop-Daten.
Wer nutzt Pentaho BI?
Pentaho BI ist ein weit verbreitetes Tool von vielen Software-Experten wie:
- Open-Source-Softwareprogramme
- Wirtschaftsanalytiker und Forscher
- College Studenten
- Berater für Wirtschaftsintelligenz
So installieren Sie Pentaho in AWS
Nachfolgend finden Sie eine Schritt-für-Schritt-Anleitung zur Installation von Pentaho in AWS.
Schritt 1) Klicken Sie auf „Weiter zum Abonnieren“.
Gehen Sie zu https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro und klicken Sie auf Weiter
Schritt 2) Akzeptieren Sie die Allgemeinen Geschäftsbedingungen
Akzeptieren Sie auf der nächsten Seite die Lizenzvereinbarung
Schritt 3) Klicken Sie auf Weiter zur Konfiguration
Fahren Sie mit der Konfiguration fort
Schritt 4) Klicken Sie auf „Weiter zum Starten“.
Behalten Sie die Standardeinstellungen bei und klicken Sie zum Starten
Schritt 5) Warten Sie beispielsweise 5 Minuten, um zu starten
Überprüfen Sie die Gebrauchsanweisung und warten Sie
Schritt 6) Holen Sie sich öffentliche IP
Kopieren Sie die öffentliche IP der Instanz.
Schritt 7) Verwenden Sie die öffentliche IP für die Anmeldung
Fügen Sie die öffentliche IP der Instanz ein, um auf Pentaho zuzugreifen.
Voraussetzung für Pentaho
- Hardware-Anforderungen
- Software Anforderungen
- Herunterladen und Installieren der Bl-Suite
- Starten der Bl-Suite
- Verwaltung der Bl-Suite
Hardware-Anforderung
Für die Pentaho Bl Suite-Software gibt es keine festen Beschränkungen auf einem Computer oder einer Netzwerkhardware, solange Sie die Mindestanforderungen an die Software erfüllen können. Die Installation dieses Business-Intelligence-Tools ist einfach. Allerdings ein empfohlener Satz von Systemspezifikationen:
RAM | Mindestens 2 GB |
Speicherplatz auf der Festplatte | Mindestens 1 GB |
Prozessor | Dual-Core EM64T oder AMD64 |
Software Anforderungen
- Installation von Sun JRE 5.0
- Die Umgebung kann entweder 32-Bit oder 64-Bit sein
- Unterstützte OperaBetriebssysteme: Linux, Solaris, Windows, Mac
- Eine Workstation mit einer modernen Webbrowser-Oberfläche wie Chrome, Internet Explorer, Firefox
Bl-Server starten
- On Windows Klicken Sie von Anfang an auf das Symbol „Bl-Server starten“.
- Führen Sie unter Linux das Skript start-pentaho im Verzeichnis /biserver-ce/aus
Zum Starten des Administratorservers
- On Windows Klicken Sie auf der Schaltfläche „Start“ auf „Bl-Unternehmensserver starten“.
- Für Linux: Gehen Sie zum Befehlsfenster und führen Sie das Startskript im Verzeichnis /biserver-ce/administration-console/aus.
So stoppen Sie den Administratorserver
- Um den Server in Windows zu stoppen, klicken Sie auf die Symbole zum Stoppen des BI-Servers.
- Unter Linux. Sie müssen zum Terminal gehen, in das Installationsverzeichnis wechseln und stop.bat ausführen
Pentaho-Verwaltungskonsole
Berichts-Designer
Es handelt sich um ein erweitertes Tool zur Berichterstellung. Dies ist ein ideales Tool für Sie, wenn Sie einen vollständigen Datenlaufwerksbericht erstellen möchten. Dieses Tool bietet viel mehr Flexibilität und Funktionalität als die Ad-hoc-Berichtsfunktionen der Pentaho-Benutzerkonsole.
Design Studio
Es ist eine Eclipse-basiertes Tool. Es ermöglicht Ihnen, einen Bericht oder eine Analyse manuell zu bearbeiten. Es wird häufig verwendet, um Änderungen an einem vorhandenen Bericht vorzunehmen, die mit Report Designer nicht hinzugefügt werden können.
Aggregationsdesigner
Mit diesem grafischen Tool können Sie die Effizienz des Mondrian-Würfels verbessern.
Metadaten-Editor
Es wird verwendet, um einer vorhandenen Datenquelle eine benutzerdefinierte Metadatenebene hinzuzufügen.
Pentaho-Datenintegration
Das Kettle-Tool zum Extrahieren, Transformieren und Laden (ETL), das dies ermöglicht
Pentaho Tool vs. BI-Stack
Pentaho-Werkzeug | BI-Stack |
---|---|
Datenintegration (PDI) | ETL |
Es bietet einen Metadaten-Editor | Es bietet Metadatenverwaltung |
Pentaho BA | Analyse |
Berichts-Designer | Operafunktionale Berichterstattung |
Saiku | Ad-hoc-Berichterstattung |
CDE | Armaturenbretter |
Pentaho-Benutzerkonsole (PUC) | Governance/Überwachung |
Vorteile von Pentaho
In diesem Tutorial zur Pentaho-Datenintegration lernen wir nun einige Vorteile des Pentaho Business Intelligence Tool kennen:
- Pentaho BI ist ein sehr intuitives Tool. Mit einigen grundlegenden Konzepten können Sie damit arbeiten.
- Einfaches und benutzerfreundliches Business-Intelligence-Tool
- Bietet eine breite Palette von BI-Funktionen, darunter Berichterstellung, Dashboard, interaktive Analyse, Datenintegration, Data Mining usw.
- Verfügt über eine benutzerfreundliche Oberfläche und bietet verschiedene Tools zum Abrufen von Daten aus mehreren Datenquellen
- Bietet ein Einzelpaket für die Arbeit an Daten
- Hat eine Community Edition mit vielen Mitwirkenden sowie eine Enterprise Edition.
- Die Fähigkeit, auf dem Hadoop-Cluster zu laufen
- JavaIn den Schrittkomponenten geschriebener Skriptcode kann in anderen Komponenten wiederverwendet werden.
Nachteile von Pentaho
Hier sind die Vor- und Nachteile der Verwendung des Pentaho BI-Tools:
- Das Design der Schnittstelle kann schwach sein und es gibt keine einheitliche Schnittstelle für alle Komponenten.
- Viel langsamere Tool-Entwicklung im Vergleich zu anderen BI-Tools.
- Pentaho Business Analytics bietet eine begrenzte Anzahl von Komponenten.
- Schlechter Community-Support. Wenn Sie also keine funktionierende Komponente erhalten, müssen Sie warten, bis die nächste Version veröffentlicht wird.
Zusammenfassung
- Pentaho ist ein Business-Intelligence-Tool, das eine breite Palette von Funktionen bietet Business Intelligence Lösungen für die Kunden
- Es bietet ETL-Funktionen für Business-Intelligence-Anforderungen.
- Pentaho-Suiten bieten Komponenten wie Berichte, Analysen, Dashboards und Data Mining
- Pentaho Business Intelligence wird häufig von 1) Wirtschaftsanalysten, 2) Open-Source-Softwareprogrammierern, 3) Forschern und 4) Studenten verwendet.
- Der Installationsprozess von Pentaho umfasst: 1) Hardwareanforderungen, 2) Softwareanforderungen, 3) Herunterladen der Bl-Suite, 4) Starten der Bl-Suite und 5) Verwaltung der Bl-Suite
- Wichtige Komponenten der Pentaho Administration Console sind 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho ist ein Datenintegrationstool (PDI), während der BI-Stack ein Tool ist ETL-Tool.
- Der größte Vorteil von Pentaho besteht darin, dass es ein einfaches und benutzerfreundliches Business-Intelligence-Tool ist.
- Der Hauptnachteil von Pentaho besteht darin, dass es sich im Vergleich zu anderen BI-Tools deutlich langsamer weiterentwickelt