Pentaho Data Integratie Tutorial: Wat is Pentaho ETL Tool
Wat is Pentaho BI?
pentaho is een Business Intelligence-tool die klanten een breed scala aan business intelligence-oplossingen biedt. Het is in staat tot rapportage, data-analyse, data-integratie, datamining, etc. Pentaho biedt ook een uitgebreide set BI-functies waarmee u de bedrijfsprestaties en efficiëntie kunt verbeteren.
Kenmerken van Pentaho
Hieronder staan de belangrijkste kenmerken van Pentaho:
- ETL-mogelijkheden voor business intelligence-behoeften
- Pentaho Report Designer begrijpen
- Productexpertise
- Biedt zij-aan-zij subrapporten
- Nieuwe mogelijkheden ontgrendelen
- Professionele ondersteuning
- Vraag en rapportage
- Biedt verbeterde functionaliteit
- Volledige runtime-metagegevensondersteuning vanuit gegevensbronnen
Pentaho BI-suite
Nu zullen we meer te weten komen over de Pentaho BI-suite in deze Pentaho-tutorial:
Pentaho BI Suite bevat de volgende componenten:
Pentaho-rapportage
Pentaho Reporting is afhankelijk van het JFreeReport-project. Het helpt u om aan uw zakelijke rapportagebehoeften te voldoen. Deze component biedt ook zowel geplande als on-demand publicatie van rapporten in populaire formaten zoals XLS, PDF, TXT en HTML.
Analyse
Het biedt een breed scala aan analyses en een breed scala aan functies, waaronder een draaitabelweergave. De tool biedt verbeterde GUI-functies (met behulp van Flash of SVG), geïntegreerde dashboardwidgets, portal- en workflow-integratie.
Bovendien stelt Pentaho Spreadsheet Services een gebruiker in staat om vanuit MS Excel door grafieken te bladeren, te draaien en deze te gebruiken.
Dashboards
Het dashboard biedt Rapportage en Analyse, die inhoud bijdragen aan Pentaho Dashboards. De selfservice dashboardontwerper bevat uitgebreide ingebouwde dashboardsjablonen en lay-out. Hiermee kunnen zakelijke gebruikers gepersonaliseerde dashboards bouwen met weinig training.
Data Mining
Tool voor datamining ontdekt verborgen patronen en indicatoren van toekomstige prestaties. Het biedt de meest uitgebreide set machine learning-algoritmen van het Weka-project, waaronder clustering, beslissingsbomen, willekeurige bossen, principal component analysis en neurale netwerken.
Hiermee kunt u gegevens grafisch bekijken, er programmatisch mee communiceren of meerdere gegevensbronnen gebruiken voor rapporten, verdere analyses en andere processen.
Pentaho-gegevensintegratie
Dit onderdeel wordt gebruikt om gegevens te integreren, waar deze ook bestaan.
Rijke transformatiebibliotheek met meer dan 150 kant-en-klare mappingobjecten.
Het ondersteunt een breed scala aan gegevensbronnen, waaronder meer dan 30 open source en eigen databaseplatforms en platte bestanden. Het helpt ook Big Data-analyse met integratie en beheer van Hadoop-gegevens.
Wie gebruiken Pentaho BI?
Pentaho BI is een veelgebruikte tool door veel softwareprofessionals zoals:
- Open source softwareprogramma's
- Bedrijfsanalist en onderzoeker
- College studenten
- Wethouder bedrijfsinformatie
Hoe Pentaho in AWS te installeren
Hieronder vindt u een stapsgewijs proces voor het installeren van Pentaho in AWS.
Stap 1) Klik op Doorgaan om u te abonneren
Ga naar https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro en klik op Doorgaan
Stap 2) Accepteer de algemene voorwaarden
Op de volgende pagina accepteert u de licentieovereenkomst
Stap 3) Klik op Doorgaan naar configuratie
Ga verder voor configuratie
Stap 4) Klik op Doorgaan om te starten
Houd de standaardinstellingen en klik om te starten
Stap 5) Wacht bijvoorbeeld 5 minuten om te starten
Controleer de gebruiksinstructies en wacht
Stap 6) Krijg een openbaar IP-adres
Kopieer het openbare IP-adres van de instantie.
Stap 7) Gebruik het openbare IP-adres om in te loggen
Plak het openbare IP-adres van de instantie om toegang te krijgen tot Pentaho.
Voorwaarde van Pentaho
- Hardwarevereisten
- Softwarevereisten
- Bl-suite downloaden en installeren
- De Bl-suite starten
- Beheer van de Bl-suite
Hardwarevereiste:
De Pentaho Bl Suite-software kent geen fixlimieten op een computer of netwerkhardware, zolang u maar aan de minimale softwarevereisten kunt voldoen. Deze Business Intelligence tool is eenvoudig te installeren. Een aanbevolen set systeemspecificaties:
RAM | Minimaal 2 GB |
Ruimte op de harde schijf | Minimaal 1 GB |
Gegevensverwerker | Dual-core EM64T of AMD64 |
Softwarevereisten
- Installatie van Sun JRE 5.0
- De omgeving kan 32-bits of 64-bits zijn
- ondersteunde Operasystemen: Linux, Solaris, Windows, Mac
- Een werkstation met een moderne webbrowserinterface zoals Chrome, Internet Explorer, Firefox
Om Bl-server te starten
- On Windows vanaf het begin klikt u op de knop Start Bl-serverpictogram.
- Voer op Linux OS het start-pentaho-script uit op /biserver-ce/directory
Om de beheerdersserver te starten
- On Windows klik vanaf de startknop op start Bl enterprise server.
- Voor Linux: ga naar het opdrachtvenster en voer het opstartscript uit in /biserver-ce/administration-console/directory.
Om de beheerdersserver te stoppen
- Om de server in Windows te stoppen, klikt u op het pictogram 'Bi-server stoppen'.
- Op Linux. Je moet naar de terminal gaan en naar de geïnstalleerde map gaan en stop.bat uitvoeren
Pentaho-beheerconsole
Rapportontwerper
Het is een geavanceerd hulpmiddel voor het maken van rapporten. Dit is een ideale tool voor u als u een compleet data-drive-rapport wilt maken. Deze tool biedt veel flexibiliteit en functionaliteit dan de ad hoc rapportagemogelijkheden van de Pentaho User Console.
Ontwerpstudio
Het is een Eclipse-gebaseerd hulpmiddel. Hiermee kunt u een rapport of analyse handmatig bewerken. Het wordt veel gebruikt om wijzigingen aan een bestaand rapport toe te voegen die niet met Report Designer kunnen worden toegevoegd.
Aggregatieontwerper
Met dit grafische hulpmiddel kunt u de efficiëntie van Mondriaan-kubussen verbeteren.
Metadata-editor
Het wordt gebruikt om een aangepaste metagegevenslaag toe te voegen aan elke bestaande gegevensbron.
Pentaho-gegevensintegratie
De Kettle-tool voor extraheren, transformeren en laden (ETL), die dit mogelijk maakt
Pentaho Tool versus BI-stack
Pentaho-gereedschap | BI-stapel |
---|---|
Gegevensintegratie (PDI) | ETL |
Het biedt een metadata-editor | Het biedt metadatabeheer |
Pentaho BA | Analytics |
Rapportontwerper | Operaationele rapportage |
Saiku | Ad-hocrapportage |
CDE | Dashboards |
Pentaho-gebruikersconsole (PUC) | Bestuur/monitoring |
Voordelen van Pentaho
In deze Pentaho data-integratie tutorial zullen we enkele voordelen van Pentaho Business Intelligence Tool leren kennen:
- Pentaho BI is een zeer intuïtieve tool. Met een aantal basisconcepten kun je ermee werken.
- Eenvoudig en gemakkelijk te gebruiken Business Intelligence-tool
- Biedt een breed scala aan BI-mogelijkheden, waaronder rapportage, dashboard, interactieve analyse, data-integratie, datamining, enz.
- Wordt geleverd met een gebruiksvriendelijke interface en biedt verschillende tools om gegevens uit meerdere gegevensbronnen op te halen
- Biedt één pakket om aan gegevens te werken
- Heeft een community-editie met veel bijdragers en een Enterprise-editie.
- De mogelijkheid om op het Hadoop-cluster te draaien
- JavaScriptcode die in de stapcomponenten is geschreven, kan in andere componenten worden hergebruikt.
Nadelen van Pentaho
Hier volgen de nadelen/nadelen van het gebruik van de Pentaho BI-tool:
- Het ontwerp van de interface kan zwak zijn en er is geen uniforme interface voor alle componenten.
- Veel langzamere tool-evolutie vergeleken met andere BI-tools.
- Pentaho Business analytics biedt een beperkt aantal componenten.
- Slechte community support. Dus als je geen werkend component krijgt, moet je wachten tot de volgende versie uitkomt.
Samenvatting
- Pentaho is een Business Intelligence-tool die een breed scala aan mogelijkheden biedt business intelligence oplossingen voor de klanten
- Het biedt ETL-mogelijkheden voor business intelligence-behoeften.
- Pentaho-suites bieden componenten zoals rapport, analyse, dashboard en datamining
- Pentaho Business Intelligence wordt veel gebruikt door 1) Bedrijfsanalist 2) Open source softwareprogrammeurs 3) Onderzoekers en 4) Studenten.
- Het installatieproces van Pentaho omvat: 1) Hardwarevereisten 2) Softwarevereisten, 3) Bl suite downloaden, 4) Starten van de Bl suite, en 5) Beheer van de Bl suite
- Belangrijke componenten van de Pentaho Beheerconsole zijn 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho is een Data Integration (PDI) -tool, terwijl BI-stack een ETL-tool.
- Het grootste voordeel van Pentaho is dat het een eenvoudig en gemakkelijk te gebruiken Business Intelligence-tool is.
- Het belangrijkste nadeel van Pentaho is dat het een veel langzamere tool-evolutie is vergeleken met andere BI-tools