Pentaho Data Integration Tutorial
Hvad er Pentaho BI?
Pentaho er et Business Intelligence-vรฆrktรธj, som leverer en bred vifte af business intelligence-lรธsninger til kunderne. Den er i stand til rapportering, dataanalyse, dataintegration, datamining osv. Pentaho tilbyder ogsรฅ et omfattende sรฆt BI-funktioner, som giver dig mulighed for at forbedre virksomhedens ydeevne og effektivitet.
Funktioner af Pentaho
Fรธlgende er vigtige funktioner i Pentaho:
- ETL-funktioner til business intelligence-behov
- Forstรฅelse af Pentaho Report Designer
- Produktekspertise
- Tilbyder side-by-side underrapporter
- Lรฅser op for nye muligheder
- Professionel support
- Forespรธrgsel og rapportering
- Tilbyder forbedret funktionalitet
- Fuld runtime-metadataunderstรธttelse fra datakilder
Pentaho BI suite
Nu vil vi lรฆre om Pentaho BI-pakken i denne Pentaho-tutorial:

Pentaho BI Suite indeholder fรธlgende komponenter:
Pentaho-rapportering
Pentaho-rapportering afhรฆnger af JFreeReport-projektet. Det hjรฆlper dig med at opfylde dine virksomhedsrapporteringsbehov. Denne komponent tilbyder ogsรฅ bรฅde planlagt og on-demand rapportudgivelse i populรฆre formater som XLS, PDF, TXT og HTML.
Analyse
Det tilbyder en bred vifte af analyser en bred vifte af funktioner, der inkluderer en pivottabelvisning. Vรฆrktรธjet giver forbedrede GUI-funktioner (ved hjรฆlp af Flash eller SVG), integrerede dashboard-widgets, portal og workflow-integration.
Desuden giver Pentaho Spreadsheet Services en bruger mulighed for at gennemse, pivotere og bruge diagrammet fra MS Excel.
Dashboards
Dashboardet tilbyder rapportering og analyse, som bidrager med indhold til Pentaho Dashboards. Selvbetjeningsdashboarddesigneren inkluderer omfattende indbyggede dashboardskabeloner og layout. Det giver forretningsbrugere mulighed for at bygge personlige dashboards med lidt trรฆning.
Data Mining
Data mining vรฆrktรธj opdager skjulte mรธnstre og indikatorer for fremtidig ydeevne. Det tilbyder det mest omfattende sรฆt af maskinlรฆringsalgoritmer fra Weka-projektet, som inkluderer klyngedannelse, beslutningstrรฆer, tilfรฆldige skove, hovedkomponentanalyse, neurale netvรฆrk.
Det giver dig mulighed for at se data grafisk, interagere med dem programmatisk eller bruge flere datakilder til rapporter, yderligere analyser og andre processer.
Pentaho dataintegration
Denne komponent bruges til at integrere data, uanset hvor de findes.
Rigt transformationsbibliotek med over 150 direkte kortlรฆgningsobjekter.
Det understรธtter en bred vifte af datakilder, som omfatter mere end 30 open source og proprietรฆre databaseplatforme, flade filer. Det hjรฆlper ogsรฅ Big Data-analyse med integration og styring af Hadoop data.
Hvem bruger Pentaho BI?
Pentaho BI er et udbredt vรฆrktรธj af mange software-professionelle som:
- Open source-softwareprogrammer
- Forretningsanalytiker og forsker
- Kollegium studerende
- Rรฅdmand for Business Intelligence
Sรฅdan installeres Pentaho i AWS
Fรธlgende er en trin for trin proces om, hvordan man installerer Pentaho i AWS.
Trin 1) Klik pรฅ Fortsรฆt for at abonnere
Gรฅ til https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro og klik pรฅ Fortsรฆt
Trin 2) Accepter vilkรฅr og betingelser
Accepter licensaftalen pรฅ nรฆste side
Trin 3) Klik pรฅ Fortsรฆt til konfiguration
Fortsรฆt til konfiguration
Trin 4) Klik pรฅ Fortsรฆt for at starte
Behold indstillingerne som standard, og klik for at starte
Trin 5) Vent f.eks. 5 minutter for at starte
Tjek brugsanvisningen og vent
Trin 6) Fรฅ offentlig IP
Kopiรฉr instansens offentlige IP-adresse.
Trin 7) Brug den offentlige IP til login
Indsรฆt instansens offentlige IP for at fรฅ adgang til Pentaho.
Forudsรฆtning for Pentaho
- Hardwarekrav
- Softwarekrav
- Downloader og installerer Bl suite
- Starter Bl suiten
- Administration af Bl suiten
Hardwarekrav
Pentaho Bl Suite-softwaren har ingen fixgrรฆnser pรฅ en computer eller netvรฆrkshardware, sรฅ lรฆnge du kan opfylde minimumssoftwarekravene. Det er nemt at installere dette Business Intelligence-vรฆrktรธj. Et anbefalet sรฆt systemspecifikationer:
| RAM | Minimum 2 GB |
| Plads pรฅ harddisken | Minimum 1 GB |
| Processor | Dual-core EM64T eller AMD64 |
Softwarekrav
- Installation af Sun JRE 5.0
- Miljรธet kan vรฆre enten 32-bit eller 64-bit
- Understรธttet Operating systemer: Linux, Solaris, Windows, Mac
- En arbejdsstation, der har en moderne webbrowsergrรฆnseflade som Chrome, Internet Explorer, Firefox
For at starte Bl-server
- On Windows fra starten, knap klik pรฅ start Bl server-ikonet.
- Pรฅ Linux OS kรธr start-pentaho script pรฅ /biserver-ce/directory
For at starte administratorserveren
- On Windows fra startknappen klik pรฅ start Bl enterprise server.
- For Linux: Gรฅ til kommandovinduet og kรธr opstartsscriptet i /biserver-ce/administration-console/directory.
For at stoppe administratorserver
- For at stoppe serveren i Windows skal du klikke pรฅ stop bi-server-ikoner.
- Pรฅ Linux. Du skal gรฅ til terminalen og gรฅ til den installerede mappe og kรธre stop.bat
Pentaho administrationskonsol
Rapportdesigner
Det er et avanceret vรฆrktรธj til oprettelse af rapporter. Dette er et ideelt vรฆrktรธj til dig, hvis du รธnsker at bygge en komplet datadrev-rapport. Dette vรฆrktรธj tilbyder masser af fleksibilitet og funktionalitet end ad hoc-rapporteringsfunktionerne i Pentaho-brugerkonsollen.
Design Studio
Det er en Eclipse-baseret vรฆrktรธj. Det giver dig mulighed for at hรฅndredigere en rapport eller analyse. Det er meget brugt til at tilfรธje รฆndringer til en eksisterende rapport, som ikke kan tilfรธjes med Report Designer.
Aggregationsdesigner
Dette grafiske vรฆrktรธj giver dig mulighed for at forbedre Mondrian-terningens effektivitet.
Metadata Editor
Det bruges til at tilfรธje tilpasset metadatalag til enhver eksisterende datakilde.
Pentaho dataintegration
Kettle extract, transform and load (ETL) vรฆrktรธjet, som muliggรธr
Pentaho Tool vs. BI stak
| Pentaho vรฆrktรธj | BI stak |
|---|---|
| Dataintegration (PDI) | ETL |
| Det tilbyder metadata Editor | Det giver metadatastyring |
| Pentaho BA | Analyse |
| Rapportdesigner | Operational rapportering |
| Saiku | Ad hoc rapportering |
| CDE | Dashboards |
| Pentaho brugerkonsol (PUC) | Governance/Overvรฅgning |
Fordele ved Pentaho
Nu i denne Pentaho dataintegration tutorial, vil vi lรฆre om nogle fordele ved Pentaho Business Intelligence Tool:
- Pentaho BI er et meget intuitivt vรฆrktรธj. Med nogle grundlรฆggende koncepter kan du arbejde med det.
- Enkelt og brugervenligt Business Intelligence-vรฆrktรธj
- Tilbyder en bred vifte af BI-funktioner, som inkluderer rapportering, dashboard, interaktiv analyse, dataintegration, datamining osv.
- Leveres med en brugervenlig grรฆnseflade og giver forskellige vรฆrktรธjer til at hente data fra flere datakilder
- Tilbyder enkelt pakke til at arbejde pรฅ Data
- Har en community-udgave med mange bidragydere sammen med Enterprise-udgaven.
- Evnen til at kรธre pรฅ Hadoop-klyngen
- JavaScriptkode skrevet i trinkomponenterne kan genbruges i andre komponenter.
Ulemper ved Pentaho
Her er ulemper/ulemper ved at bruge Pentaho BI-vรฆrktรธj:
- Designet af grรฆnsefladen kan vรฆre svagt, og der er ingen samlet grรฆnseflade for alle komponenter.
- Meget langsommere vรฆrktรธjsudvikling sammenlignet med andre BI-vรฆrktรธjer.
- Pentaho Business analytics tilbyder et begrรฆnset antal komponenter.
- Dรฅrlig stรธtte fra lokalsamfundet. Sรฅ hvis du ikke fรฅr en fungerende komponent, skal du vente til den nรฆste version er udgivet.
Resumรฉ
- Pentaho er et Business Intelligence-vรฆrktรธj, som giver en bred vifte af business intelligence lรธsninger til kunderne
- Det tilbyder ETL-funktioner til business intelligence-behov.
- Pentaho-suiter tilbyder komponenter som Rapport, Analyse, Dashboard og Data Mining
- Pentaho Business Intelligence er meget udbredt af 1) Business analytiker 2) Open source software programmรธrer 3) Forsker og 4) Universitetsstuderende.
- Installationsprocessen for Pentaho inkluderer: 1) Hardwarekrav 2) Softwarekrav, 3) Download af Bl-pakken, 4) Start af Bl-pakken og 5) Administration af Bl-pakken
- Vigtige komponenter i Pentahos administrationskonsol er 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho er et Data Integration (PDI) vรฆrktรธj, mens BI stack er et ETL vรฆrktรธj.
- Den stรธrste fordel ved Pentaho er, at det er enkelt og nemt at bruge Business Intelligence-vรฆrktรธj.
- Den stรธrste ulempe ved Pentaho er, at det er en meget langsommere vรฆrktรธjsudvikling sammenlignet med andre BI-vรฆrktรธjer







