Pentaho Data Integration Tutorial
Hvad er Pentaho BI?
Pentaho er et Business Intelligence-værktøj, som leverer en bred vifte af business intelligence-løsninger til kunderne. Den er i stand til rapportering, dataanalyse, dataintegration, datamining osv. Pentaho tilbyder også et omfattende sæt BI-funktioner, som giver dig mulighed for at forbedre virksomhedens ydeevne og effektivitet.
Funktioner af Pentaho
Følgende er vigtige funktioner i Pentaho:
- ETL-funktioner til business intelligence-behov
- Forståelse af Pentaho Report Designer
- Produktekspertise
- Tilbyder side-by-side underrapporter
- Låser op for nye muligheder
- Professionel support
- Forespørgsel og rapportering
- Tilbyder forbedret funktionalitet
- Fuld runtime-metadataunderstøttelse fra datakilder
Pentaho BI suite
Nu vil vi lære om Pentaho BI-pakken i denne Pentaho-tutorial:
Pentaho BI Suite indeholder følgende komponenter:
Pentaho-rapportering
Pentaho-rapportering afhænger af JFreeReport-projektet. Det hjælper dig med at opfylde dine virksomhedsrapporteringsbehov. Denne komponent tilbyder også både planlagt og on-demand rapportudgivelse i populære formater som XLS, PDF, TXT og HTML.
Analyse
Det tilbyder en bred vifte af analyser en bred vifte af funktioner, der inkluderer en pivottabelvisning. Værktøjet giver forbedrede GUI-funktioner (ved hjælp af Flash eller SVG), integrerede dashboard-widgets, portal og workflow-integration.
Desuden giver Pentaho Spreadsheet Services en bruger mulighed for at gennemse, pivotere og bruge diagrammet fra MS Excel.
Dashboards
Dashboardet tilbyder rapportering og analyse, som bidrager med indhold til Pentaho Dashboards. Selvbetjeningsdashboarddesigneren inkluderer omfattende indbyggede dashboardskabeloner og layout. Det giver forretningsbrugere mulighed for at bygge personlige dashboards med lidt træning.
Data Mining
Data mining værktøj opdager skjulte mønstre og indikatorer for fremtidig ydeevne. Det tilbyder det mest omfattende sæt af maskinlæringsalgoritmer fra Weka-projektet, som inkluderer klyngedannelse, beslutningstræer, tilfældige skove, hovedkomponentanalyse, neurale netværk.
Det giver dig mulighed for at se data grafisk, interagere med dem programmatisk eller bruge flere datakilder til rapporter, yderligere analyser og andre processer.
Pentaho dataintegration
Denne komponent bruges til at integrere data, uanset hvor de findes.
Rigt transformationsbibliotek med over 150 direkte kortlægningsobjekter.
Det understøtter en bred vifte af datakilder, som omfatter mere end 30 open source og proprietære databaseplatforme, flade filer. Det hjælper også Big Data-analyse med integration og styring af Hadoop data.
Hvem bruger Pentaho BI?
Pentaho BI er et udbredt værktøj af mange software-professionelle som:
- Open source-softwareprogrammer
- Forretningsanalytiker og forsker
- Kollegium studerende
- Rådmand for Business Intelligence
Sådan installeres Pentaho i AWS
Følgende er en trin for trin proces om, hvordan man installerer Pentaho i AWS.
Trin 1) Klik på Fortsæt for at abonnere
Gå til https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro og klik på Fortsæt
Trin 2) Accepter vilkår og betingelser
Accepter licensaftalen på næste side
Trin 3) Klik på Fortsæt til konfiguration
Fortsæt til konfiguration
Trin 4) Klik på Fortsæt for at starte
Behold indstillingerne som standard, og klik for at starte
Trin 5) Vent f.eks. 5 minutter for at starte
Tjek brugsanvisningen og vent
Trin 6) Få offentlig IP
Kopiér instansens offentlige IP-adresse.
Trin 7) Brug den offentlige IP til login
Indsæt instansens offentlige IP for at få adgang til Pentaho.
Forudsætning for Pentaho
- Hardwarekrav
- Softwarekrav
- Downloader og installerer Bl suite
- Starter Bl suiten
- Administration af Bl suiten
Hardwarekrav
Pentaho Bl Suite-softwaren har ingen fixgrænser på en computer eller netværkshardware, så længe du kan opfylde minimumssoftwarekravene. Det er nemt at installere dette Business Intelligence-værktøj. Et anbefalet sæt systemspecifikationer:
RAM | Minimum 2 GB |
Plads på harddisken | Minimum 1 GB |
Processor | Dual-core EM64T eller AMD64 |
Softwarekrav
- Installation af Sun JRE 5.0
- Miljøet kan være enten 32-bit eller 64-bit
- Understøttet Operating systemer: Linux, Solaris, Windows, Mac
- En arbejdsstation, der har en moderne webbrowsergrænseflade som Chrome, Internet Explorer, Firefox
For at starte Bl-server
- On Windows fra starten, knap klik på start Bl server-ikonet.
- På Linux OS kør start-pentaho script på /biserver-ce/directory
For at starte administratorserveren
- On Windows fra startknappen klik på start Bl enterprise server.
- For Linux: Gå til kommandovinduet og kør opstartsscriptet i /biserver-ce/administration-console/directory.
For at stoppe administratorserver
- For at stoppe serveren i Windows skal du klikke på stop bi-server-ikoner.
- På Linux. Du skal gå til terminalen og gå til den installerede mappe og køre stop.bat
Pentaho administrationskonsol
Rapportdesigner
Det er et avanceret værktøj til oprettelse af rapporter. Dette er et ideelt værktøj til dig, hvis du ønsker at bygge en komplet datadrev-rapport. Dette værktøj tilbyder masser af fleksibilitet og funktionalitet end ad hoc-rapporteringsfunktionerne i Pentaho-brugerkonsollen.
Design Studio
Det er en Eclipse-baseret værktøj. Det giver dig mulighed for at håndredigere en rapport eller analyse. Det er meget brugt til at tilføje ændringer til en eksisterende rapport, som ikke kan tilføjes med Report Designer.
Aggregationsdesigner
Dette grafiske værktøj giver dig mulighed for at forbedre Mondrian-terningens effektivitet.
Metadata Editor
Det bruges til at tilføje tilpasset metadatalag til enhver eksisterende datakilde.
Pentaho dataintegration
Kettle extract, transform and load (ETL) værktøjet, som muliggør
Pentaho Tool vs. BI stak
Pentaho værktøj | BI stak |
---|---|
Dataintegration (PDI) | ETL |
Det tilbyder metadata Editor | Det giver metadatastyring |
Pentaho BA | Analyse |
Rapportdesigner | Operational rapportering |
Saiku | Ad hoc rapportering |
CDE | Dashboards |
Pentaho brugerkonsol (PUC) | Governance/Overvågning |
Fordele ved Pentaho
Nu i denne Pentaho dataintegration tutorial, vil vi lære om nogle fordele ved Pentaho Business Intelligence Tool:
- Pentaho BI er et meget intuitivt værktøj. Med nogle grundlæggende koncepter kan du arbejde med det.
- Enkelt og brugervenligt Business Intelligence-værktøj
- Tilbyder en bred vifte af BI-funktioner, som inkluderer rapportering, dashboard, interaktiv analyse, dataintegration, datamining osv.
- Leveres med en brugervenlig grænseflade og giver forskellige værktøjer til at hente data fra flere datakilder
- Tilbyder enkelt pakke til at arbejde på Data
- Har en community-udgave med mange bidragydere sammen med Enterprise-udgaven.
- Evnen til at køre på Hadoop-klyngen
- JavaScriptkode skrevet i trinkomponenterne kan genbruges i andre komponenter.
Ulemper ved Pentaho
Her er ulemper/ulemper ved at bruge Pentaho BI-værktøj:
- Designet af grænsefladen kan være svagt, og der er ingen samlet grænseflade for alle komponenter.
- Meget langsommere værktøjsudvikling sammenlignet med andre BI-værktøjer.
- Pentaho Business analytics tilbyder et begrænset antal komponenter.
- Dårlig støtte fra lokalsamfundet. Så hvis du ikke får en fungerende komponent, skal du vente til den næste version er udgivet.
Resumé
- Pentaho er et Business Intelligence-værktøj, som giver en bred vifte af business intelligence løsninger til kunderne
- Det tilbyder ETL-funktioner til business intelligence-behov.
- Pentaho-suiter tilbyder komponenter som Rapport, Analyse, Dashboard og Data Mining
- Pentaho Business Intelligence er meget udbredt af 1) Business analytiker 2) Open source software programmører 3) Forsker og 4) Universitetsstuderende.
- Installationsprocessen for Pentaho inkluderer: 1) Hardwarekrav 2) Softwarekrav, 3) Download af Bl-pakken, 4) Start af Bl-pakken og 5) Administration af Bl-pakken
- Vigtige komponenter i Pentahos administrationskonsol er 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho er et Data Integration (PDI) værktøj, mens BI stack er et ETL værktøj.
- Den største fordel ved Pentaho er, at det er enkelt og nemt at bruge Business Intelligence-værktøj.
- Den største ulempe ved Pentaho er, at det er en meget langsommere værktøjsudvikling sammenlignet med andre BI-værktøjer