Pentaho-veiledning for dataintegrasjon
Hva er Pentaho BI?
Pentaho er et Business Intelligence-verktøy som gir et bredt spekter av business intelligence-løsninger til kundene. Den er i stand til rapportering, dataanalyse, dataintegrasjon, datautvinning osv. Pentaho tilbyr også et omfattende sett med BI-funksjoner som lar deg forbedre virksomhetens ytelse og effektivitet.
Funksjoner av Pentaho
Følgende er viktige funksjoner ved Pentaho:
- ETL-funksjoner for behov for forretningsintelligens
- Forstå Pentaho Report Designer
- Produktekspertise
- Tilbyr side-ved-side delrapporter
- Låser opp nye muligheter
- Profesjonell støtte
- Spørring og rapportering
- Tilbyr forbedret funksjonalitet
- Full runtime metadatastøtte fra datakilder
Pentaho BI-suite
Nå skal vi lære om Pentaho BI-pakken i denne Pentaho-opplæringen:

Pentaho BI Suite inkluderer følgende komponenter:
Pentaho-rapportering
Pentaho-rapportering avhenger av JFreeReport-prosjektet. Det hjelper deg å oppfylle dine forretningsrapporteringsbehov. Denne komponenten tilbyr også både planlagt og on-demand rapportpublisering i populære formater som XLS, PDF, TXT og HTML.
Analyse
Den tilbyr et bredt spekter av analyser og et bredt spekter av funksjoner som inkluderer en pivottabellvisning. Verktøyet gir forbedrede GUI-funksjoner (ved hjelp av Flash eller SVG), integrerte dashbord-widgets, portal og arbeidsflytintegrasjon.
Dessuten lar Pentaho Spreadsheet Services en bruker bla gjennom, pivotere og bruke diagram fra MS Excel.
Instrumentbord
Dashboardet tilbyr rapportering og analyse, som bidrar med innhold til Pentaho Dashboards. Selvbetjent dashborddesigner inkluderer omfattende innebygde dashbordmaler og layout. Det lar bedriftsbrukere bygge personlige dashboards med lite opplæring.
Data Mining
Data mining-verktøy oppdager skjulte mønstre og indikatorer for fremtidig ytelse. Den tilbyr det mest omfattende settet med maskinlæringsalgoritmer fra Weka-prosjektet, som inkluderer klynging, beslutningstrær, tilfeldige skoger, hovedkomponentanalyse, nevrale nettverk.
Den lar deg vise data grafisk, samhandle med dem programmatisk eller bruke flere datakilder for rapporter, videre analyser og andre prosesser.
Pentaho dataintegrasjon
Denne komponenten brukes til å integrere data uansett hvor den finnes.
Rikt transformasjonsbibliotek med over 150 kartleggingsobjekter som er klare.
Den støtter et bredt spekter av datakilder som inkluderer mer enn 30 åpen kildekode og proprietære databaseplattformer, flate filer. Det hjelper også Big Data-analyse med integrasjon og håndtering av Hadoop-data.
Hvem bruker Pentaho BI?
Pentaho BI er et mye brukt verktøy av programvareeksperter som:
- Programvare med åpen kildekode
- Forretningsanalytiker og forsker
- Studenter
- Business intelligence rådmann
Hvordan installere Pentaho i AWS
Følgende er en trinnvis prosess om hvordan du installerer Pentaho i AWS.
Trinn 1) Klikk på Fortsett for å abonnere
Gå til https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro og klikk på Fortsett
Trinn 2) Godta vilkår og betingelser
På neste side, Godta lisensavtalen
Trinn 3) Klikk på Fortsett til konfigurasjon
Fortsett til konfigurasjon
Trinn 4) Klikk på Fortsett for å starte
Behold innstillingene som standard, og klikk for å starte
Trinn 5) Vent i 5 minutter for å starte for eksempel
Sjekk bruksanvisningen og vent
Trinn 6) Få offentlig IP
Kopier den offentlige IP-en til forekomsten.
Trinn 7) Bruk den offentlige IP-en for pålogging
Lim inn offentlig IP for forekomsten for å få tilgang til Pentaho.
Forutsetning for Pentaho
- maskinvare~~POS=TRUNC krav~~POS=HEADCOMP
- Programvarekrav
- Laster ned og installerer Bl suite
- Starter Bl-suiten
- Administrasjon av Bl-suiten
Maskinvarekrav
Pentaho Bl Suite-programvaren har ingen fiksegrenser på en datamaskin eller nettverksmaskinvare så lenge du kan oppfylle minimumskravene til programvaren. Det er enkelt å installere dette Business Intelligence-verktøyet. Et anbefalt sett med systemspesifikasjoner:
RAM | Minimum 2 GB |
Harddiskplass | Minimum 1 GB |
prosessor | Dual-core EM64T eller AMD64 |
Programvarekrav
- Installasjon av Sun JRE 5.0
- Miljøet kan være enten 32-bit eller 64-bit
- Støttes Operating systemer: Linux, Solaris, WindowsMac
- En arbeidsstasjon som har et moderne nettlesergrensesnitt som Chrome, Internet Explorer, Firefox
For å starte Bl-server
- On Windows fra starten, klikk på start Bl server-ikonet.
- På Linux OS kjør start-pentaho-skriptet på /biserver-ce/directory
For å starte administratorserveren
- On Windows fra startknappen klikker du på start Bl enterprise server.
- For Linux: gå til kommandovinduet og kjør oppstartsskriptet i /biserver-ce/administration-console/directory.
For å stoppe administratorserver
- For å stoppe serveren i Windows, klikk på stopp bi-server-ikoner.
- På Linux. Du må gå til terminalen og gå til installert katalog og kjøre stop.bat
Pentaho administrasjonskonsoll
Rapportdesigner
Det er et avansert rapportopprettingsverktøy. Dette er et ideelt verktøy for deg hvis du ønsker å bygge en komplett datastasjonsrapport. Dette verktøyet tilbyr mye fleksibilitet og funksjonalitet enn ad hoc-rapporteringsmulighetene til Pentaho-brukerkonsollen.
Design Studio
Det er en Eclipse-basert verktøy. Den lar deg håndredigere en rapport eller analyse. Det er mye brukt for å legge til endringer i en eksisterende rapport som ikke kan legges til med Report Designer.
Aggregasjonsdesigner
Dette grafiske verktøyet lar deg forbedre Mondrian-kubeeffektiviteten.
Metadata Editor
Det brukes til å legge til tilpasset metadatalag til enhver eksisterende datakilde.
Pentaho dataintegrasjon
Kettle extract, transform, and load (ETL)-verktøyet, som muliggjør
Pentaho Tool vs. BI stack
Pentaho verktøy | BI Stack |
---|---|
Dataintegrasjon (PDI) | ETL |
Den tilbyr metadata Editor | Det gir metadatabehandling |
Pentaho BA | Analytics |
Rapportdesigner | Operanasjonal rapportering |
Saiku | Ad hoc-rapportering |
CDE | Instrumentbord |
Pentaho brukerkonsoll (PUC) | Styring/Overvåking |
Fordeler med Pentaho
Nå i denne Pentaho dataintegreringsveiledningen vil vi lære om noen fordeler med Pentaho Business Intelligence Tool:
- Pentaho BI er et veldig intuitivt verktøy. Med noen grunnleggende konsepter kan du jobbe med det.
- Enkelt og brukervennlig Business Intelligence-verktøy
- Tilbyr et bredt spekter av BI-funksjoner som inkluderer rapportering, dashbord, interaktiv analyse, dataintegrasjon, datautvinning, etc.
- Kommer med et brukervennlig grensesnitt og gir ulike verktøy for å hente data fra flere datakilder
- Tilbyr enkelt pakke for å jobbe med data
- Har en fellesskapsutgave med mange bidragsytere sammen med Enterprise-utgaven.
- Muligheten til å kjøre på Hadoop-klyngen
- JavaSkriptkode skrevet i trinnkomponentene kan gjenbrukes i andre komponenter.
Ulemper med Pentaho
Her er ulemper/ulemper ved å bruke Pentaho BI-verktøyet:
- Utformingen av grensesnittet kan være svak, og det er ikke noe enhetlig grensesnitt for alle komponenter.
- Mye langsommere verktøyutvikling sammenlignet med andre BI-verktøy.
- Pentaho Business analytics tilbyr et begrenset antall komponenter.
- Dårlig støtte fra samfunnet. Så hvis du ikke får en fungerende komponent, må du vente til neste versjon er utgitt.
Sammendrag
- Pentaho er et Business Intelligence-verktøy som gir et bredt spekter av business intelligence løsninger til kundene
- Den tilbyr ETL-funksjoner for business intelligence-behov.
- Pentaho-suiter tilbyr komponenter som Rapport, Analyse, Dashboard og Data Mining
- Pentaho Business Intelligence er mye brukt av 1) forretningsanalytiker 2) programmerere av åpen kildekode 3) forskere og 4) studenter.
- Installasjonsprosessen til Pentaho inkluderer: 1) Krav til maskinvare 2) Programvarekrav, 3) Nedlasting av Bl-pakken, 4) Start av Bl-pakken og 5) Administrasjon av Bl-pakken
- Viktige komponenter i Pentaho administrasjonskonsoll er 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho er et Data Integration (PDI) verktøy mens BI stack er et ETL-verktøy.
- Den største fordelen med Pentaho er at det er enkelt og brukervennlig Business Intelligence-verktøy.
- Den største ulempen med Pentaho er at det er en mye langsommere verktøyutvikling sammenlignet med andre BI-verktøy