Pentaho Data Integration Tutorial

Hvad er Pentaho BI?

Pentaho er et Business Intelligence-vรฆrktรธj, som leverer en bred vifte af business intelligence-lรธsninger til kunderne. Den er i stand til rapportering, dataanalyse, dataintegration, datamining osv. Pentaho tilbyder ogsรฅ et omfattende sรฆt BI-funktioner, som giver dig mulighed for at forbedre virksomhedens ydeevne og effektivitet.

Funktioner af Pentaho

Fรธlgende er vigtige funktioner i Pentaho:

  • ETL-funktioner til business intelligence-behov
  • Forstรฅelse af Pentaho Report Designer
  • Produktekspertise
  • Tilbyder side-by-side underrapporter
  • Lรฅser op for nye muligheder
  • Professionel support
  • Forespรธrgsel og rapportering
  • Tilbyder forbedret funktionalitet
  • Fuld runtime-metadataunderstรธttelse fra datakilder

Pentaho BI suite

Nu vil vi lรฆre om Pentaho BI-pakken i denne Pentaho-tutorial:

Pentaho BI Suite
Pentaho BI Suite

Pentaho BI Suite indeholder fรธlgende komponenter:

Pentaho-rapportering

Pentaho-rapportering afhรฆnger af JFreeReport-projektet. Det hjรฆlper dig med at opfylde dine virksomhedsrapporteringsbehov. Denne komponent tilbyder ogsรฅ bรฅde planlagt og on-demand rapportudgivelse i populรฆre formater som XLS, PDF, TXT og HTML.

Analyse

Det tilbyder en bred vifte af analyser en bred vifte af funktioner, der inkluderer en pivottabelvisning. Vรฆrktรธjet giver forbedrede GUI-funktioner (ved hjรฆlp af Flash eller SVG), integrerede dashboard-widgets, portal og workflow-integration.

Desuden giver Pentaho Spreadsheet Services en bruger mulighed for at gennemse, pivotere og bruge diagrammet fra MS Excel.

Dashboards

Dashboardet tilbyder rapportering og analyse, som bidrager med indhold til Pentaho Dashboards. Selvbetjeningsdashboarddesigneren inkluderer omfattende indbyggede dashboardskabeloner og layout. Det giver forretningsbrugere mulighed for at bygge personlige dashboards med lidt trรฆning.

Data Mining

Data mining vรฆrktรธj opdager skjulte mรธnstre og indikatorer for fremtidig ydeevne. Det tilbyder det mest omfattende sรฆt af maskinlรฆringsalgoritmer fra Weka-projektet, som inkluderer klyngedannelse, beslutningstrรฆer, tilfรฆldige skove, hovedkomponentanalyse, neurale netvรฆrk.

Det giver dig mulighed for at se data grafisk, interagere med dem programmatisk eller bruge flere datakilder til rapporter, yderligere analyser og andre processer.

Pentaho dataintegration

Denne komponent bruges til at integrere data, uanset hvor de findes.

Rigt transformationsbibliotek med over 150 direkte kortlรฆgningsobjekter.

Det understรธtter en bred vifte af datakilder, som omfatter mere end 30 open source og proprietรฆre databaseplatforme, flade filer. Det hjรฆlper ogsรฅ Big Data-analyse med integration og styring af Hadoop data.

Hvem bruger Pentaho BI?

Pentaho BI er et udbredt vรฆrktรธj af mange software-professionelle som:

  • Open source-softwareprogrammer
  • Forretningsanalytiker og forsker
  • Kollegium studerende
  • Rรฅdmand for Business Intelligence

Sรฅdan installeres Pentaho i AWS

Fรธlgende er en trin for trin proces om, hvordan man installerer Pentaho i AWS.

Trin 1) Klik pรฅ Fortsรฆt for at abonnere
Gรฅ til https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro og klik pรฅ Fortsรฆt

Installer Pentaho i AWS

Trin 2) Accepter vilkรฅr og betingelser
Accepter licensaftalen pรฅ nรฆste side

Installer Pentaho i AWS

Trin 3) Klik pรฅ Fortsรฆt til konfiguration
Fortsรฆt til konfiguration

Installer Pentaho i AWS

Trin 4) Klik pรฅ Fortsรฆt for at starte
Behold indstillingerne som standard, og klik for at starte

Installer Pentaho i AWS

Trin 5) Vent f.eks. 5 minutter for at starte
Tjek brugsanvisningen og vent

Installer Pentaho i AWS

Trin 6) Fรฅ offentlig IP
Kopiรฉr instansens offentlige IP-adresse.

Installer Pentaho i AWS

Trin 7) Brug den offentlige IP til login
Indsรฆt instansens offentlige IP for at fรฅ adgang til Pentaho.

Installer Pentaho i AWS

Forudsรฆtning for Pentaho

  • Hardwarekrav
  • Softwarekrav
  • Downloader og installerer Bl suite
  • Starter Bl suiten
  • Administration af Bl suiten

Hardwarekrav

Pentaho Bl Suite-softwaren har ingen fixgrรฆnser pรฅ en computer eller netvรฆrkshardware, sรฅ lรฆnge du kan opfylde minimumssoftwarekravene. Det er nemt at installere dette Business Intelligence-vรฆrktรธj. Et anbefalet sรฆt systemspecifikationer:

RAM Minimum 2 GB
Plads pรฅ harddisken Minimum 1 GB
Processor Dual-core EM64T eller AMD64

Softwarekrav

  • Installation af Sun JRE 5.0
  • Miljรธet kan vรฆre enten 32-bit eller 64-bit
  • Understรธttet Operating systemer: Linux, Solaris, Windows, Mac
  • En arbejdsstation, der har en moderne webbrowsergrรฆnseflade som Chrome, Internet Explorer, Firefox

For at starte Bl-server

  • On Windows fra starten, knap klik pรฅ start Bl server-ikonet.
  • Pรฅ Linux OS kรธr start-pentaho script pรฅ /biserver-ce/directory

For at starte administratorserveren

  • On Windows fra startknappen klik pรฅ start Bl enterprise server.
  • For Linux: Gรฅ til kommandovinduet og kรธr opstartsscriptet i /biserver-ce/administration-console/directory.

For at stoppe administratorserver

  • For at stoppe serveren i Windows skal du klikke pรฅ stop bi-server-ikoner.
  • Pรฅ Linux. Du skal gรฅ til terminalen og gรฅ til den installerede mappe og kรธre stop.bat

Pentaho administrationskonsol

Rapportdesigner

Det er et avanceret vรฆrktรธj til oprettelse af rapporter. Dette er et ideelt vรฆrktรธj til dig, hvis du รธnsker at bygge en komplet datadrev-rapport. Dette vรฆrktรธj tilbyder masser af fleksibilitet og funktionalitet end ad hoc-rapporteringsfunktionerne i Pentaho-brugerkonsollen.

Design Studio

Det er en Eclipse-baseret vรฆrktรธj. Det giver dig mulighed for at hรฅndredigere en rapport eller analyse. Det er meget brugt til at tilfรธje รฆndringer til en eksisterende rapport, som ikke kan tilfรธjes med Report Designer.

Aggregationsdesigner

Dette grafiske vรฆrktรธj giver dig mulighed for at forbedre Mondrian-terningens effektivitet.

Metadata Editor

Det bruges til at tilfรธje tilpasset metadatalag til enhver eksisterende datakilde.

Pentaho dataintegration

Kettle extract, transform and load (ETL) vรฆrktรธjet, som muliggรธr

Pentaho Tool vs. BI stak

Pentaho vรฆrktรธj BI stak
Dataintegration (PDI) ETL
Det tilbyder metadata Editor Det giver metadatastyring
Pentaho BA Analyse
Rapportdesigner Operational rapportering
Saiku Ad hoc rapportering
CDE Dashboards
Pentaho brugerkonsol (PUC) Governance/Overvรฅgning

Fordele ved Pentaho

Nu i denne Pentaho dataintegration tutorial, vil vi lรฆre om nogle fordele ved Pentaho Business Intelligence Tool:

  • Pentaho BI er et meget intuitivt vรฆrktรธj. Med nogle grundlรฆggende koncepter kan du arbejde med det.
  • Enkelt og brugervenligt Business Intelligence-vรฆrktรธj
  • Tilbyder en bred vifte af BI-funktioner, som inkluderer rapportering, dashboard, interaktiv analyse, dataintegration, datamining osv.
  • Leveres med en brugervenlig grรฆnseflade og giver forskellige vรฆrktรธjer til at hente data fra flere datakilder
  • Tilbyder enkelt pakke til at arbejde pรฅ Data
  • Har en community-udgave med mange bidragydere sammen med Enterprise-udgaven.
  • Evnen til at kรธre pรฅ Hadoop-klyngen
  • JavaScriptkode skrevet i trinkomponenterne kan genbruges i andre komponenter.

Ulemper ved Pentaho

Her er ulemper/ulemper ved at bruge Pentaho BI-vรฆrktรธj:

  • Designet af grรฆnsefladen kan vรฆre svagt, og der er ingen samlet grรฆnseflade for alle komponenter.
  • Meget langsommere vรฆrktรธjsudvikling sammenlignet med andre BI-vรฆrktรธjer.
  • Pentaho Business analytics tilbyder et begrรฆnset antal komponenter.
  • Dรฅrlig stรธtte fra lokalsamfundet. Sรฅ hvis du ikke fรฅr en fungerende komponent, skal du vente til den nรฆste version er udgivet.

Resumรฉ

  • Pentaho er et Business Intelligence-vรฆrktรธj, som giver en bred vifte af business intelligence lรธsninger til kunderne
  • Det tilbyder ETL-funktioner til business intelligence-behov.
  • Pentaho-suiter tilbyder komponenter som Rapport, Analyse, Dashboard og Data Mining
  • Pentaho Business Intelligence er meget udbredt af 1) Business analytiker 2) Open source software programmรธrer 3) Forsker og 4) Universitetsstuderende.
  • Installationsprocessen for Pentaho inkluderer: 1) Hardwarekrav 2) Softwarekrav, 3) Download af Bl-pakken, 4) Start af Bl-pakken og 5) Administration af Bl-pakken
  • Vigtige komponenter i Pentahos administrationskonsol er 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
  • Pentaho er et Data Integration (PDI) vรฆrktรธj, mens BI stack er et ETL vรฆrktรธj.
  • Den stรธrste fordel ved Pentaho er, at det er enkelt og nemt at bruge Business Intelligence-vรฆrktรธj.
  • Den stรธrste ulempe ved Pentaho er, at det er en meget langsommere vรฆrktรธjsudvikling sammenlignet med andre BI-vรฆrktรธjer

Opsummer dette indlรฆg med: