Pentaho Data Integration Tutorial: Vad är Pentaho ETL Tool

Vad är Pentaho BI?

Pentaho är ett Business Intelligence-verktyg som tillhandahåller ett brett utbud av business intelligence-lösningar till kunderna. Den klarar av rapportering, dataanalys, dataintegrering, datautvinning, etc. Pentaho erbjuder också en omfattande uppsättning BI-funktioner som gör att du kan förbättra verksamhetens prestanda och effektivitet.

Funktioner hos Pentaho

Följande är viktiga egenskaper hos Pentaho:

  • ETL-funktioner för affärsinformationsbehov
  • Förstå Pentaho Report Designer
  • Produktexpertis
  • Erbjuder sida vid sida underrapporter
  • Låser upp nya funktioner
  • Professionellt stöd
  • Fråga och rapportering
  • Erbjuder förbättrad funktionalitet
  • Fullständigt stöd för runtime-metadata från datakällor

Pentaho BI-svit

Nu kommer vi att lära oss om Pentaho BI-sviten i denna Pentaho-handledning:

Pentaho BI Suite
Pentaho BI Suite

Pentaho BI Suite innehåller följande komponenter:

Pentaho-rapportering

Pentaho Reporting beror på JFreeReport-projektet. Det hjälper dig att uppfylla dina affärsrapporteringsbehov. Denna komponent erbjuder också både schemalagd och on-demand rapportpublicering i populära format som XLS, PDF, TXT och HTML.

Analys

Den erbjuder ett brett utbud av analyser och ett brett utbud av funktioner som inkluderar en pivottabellvy. Verktyget tillhandahåller förbättrade GUI-funktioner (med Flash eller SVG), integrerade instrumentpanelswidgets, portal och arbetsflödesintegration.

Dessutom tillåter Pentaho Spreadsheet Services en användare att bläddra, pivotera och använda diagram inifrån MS Excel.

Instrumentpaneler

Instrumentpanelen erbjuder rapportering och analys, som bidrar med innehåll till Pentaho Dashboards. Självbetjäningsinstrumentpanelsdesignern inkluderar omfattande inbyggda instrumentpanelsmallar och layout. Det tillåter företagsanvändare att bygga personliga instrumentpaneler med lite utbildning.

Data Mining

Datautvinningsverktyg upptäcker dolda mönster och indikatorer på framtida prestanda. Den erbjuder den mest omfattande uppsättningen av maskininlärningsalgoritmer från Weka-projektet, som inkluderar klustring, beslutsträd, slumpmässiga skogar, huvudkomponentanalys, neurala nätverk.

Den låter dig visa data grafiskt, interagera med den programmatiskt eller använda flera datakällor för rapporter, ytterligare analyser och andra processer.

Pentaho dataintegration

Denna komponent används för att integrera data varhelst den finns.

Riktigt transformationsbibliotek med över 150 färdiga mappningsobjekt.

Den stöder ett brett utbud av datakällor som inkluderar mer än 30 öppen källkod och egenutvecklade databasplattformar, platta filer. Det hjälper också Big Data-analys med integration och hantering av Hadoop-data.

Vilka använder Pentaho BI?

Pentaho BI är ett flitigt använt verktyg av många mjukvaruproffs som:

  • Program med öppen källkod
  • Affärsanalytiker och forskare
  • College studenter
  • Business intelligence rådman

Hur man installerar Pentaho i AWS

Följande är en steg-för-steg-process om hur man installerar Pentaho i AWS.

Steg 1) Klicka på Fortsätt för att prenumerera
Gå till https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro och klicka på Fortsätt

Installera Pentaho i AWS

Steg 2) Acceptera villkoren
På nästa sida, Acceptera licensavtalet

Installera Pentaho i AWS

Steg 3) Klicka på Fortsätt till konfiguration
Fortsätt för konfiguration

Installera Pentaho i AWS

Steg 4) Klicka på Fortsätt för att starta
Behåll standardinställningarna och klicka för att starta

Installera Pentaho i AWS

Steg 5) Vänta i 5 minuter för att till exempel starta
Kontrollera bruksanvisningen och vänta

Installera Pentaho i AWS

Steg 6) Skaffa offentlig IP
Kopiera instansens offentliga IP-adress.

Installera Pentaho i AWS

Steg 7) Använd den offentliga IP-adressen för inloggning
Klistra in instansens offentliga IP för att komma åt Pentaho.

Installera Pentaho i AWS

Förutsättning för Pentaho

  • hårdvaru~~POS=TRUNC krav~~POS=HEADCOMP
  • Krav på programvara
  • Laddar ner och installerar Bl suite
  • Startar Bl-sviten
  • Administration av Bl-sviten

Hårdvarukrav

Pentaho Bl Suite-mjukvaran har inga fixgränser på en dator eller nätverkshårdvara så länge du kan uppfylla minimikraven för mjukvara. Det är enkelt att installera detta Business Intelligence-verktyg. En rekommenderad uppsättning systemspecifikationer:

RAM Minst 2GB
Hårddiskutrymme Minst 1GB
Processorn Dual-core EM64T eller AMD64

Krav på programvara

  • Installation av Sun JRE 5.0
  • Miljön kan vara antingen 32-bitars eller 64-bitars
  • Som stöds Operatingssystem: Linux, Solaris, Windows, Mac
  • En arbetsstation som har ett modernt webbläsargränssnitt som Chrome, Internet Explorer, Firefox

För att starta Bl-server

  • On Windows från början, klicka på knappen Start Bl server-ikonen.
  • På Linux OS kör start-pentaho-skriptet på /biserver-ce/directory

För att starta administratörsservern

  • On Windows från startknappen klicka på start Bl enterprise server.
  • För Linux: gå till kommandofönstret och kör startskriptet i /biserver-ce/administration-console/directory.

För att stoppa administratörsservern

  • För att stoppa servern i Windows, klicka på stop bi-server-ikoner.
  • På Linux. Du måste gå till terminalen och gå till den installerade katalogen och köra stop.bat

Pentahos administrationskonsol

Rapportdesigner

Det är ett avancerat verktyg för att skapa rapporter. Detta är ett idealiskt verktyg för dig om du vill bygga en komplett datadrivningsrapport. Det här verktyget erbjuder mycket flexibilitet och funktionalitet än ad hoc-rapporteringsmöjligheterna i Pentahos användarkonsol.

Design Studio

Det är en Eclipse-baserat verktyg. Det låter dig redigera en rapport eller analys för hand. Det används ofta för att lägga till ändringar i en befintlig rapport som inte kan läggas till med Report Designer.

Aggregationsdesigner

Detta grafiska verktyg låter dig förbättra Mondrian-kubens effektivitet.

Metadata Editor

Det används för att lägga till anpassat metadatalager till alla befintliga datakällor.

Pentaho dataintegration

Verktyget Kettle extrahera, transformera och ladda (ETL) som möjliggör

Pentaho Tool vs. BI stack

Pentaho verktyg BI Stack
Dataintegration (PDI) ETL
Den erbjuder metadata Editor Det ger metadatahantering
Pentaho BA Analytics
Rapportdesigner Operationell rapportering
Saiku Ad hoc-rapportering
CDE Instrumentpaneler
Pentaho User Console (PUC) Styrning/övervakning

Fördelar med Pentaho

Nu i denna Pentahos handledning för dataintegration kommer vi att lära oss om några fördelar med Pentaho Business Intelligence Tool:

  • Pentaho BI är ett mycket intuitivt verktyg. Med några grundläggande koncept kan du arbeta med det.
  • Enkelt och lättanvänt Business Intelligence-verktyg
  • Erbjuder ett brett utbud av BI-funktioner som inkluderar rapportering, instrumentpanel, interaktiv analys, dataintegration, datautvinning, etc.
  • Kommer med ett användarvänligt gränssnitt och tillhandahåller olika verktyg för att hämta data från flera datakällor
  • Erbjuder ett enda paket för att arbeta med Data
  • Har en community-utgåva med många bidragsgivare tillsammans med Enterprise-utgåvan.
  • Möjligheten att köra på Hadoop-klustret
  • JavaSkriptkod skriven i stegkomponenterna kan återanvändas i andra komponenter.

Nackdelar med Pentaho

Här är nackdelar/nackdelar med att använda Pentaho BI-verktyget:

  • Utformningen av gränssnittet kan vara svag, och det finns inget enhetligt gränssnitt för alla komponenter.
  • Mycket långsammare verktygsutveckling jämfört med andra BI-verktyg.
  • Pentaho Business analytics erbjuder ett begränsat antal komponenter.
  • Dåligt stöd från samhället. Så om du inte får en fungerande komponent måste du vänta tills nästa version släpps.

Sammanfattning

  • Pentaho är ett Business Intelligence-verktyg som tillhandahåller ett brett utbud av business intelligence lösningar till kunderna
  • Den erbjuder ETL-funktioner för business intelligence-behov.
  • Pentaho-sviterna erbjuder komponenter som Rapport, Analys, Dashboard och Data Mining
  • Pentaho Business Intelligence används i stor utsträckning av 1) affärsanalytiker 2) programmerare med öppen källkod 3) forskare och 4) högskolestudenter.
  • Installationsprocessen för Pentaho inkluderar: 1) Maskinvarukrav 2) Programvarukrav, 3) Ladda ner Bl-sviten, 4) Starta Bl-sviten och 5) Administration av Bl-sviten
  • Viktiga komponenter i Pentahos administrationskonsol är 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
  • Pentaho är ett dataintegrationsverktyg (PDI) medan BI-stack är ett ETL-verktyg.
  • Den största fördelen med Pentaho är att det är enkelt och lättanvänt Business Intelligence-verktyg.
  • Den största nackdelen med Pentaho är att det är en mycket långsammare verktygsutveckling jämfört med andra BI-verktyg