Pentaho Data Integration Tutorial: Vad är Pentaho ETL Tool
Vad är Pentaho BI?
Pentaho är ett Business Intelligence-verktyg som tillhandahåller ett brett utbud av business intelligence-lösningar till kunderna. Den klarar av rapportering, dataanalys, dataintegrering, datautvinning, etc. Pentaho erbjuder också en omfattande uppsättning BI-funktioner som gör att du kan förbättra verksamhetens prestanda och effektivitet.
Funktioner hos Pentaho
Följande är viktiga egenskaper hos Pentaho:
- ETL-funktioner för affärsinformationsbehov
- Förstå Pentaho Report Designer
- Produktexpertis
- Erbjuder sida vid sida underrapporter
- Låser upp nya funktioner
- Professionellt stöd
- Fråga och rapportering
- Erbjuder förbättrad funktionalitet
- Fullständigt stöd för runtime-metadata från datakällor
Pentaho BI-svit
Nu kommer vi att lära oss om Pentaho BI-sviten i denna Pentaho-handledning:
Pentaho BI Suite innehåller följande komponenter:
Pentaho-rapportering
Pentaho Reporting beror på JFreeReport-projektet. Det hjälper dig att uppfylla dina affärsrapporteringsbehov. Denna komponent erbjuder också både schemalagd och on-demand rapportpublicering i populära format som XLS, PDF, TXT och HTML.
Analys
Den erbjuder ett brett utbud av analyser och ett brett utbud av funktioner som inkluderar en pivottabellvy. Verktyget tillhandahåller förbättrade GUI-funktioner (med Flash eller SVG), integrerade instrumentpanelswidgets, portal och arbetsflödesintegration.
Dessutom tillåter Pentaho Spreadsheet Services en användare att bläddra, pivotera och använda diagram inifrån MS Excel.
Instrumentpaneler
Instrumentpanelen erbjuder rapportering och analys, som bidrar med innehåll till Pentaho Dashboards. Självbetjäningsinstrumentpanelsdesignern inkluderar omfattande inbyggda instrumentpanelsmallar och layout. Det tillåter företagsanvändare att bygga personliga instrumentpaneler med lite utbildning.
Data Mining
Datautvinningsverktyg upptäcker dolda mönster och indikatorer på framtida prestanda. Den erbjuder den mest omfattande uppsättningen av maskininlärningsalgoritmer från Weka-projektet, som inkluderar klustring, beslutsträd, slumpmässiga skogar, huvudkomponentanalys, neurala nätverk.
Den låter dig visa data grafiskt, interagera med den programmatiskt eller använda flera datakällor för rapporter, ytterligare analyser och andra processer.
Pentaho dataintegration
Denna komponent används för att integrera data varhelst den finns.
Riktigt transformationsbibliotek med över 150 färdiga mappningsobjekt.
Den stöder ett brett utbud av datakällor som inkluderar mer än 30 öppen källkod och egenutvecklade databasplattformar, platta filer. Det hjälper också Big Data-analys med integration och hantering av Hadoop-data.
Vilka använder Pentaho BI?
Pentaho BI är ett flitigt använt verktyg av många mjukvaruproffs som:
- Program med öppen källkod
- Affärsanalytiker och forskare
- College studenter
- Business intelligence rådman
Hur man installerar Pentaho i AWS
Följande är en steg-för-steg-process om hur man installerar Pentaho i AWS.
Steg 1) Klicka på Fortsätt för att prenumerera
Gå till https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro och klicka på Fortsätt
Steg 2) Acceptera villkoren
På nästa sida, Acceptera licensavtalet
Steg 3) Klicka på Fortsätt till konfiguration
Fortsätt för konfiguration
Steg 4) Klicka på Fortsätt för att starta
Behåll standardinställningarna och klicka för att starta
Steg 5) Vänta i 5 minuter för att till exempel starta
Kontrollera bruksanvisningen och vänta
Steg 6) Skaffa offentlig IP
Kopiera instansens offentliga IP-adress.
Steg 7) Använd den offentliga IP-adressen för inloggning
Klistra in instansens offentliga IP för att komma åt Pentaho.
Förutsättning för Pentaho
- hårdvaru~~POS=TRUNC krav~~POS=HEADCOMP
- Krav på programvara
- Laddar ner och installerar Bl suite
- Startar Bl-sviten
- Administration av Bl-sviten
Hårdvarukrav
Pentaho Bl Suite-mjukvaran har inga fixgränser på en dator eller nätverkshårdvara så länge du kan uppfylla minimikraven för mjukvara. Det är enkelt att installera detta Business Intelligence-verktyg. En rekommenderad uppsättning systemspecifikationer:
RAM | Minst 2GB |
Hårddiskutrymme | Minst 1GB |
Processorn | Dual-core EM64T eller AMD64 |
Krav på programvara
- Installation av Sun JRE 5.0
- Miljön kan vara antingen 32-bitars eller 64-bitars
- Som stöds Operatingssystem: Linux, Solaris, Windows, Mac
- En arbetsstation som har ett modernt webbläsargränssnitt som Chrome, Internet Explorer, Firefox
För att starta Bl-server
- On Windows från början, klicka på knappen Start Bl server-ikonen.
- På Linux OS kör start-pentaho-skriptet på /biserver-ce/directory
För att starta administratörsservern
- On Windows från startknappen klicka på start Bl enterprise server.
- För Linux: gå till kommandofönstret och kör startskriptet i /biserver-ce/administration-console/directory.
För att stoppa administratörsservern
- För att stoppa servern i Windows, klicka på stop bi-server-ikoner.
- På Linux. Du måste gå till terminalen och gå till den installerade katalogen och köra stop.bat
Pentahos administrationskonsol
Rapportdesigner
Det är ett avancerat verktyg för att skapa rapporter. Detta är ett idealiskt verktyg för dig om du vill bygga en komplett datadrivningsrapport. Det här verktyget erbjuder mycket flexibilitet och funktionalitet än ad hoc-rapporteringsmöjligheterna i Pentahos användarkonsol.
Design Studio
Det är en Eclipse-baserat verktyg. Det låter dig redigera en rapport eller analys för hand. Det används ofta för att lägga till ändringar i en befintlig rapport som inte kan läggas till med Report Designer.
Aggregationsdesigner
Detta grafiska verktyg låter dig förbättra Mondrian-kubens effektivitet.
Metadata Editor
Det används för att lägga till anpassat metadatalager till alla befintliga datakällor.
Pentaho dataintegration
Verktyget Kettle extrahera, transformera och ladda (ETL) som möjliggör
Pentaho Tool vs. BI stack
Pentaho verktyg | BI Stack |
---|---|
Dataintegration (PDI) | ETL |
Den erbjuder metadata Editor | Det ger metadatahantering |
Pentaho BA | Analytics |
Rapportdesigner | Operationell rapportering |
Saiku | Ad hoc-rapportering |
CDE | Instrumentpaneler |
Pentaho User Console (PUC) | Styrning/övervakning |
Fördelar med Pentaho
Nu i denna Pentahos handledning för dataintegration kommer vi att lära oss om några fördelar med Pentaho Business Intelligence Tool:
- Pentaho BI är ett mycket intuitivt verktyg. Med några grundläggande koncept kan du arbeta med det.
- Enkelt och lättanvänt Business Intelligence-verktyg
- Erbjuder ett brett utbud av BI-funktioner som inkluderar rapportering, instrumentpanel, interaktiv analys, dataintegration, datautvinning, etc.
- Kommer med ett användarvänligt gränssnitt och tillhandahåller olika verktyg för att hämta data från flera datakällor
- Erbjuder ett enda paket för att arbeta med Data
- Har en community-utgåva med många bidragsgivare tillsammans med Enterprise-utgåvan.
- Möjligheten att köra på Hadoop-klustret
- JavaSkriptkod skriven i stegkomponenterna kan återanvändas i andra komponenter.
Nackdelar med Pentaho
Här är nackdelar/nackdelar med att använda Pentaho BI-verktyget:
- Utformningen av gränssnittet kan vara svag, och det finns inget enhetligt gränssnitt för alla komponenter.
- Mycket långsammare verktygsutveckling jämfört med andra BI-verktyg.
- Pentaho Business analytics erbjuder ett begränsat antal komponenter.
- Dåligt stöd från samhället. Så om du inte får en fungerande komponent måste du vänta tills nästa version släpps.
Sammanfattning
- Pentaho är ett Business Intelligence-verktyg som tillhandahåller ett brett utbud av business intelligence lösningar till kunderna
- Den erbjuder ETL-funktioner för business intelligence-behov.
- Pentaho-sviterna erbjuder komponenter som Rapport, Analys, Dashboard och Data Mining
- Pentaho Business Intelligence används i stor utsträckning av 1) affärsanalytiker 2) programmerare med öppen källkod 3) forskare och 4) högskolestudenter.
- Installationsprocessen för Pentaho inkluderar: 1) Maskinvarukrav 2) Programvarukrav, 3) Ladda ner Bl-sviten, 4) Starta Bl-sviten och 5) Administration av Bl-sviten
- Viktiga komponenter i Pentahos administrationskonsol är 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho är ett dataintegrationsverktyg (PDI) medan BI-stack är ett ETL-verktyg.
- Den största fördelen med Pentaho är att det är enkelt och lättanvänt Business Intelligence-verktyg.
- Den största nackdelen med Pentaho är att det är en mycket långsammare verktygsutveckling jämfört med andra BI-verktyg