Tutorial sull'integrazione dei dati Pentaho: cos'è lo strumento ETL Pentaho
Cos'è Pentaho BI?
Pentaho è uno strumento di Business Intelligence che fornisce ai clienti un'ampia gamma di soluzioni di business intelligence. È in grado di eseguire reporting, analisi dei dati, integrazione dei dati, data mining, ecc. Pentaho offre anche un set completo di funzionalità BI che consente di migliorare le prestazioni e l'efficienza aziendale.
Caratteristiche di Pentaho
Di seguito sono riportate le caratteristiche importanti di Pentaho:
- Funzionalità ETL per esigenze di business intelligence
- Comprendere Pentaho Report Designer
- Competenza del prodotto
- Offre sottoreport affiancati
- Sblocco di nuove funzionalità
- Supporto professionale
- Interrogazione e reporting
- Offre funzionalità avanzate
- Supporto completo dei metadati di runtime dalle origini dati
Suite Pentaho BI
Ora impareremo a conoscere la suite Pentaho BI in questo tutorial di Pentaho:
Pentaho BI Suite include i seguenti componenti:
Segnalazione Pentaho
Pentaho Reporting dipende dal progetto JFreeReport. Ti aiuta a soddisfare le tue esigenze di reporting aziendale. Questo componente offre inoltre la pubblicazione di report pianificati e su richiesta nei formati più diffusi come XLS, PDF, TXT e HTML.
Analisi
Offre un'ampia gamma di analisi e una vasta gamma di funzionalità che include una visualizzazione tabella pivot. Lo strumento fornisce funzionalità GUI avanzate (utilizzando Flash o SVG), widget dashboard integrati, portale e integrazione del flusso di lavoro.
Inoltre, Pentaho Spreadsheet Services consente all'utente di sfogliare, ruotare e utilizzare il grafico da MS Excel.
Cruscotti
La dashboard offre reporting e analisi, che contribuiscono ai contenuti di Pentaho Dashboards. Il designer di dashboard self-service include numerosi modelli e layout di dashboard integrati. Consente agli utenti aziendali di creare dashboard personalizzati con poca formazione.
Data Mining
Strumento di estrazione dei dati scopre modelli nascosti e indicatori di prestazioni future. Offre il set più completo di algoritmi di apprendimento automatico del progetto Weka, che include clustering, alberi decisionali, foreste casuali, analisi dei componenti principali e reti neurali.
Consente di visualizzare i dati graficamente, interagire con essi a livello di codice o utilizzare più origini dati per report, ulteriori analisi e altri processi.
Integrazione dati Pentaho
Questo componente viene utilizzato per integrare i dati ovunque esistano.
Ampia libreria di trasformazioni con oltre 150 oggetti di mappatura pronti all'uso.
Supporta un'ampia gamma di origini dati che include più di 30 piattaforme di database proprietarie e open source e file flat. Aiuta anche Analisi dei Big Data con integrazione e gestione dei dati Hadoop.
Chi utilizza Pentaho BI?
Pentaho BI è uno strumento ampiamente utilizzato da molti professionisti del software come:
- Programmi software open source
- Analista aziendale e ricercatore
- Studenti universitari
- Assessore all'intelligence aziendale
Come installare Pentaho in AWS
Di seguito è riportata la procedura dettagliata su come installare Pentaho in AWS.
Passo 1) Fai clic su Continua per iscriverti
Vai su https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro e fare clic su Continua
Passo 2) Accetta i termini e le condizioni
Nella pagina successiva, Accetta il contratto di licenza
Passo 3) Fare clic su Continua alla configurazione
Procedere per la Configurazione
Passo 4) Fare clic su Continua per avviare
Mantieni le impostazioni predefinite e fai clic per avviare
Passo 5) Attendi 5 minuti, ad esempio, per l'avvio
Controlla le istruzioni per l'uso e attendi
Passo 6) Ottieni IP pubblico
Copia l'IP pubblico dell'istanza.
Passo 7) Utilizza l'IP pubblico per l'accesso
Incolla l'IP pubblico dell'istanza per accedere a Pentaho.
Prerequisito del Pentaho
- Requisiti hardware
- Requisiti software
- Download e installazione della suite BL
- Iniziando la suite Bl
- Amministrazione della suite Bl
Requisiti hardware
Il software Pentaho Bl Suite non ha limiti fissi su un computer o hardware di rete purché sia possibile soddisfare i requisiti software minimi. È facile installare questo strumento di business intelligence. Tuttavia, una serie consigliata di specifiche di sistema:
RAM | Minimo 2 GB |
Spazio su disco rigido | Minimo 1 GB |
Processore | EM64T o AMD64 dual-core |
Requisiti software
- Installazione di Sun JRE 5.0
- L'ambiente può essere a 32 o 64 bit
- Supporto Operasistemi di automazione: Linux, Solaris, Windows, Mac
- Una workstation dotata di un'interfaccia browser Web moderna come Chrome, Internet Explorer, Firefox
Per avviare Bl-server
- On Windows dall'inizio, fare clic sul pulsante sull'icona di avvio del server Bl.
- Sul sistema operativo Linux eseguire lo script start-pentaho su /biserver-ce/directory
Per avviare il server amministratore
- On Windows dal pulsante Start fare clic su Avvia server aziendale Bl.
- Per Linux: vai alla finestra di comando ed esegui lo script di avvio in /biserver-ce/administration-console/directory.
Per arrestare il server amministratore
- Per arrestare il server in Windows, fare clic sulle icone di arresto bi-server.
- Su Linux. Devi andare al terminale e andare alla directory installata ed eseguire stop.bat
Console di amministrazione Pentaho
Report Designer
È uno strumento avanzato per la creazione di report. Questo è uno strumento ideale per te se desideri creare un report completo sui dati. Questo strumento offre molta flessibilità e funzionalità rispetto alle capacità di reporting ad hoc della console utente Pentaho.
Studio di progettazione
È un Eclipsestrumento basato su. Ti consente di modificare manualmente un report o un'analisi. È ampiamente utilizzato per aggiungere modifiche a un report esistente che non è possibile aggiungere con Report Designer.
Progettista di aggregazione
Questo strumento grafico ti consente di migliorare l'efficienza del cubo Mondrian.
Editor di metadati
Viene utilizzato per aggiungere un livello di metadati personalizzato a qualsiasi origine dati esistente.
Integrazione dati Pentaho
Lo strumento Kettle di estrazione, trasformazione e caricamento (ETL), che consente
Strumento Pentaho e stack BI
Strumento Pentaho | Pila BI |
---|---|
Integrazione dei dati (PDI) | ETL |
Offre editor di metadati | Fornisce la gestione dei metadati |
Pentaho BA | Analisi |
Progettista di rapporti | OperaReporting nazionale |
Saiku | Reporting ad hoc |
CDE | Cruscotti |
Console utente Pentaho (PUC) | Governance/Monitoraggio |
Vantaggi di Pentaho
Ora in questo tutorial sull'integrazione dei dati di Pentaho, impareremo alcuni vantaggi dello strumento Pentaho Business Intelligence:
- Pentaho BI è uno strumento molto intuitivo. Con alcuni concetti di base, puoi lavorarci.
- Strumento di Business Intelligence semplice e facile da usare
- Offre un'ampia gamma di funzionalità BI che include reporting, dashboard, analisi interattiva, integrazione dei dati, data mining, ecc.
- Viene fornito con un'interfaccia intuitiva e fornisce vari strumenti per recuperare dati da più origini dati
- Offre un pacchetto unico per lavorare sui dati
- Ha un'edizione community con molti contributori insieme all'edizione Enterprise.
- La capacità di esecuzione sul cluster Hadoop
- JavaIl codice script scritto nei componenti step può essere riutilizzato in altri componenti.
Svantaggi del Pentaho
Ecco i contro/svantaggi dell'utilizzo dello strumento Pentaho BI:
- Il design dell'interfaccia può essere debole e non esiste un'interfaccia unificata per tutti i componenti.
- Evoluzione dello strumento molto più lenta rispetto ad altri strumenti di BI.
- Pentaho Business Analytics offre un numero limitato di componenti.
- Scarso supporto comunitario. Quindi, se non ottieni un componente funzionante, devi aspettare fino al rilascio della versione successiva.
Sommario
- Pentaho è uno strumento di Business Intelligence che fornisce un'ampia gamma di business intelligence soluzioni ai clienti
- Offre funzionalità ETL per esigenze di business intelligence.
- Le suite Pentaho offrono componenti come Report, Analisi, Dashboard e Data Mining
- Pentaho Business Intelligence è ampiamente utilizzato da 1) Analisti aziendali 2) Programmatori di software open source 3) Ricercatori e 4) Studenti universitari.
- Il processo di installazione di Pentaho include: 1) Requisiti hardware 2) Requisiti software, 3) Download della suite Bl, 4) Avvio della suite Bl e 5) Amministrazione della suite Bl
- Componenti importanti della console di amministrazione Pentaho sono 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho è uno strumento di integrazione dei dati (PDI) mentre lo stack BI è uno Strumento ETL.
- Il più grande vantaggio di Pentaho è che è uno strumento di Business Intelligence semplice e facile da usare.
- Lo svantaggio principale di Pentaho è che si tratta di un'evoluzione dello strumento molto più lenta rispetto ad altri strumenti di BI