Tutorial de integrare a datelor Pentaho
Ce este Pentaho BI?
Pentaho este un instrument de Business Intelligence care oferă clienților o gamă largă de soluții de business intelligence. Este capabil să raporteze, să analizeze datele, să integreze datele, să extragă datele etc. Pentaho oferă, de asemenea, un set cuprinzător de caracteristici BI care vă permite să îmbunătățiți performanța și eficiența afacerii.
Caracteristicile Pentaho
Următoarele sunt caracteristicile importante ale Pentaho:
- Capabilități ETL pentru nevoile de business intelligence
- Înțelegerea Pentaho Report Designer
- Expertiza de produs
- Oferă subrapoarte alăturate
- Deblocarea de noi capabilități
- Suport profesional
- Interogare și raportare
- Oferă funcționalitate îmbunătățită
- Suport complet pentru metadate din surse de date
Suita Pentaho BI
Acum, vom afla despre suita Pentaho BI în acest tutorial Pentaho:
Pentaho BI Suite include următoarele componente:
Raportare Pentaho
Pentaho Reporting depinde de proiectul JFreeReport. Vă ajută să vă îndepliniți nevoile de raportare a afacerii. Această componentă oferă, de asemenea, atât publicarea de rapoarte programată, cât și la cerere în formate populare, cum ar fi XLS, PDF, TXT și HTML.
Analiză
Oferă o gamă largă de analize, o gamă largă de caracteristici care include o vizualizare tabel pivot. Instrumentul oferă funcții GUI îmbunătățite (folosind Flash sau SVG), widget-uri integrate pentru tabloul de bord, portal și integrarea fluxului de lucru.
Mai mult, Pentaho Spreadsheet Services permite unui utilizator să răsfoiască, să pivoteze și să utilizeze diagrame din MS Excel.
Tablourile de bord
Tabloul de bord oferă Raportare și analiză, care contribuie cu conținut la tablourile de bord Pentaho. Designerul de tablouri de bord cu autoservire include șabloane și aspect extinse de tablouri de bord încorporate. Permite utilizatorilor de afaceri să construiască tablouri de bord personalizate cu puțină pregătire.
Data Mining
Instrument de extragere a datelor descoperă modele ascunse și indicatori ai performanței viitoare. Oferă cel mai cuprinzător set de algoritmi de învățare automată din proiectul Weka, care include clustering, arbori de decizie, păduri aleatorii, analiza componentelor principale, rețele neuronale.
Vă permite să vizualizați datele grafic, să interacționați cu ele în mod programatic sau să utilizați mai multe surse de date pentru rapoarte, analize ulterioare și alte procese.
Integrarea datelor Pentaho
Această componentă este utilizată pentru a integra date oriunde există.
Bibliotecă bogată de transformare cu peste 150 de obiecte de mapare gata de fabricație.
Acceptă o gamă largă de surse de date, care include peste 30 de platforme de baze de date open source și proprietare, fișiere plate. De asemenea, ajută Analize Big Data cu integrarea și gestionarea datelor Hadoop.
Cine folosește Pentaho BI?
Pentaho BI este un instrument utilizat pe scară largă de către mai mulți profesioniști în software precum:
- Programe software open source
- Analist de afaceri și cercetător
- Studenti de colegiu
- Consilier Business Intelligence
Cum se instalează Pentaho în AWS
Mai jos este un proces pas cu pas despre Cum să instalați Pentaho în AWS.
Pas 1) Faceți clic pe Continuați pentru a vă abona
Accesează https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro și faceți clic pe Continuare
Pas 2) Acceptați Termenii și Condițiile
În pagina următoare, Acceptați acordul de licență
Pas 3) Faceți clic pe Continuați la configurare
Continuați pentru configurare
Pas 4) Faceți clic pe Continuați pentru a lansa
Păstrați setările implicite și Faceți clic pentru a lansa
Pas 5) Așteptați, de exemplu, 5 minute pentru a lansa
Verificați instrucțiunile de utilizare și așteptați
Pas 6) Obțineți IP public
Copiați IP-ul public al instanței.
Pas 7) Utilizați IP-ul public pentru autentificare
Lipiți IP-ul public al instanței pentru a accesa Pentaho.
Condiție preliminară pentru Pentaho
- cerinţe hardware
- Cerințe software
- Descărcarea și instalarea Bl suite
- Începând suita Bl
- Administrarea suitei Bl
Cerințe hardware
Software-ul Pentaho Bl Suite nu are limite fixe pentru un computer sau hardware de rețea, atâta timp cât puteți îndeplini cerințele minime de software. Este ușor să instalați acest instrument de Business intelligence. Cu toate acestea, un set recomandat de specificații de sistem:
RAM | Minim 2 GB |
Spațiu pe hard disk | Minim 1 GB |
procesor | Dual-core EM64T sau AMD64 |
Cerințe software
- Instalarea Sun JRE 5.0
- Mediul poate fi pe 32 de biți sau pe 64 de biți
- Suportat Operasisteme de operare: Linux, Solaris, Windows, Mac
- O stație de lucru care are o interfață modernă de browser web, cum ar fi Chrome, Internet Explorer, Firefox
Pentru a porni Bl-server
- On Windows de la început, faceți clic pe butonul Start Bl server pictograma.
- Pe sistemul de operare Linux, rulați scriptul start-pentaho pe /biserver-ce/directory
Pentru a porni serverul de administrator
- On Windows de la butonul Start faceți clic pe Start Bl enterprise server.
- Pentru Linux: accesați fereastra de comandă și rulați scriptul de pornire în /biserver-ce/administration-console/directory.
Pentru a opri serverul administrator
- Pentru a opri serverul în Windows, faceți clic pe pictogramele de oprire bi-server.
- Pe Linux. Trebuie să mergeți la terminal și să mergeți la directorul instalat și să rulați stop.bat
Consola de administrare Pentaho
Proiectant de rapoarte
Este un instrument avansat de creare a rapoartelor. Acesta este un instrument ideal pentru dvs. dacă doriți să construiți un raport complet de unitate de date. Acest instrument oferă multă flexibilitate și funcționalitate decât capacitățile de raportare ad-hoc ale Consolei de utilizator Pentaho.
Studio de design
Este un Eclipseinstrument bazat pe -. Vă permite să editați manual un raport sau o analiză. Este utilizat pe scară largă pentru a adăuga modificări la un raport existent care nu pot fi adăugate cu Report Designer.
Designer de agregare
Acest instrument grafic vă permite să îmbunătățiți eficiența cubului Mondrian.
Editor de metadate
Este folosit pentru a adăuga un strat de metadate personalizat la orice sursă de date existentă.
Integrarea datelor Pentaho
Instrumentul de extragere, transformare și încărcare Kettle (ETL), care permite
Instrumentul Pentaho vs. stiva BI
Instrumentul Pentaho | BI Stack |
---|---|
Integrarea datelor (PDI) | ETL |
Oferă Editor de metadate | Oferă gestionarea metadatelor |
Pentaho BA | Google Analytics |
Designer de rapoarte | OperaRaportare națională |
Saiku | Raportare ad-hoc |
CDE | Tablourile de bord |
Consola de utilizator Pentaho (PUC) | Guvernare/Monitorizare |
Avantajele Pentaho
Acum, în acest tutorial de integrare a datelor Pentaho, vom afla despre câteva avantaje ale instrumentului Pentaho Business Intelligence:
- Pentaho BI este un instrument foarte intuitiv. Cu câteva concepte de bază, puteți lucra cu el.
- Instrument de Business Intelligence simplu și ușor de utilizat
- Oferă o gamă largă de capabilități BI, care includ raportare, tablou de bord, analiză interactivă, integrare a datelor, extragere de date etc.
- Vine cu o interfață ușor de utilizat și oferă diverse instrumente pentru a prelua date din mai multe surse de date
- Oferă un singur pachet pentru a lucra pe date
- Are o ediție comunitară cu o mulțime de colaboratori împreună cu ediția Enterprise.
- Capacitatea de a rula pe clusterul Hadoop
- JavaCodul de script scris în componentele pasului poate fi reutilizat în alte componente.
Dezavantajele Pentaho
Iată dezavantajele/dezavantajele utilizării instrumentului Pentaho BI:
- Designul interfeței poate fi slab și nu există o interfață unificată pentru toate componentele.
- Evoluție mult mai lentă a instrumentelor în comparație cu alte instrumente BI.
- Pentaho Business analytics oferă un număr limitat de componente.
- Sprijinul comunitar slab. Deci, dacă nu obțineți o componentă funcțională, trebuie să așteptați până când următoarea versiune este lansată.
Rezumat
- Pentaho este un instrument de Business Intelligence care oferă o gamă largă de business intelligence solutii pentru clienti
- Oferă capabilități ETL pentru nevoile de business intelligence.
- Suitele Pentaho oferă componente precum raport, analiză, tablou de bord și data mining
- Pentaho Business Intelligence este utilizat pe scară largă de către 1) analist de afaceri 2) programatori de software open source 3) cercetător și 4) studenți.
- Procesul de instalare a Pentaho include: 1) Cerințe hardware 2) Cerințe software, 3) Descărcare Bl suite, 4) Pornire Bl suite și 5) Administrare Bl Suite
- Componentele importante ale consolei de administrare Pentaho sunt 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadate Editor 5) Pentaho Data Integration
- Pentaho este un instrument de integrare a datelor (PDI), în timp ce stiva BI este un instrument Instrumentul ETL.
- Cel mai mare avantaj al Pentaho este că este un instrument de Business Intelligence simplu și ușor de utilizat.
- Principalul dezavantaj al Pentaho este că este o evoluție a instrumentului mult mai lentă în comparație cu alte instrumente BI