Tutoriel d'intégration de données Pentaho : Qu'est-ce que l'outil ETL Pentaho ?

Qu’est-ce que Pentaho BI ?

Pentaho est un outil de Business Intelligence qui fournit une large gamme de solutions de Business Intelligence aux clients. Il est capable de reporting, d'analyse de données, d'intégration de données, d'exploration de données, etc. Pentaho propose également un ensemble complet de fonctionnalités BI qui vous permettent d'améliorer les performances et l'efficacité de votre entreprise.

Caractéristiques de Pentaho

Voici les fonctionnalités importantes de Pentaho :

  • Capacités ETL pour les besoins de business intelligence
  • Comprendre le concepteur de rapports Pentaho
  • Expertise produit
  • Propose des sous-rapports côte à côte
  • Libérer de nouvelles capacités
  • Soutien professionnel
  • Requête et rapports
  • Offre des fonctionnalités améliorées
  • Prise en charge complète des métadonnées d'exécution à partir des sources de données

Suite BI Pentaho

Maintenant, nous allons découvrir la suite Pentaho BI dans ce tutoriel Pentaho :

Suite BI Pentaho
Suite BI Pentaho

Pentaho BI Suite comprend les composants suivants :

Rapports Pentaho

Pentaho Reporting dépend du projet JFreeReport. Il vous aide à répondre à vos besoins de reporting professionnel. Ce composant propose également la publication de rapports programmés et à la demande dans des formats populaires tels que XLS, PDF, TXT et HTML.

Analyse

Il offre un large éventail d'analyses, un large éventail de fonctionnalités, notamment une vue sous forme de tableau croisé dynamique. L'outil fournit des fonctionnalités d'interface graphique améliorées (utilisant Flash ou SVG), des widgets de tableau de bord intégrés, un portail et une intégration de flux de travail.

De plus, Pentaho Spreadsheet Services permet à un utilisateur de parcourir, de pivoter et d'utiliser des graphiques à partir de MS Excel.

Tableaux de bord

Le tableau de bord propose des rapports et des analyses, qui contribuent au contenu des tableaux de bord Pentaho. Le concepteur de tableaux de bord en libre-service comprend de nombreux modèles et mises en page de tableaux de bord intégrés. Il permet aux utilisateurs professionnels de créer des tableaux de bord personnalisés avec peu de formation.

Data Mining

Outil d'exploration de données découvre des modèles cachés et des indicateurs de performances futures. Il offre l'ensemble le plus complet d'algorithmes d'apprentissage automatique du projet Weka, qui comprend le clustering, les arbres de décision, les forêts aléatoires, l'analyse en composantes principales et les réseaux de neurones.

Il vous permet d'afficher les données sous forme graphique, d'interagir avec elles par programme ou d'utiliser plusieurs sources de données pour des rapports, des analyses plus approfondies et d'autres processus.

Intégration de données Pentaho

Ce composant est utilisé pour intégrer les données partout où elles existent.

Riche bibliothèque de transformation avec plus de 150 objets de mappage prêts à l'emploi.

Il prend en charge un large éventail de sources de données, notamment plus de 30 plates-formes de bases de données open source et propriétaires, ainsi que des fichiers plats. Cela aide également Analyse de Big Data avec intégration et gestion des données Hadoop.

Qui utilise Pentaho BI ?

Pentaho BI est un outil largement utilisé par de nombreux professionnels du logiciel tels que :

  • Logiciels open source
  • Analyste d'affaires et chercheur
  • Étudiants
  • Conseiller en intelligence d'affaires

Comment installer Pentaho dans AWS

Voici un processus étape par étape sur la façon d'installer Pentaho dans AWS.

Étape 1) Cliquez sur Continuer pour vous abonner
Cliquez sur https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro et cliquez sur Continuer

Installer Pentaho dans AWS

Étape 2) Accepter les termes et conditions
Sur la page suivante, Acceptez le contrat de licence

Installer Pentaho dans AWS

Étape 3) Cliquez sur Continuer vers la configuration
Procéder à la configuration

Installer Pentaho dans AWS

Étape 4) Cliquez sur Continuer pour lancer
Conservez les paramètres par défaut et cliquez pour lancer

Installer Pentaho dans AWS

Étape 5) Attendez 5 minutes par exemple pour lancer
Vérifiez les instructions d'utilisation et attendez

Installer Pentaho dans AWS

Étape 6) Obtenir une adresse IP publique
Copiez l'adresse IP publique de l'instance.

Installer Pentaho dans AWS

Étape 7) Utilisez l'adresse IP publique pour la connexion
Collez l'adresse IP publique de l'instance pour accéder à Pentaho.

Installer Pentaho dans AWS

Prérequis de Pentaho

  • Configuration matérielle
  • Configuration logicielle requise
  • Téléchargement et installation de la suite Bl
  • Démarrage de la suite Bl
  • Administration de la suite Bl

Configuration matérielle requise

Le logiciel Pentaho Bl Suite n'a aucune limite de correction sur un ordinateur ou un matériel réseau tant que vous pouvez répondre à la configuration logicielle minimale requise. Il est facile d’installer cet outil de Business Intelligence. Cependant, un ensemble recommandé de spécifications système :

RAM Minimum 2 Go
Espace disque Minimum 1 Go
Processeur EM64T double cœur ou AMD64

Configuration logicielle requise

  • Installation de Sun JRE 5.0
  • L'environnement peut être 32 bits ou 64 bits
  • Appareils Operasystèmes d'exploitation: Linux, Solaris, Windows, Mac
  • Un poste de travail doté d'une interface de navigateur Web moderne telle que Chrome, Internet Explorer, Firefox

Pour démarrer le serveur Bl

  • On Windows dès le début, cliquez sur le bouton Démarrer l’icône du serveur Bl.
  • Sous Linux, exécutez le script start-pentaho sur /biserver-ce/directory

Pour démarrer le serveur administrateur

  • On Windows À partir du bouton Démarrer, cliquez sur Démarrer le serveur d'entreprise Bl.
  • Pour Linux : accédez à la fenêtre de commande et exécutez le script de démarrage dans /biserver-ce/administration-console/directory.

Pour arrêter le serveur administrateur

  • Pour arrêter le serveur sous Windows, cliquez sur les icônes d'arrêt bi-serveur.
  • Sous Linux. Vous devez accéder au terminal, accéder au répertoire installé et exécuter stop.bat

Console d'administration Pentaho

Concepteur de rapport

Il s'agit d'un outil avancé de création de rapports. C'est un outil idéal pour vous si vous souhaitez créer un rapport complet sur les données. Cet outil offre beaucoup plus de flexibilité et de fonctionnalités que les capacités de reporting ad hoc de la console utilisateur Pentaho.

Studio de design

Il s'agit d'un Eclipse-outil basé sur. Il vous permet de modifier manuellement un rapport ou une analyse. Il est largement utilisé pour ajouter des modifications à un rapport existant qui ne peuvent pas être ajoutées avec Report Designer.

Concepteur d'agrégation

Cet outil graphique vous permet d'améliorer l'efficacité du cube Mondrian.

Éditeur de métadonnées

Il est utilisé pour ajouter une couche de métadonnées personnalisée à toute source de données existante.

Intégration de données Pentaho

L'outil d'extraction, de transformation et de chargement (ETL) Kettle, qui permet

Outil Pentaho vs pile BI

Outil Pentaho Pile BI
Intégration de données (PDI) ETL
Il propose un éditeur de métadonnées Il assure la gestion des métadonnées
Pentaho BA Statistiques
Concepteur de rapports OperaRapports nationaux
Saïku Rapports ad hoc
CDE Tableaux de bord
Console utilisateur Pentaho (PUC) Gouvernance/Suivi

Avantages de Pentaho

Maintenant, dans ce didacticiel d'intégration de données Pentaho, nous découvrirons certains avantages de Pentaho Business Intelligence Tool :

  • Pentaho BI est un outil très intuitif. Avec quelques concepts de base, vous pouvez travailler avec.
  • Outil de Business Intelligence simple et facile à utiliser
  • Offre une large gamme de fonctionnalités BI, notamment le reporting, le tableau de bord, l'analyse interactive, l'intégration de données, l'exploration de données, etc.
  • Livré avec une interface conviviale et fournit divers outils pour récupérer des données à partir de plusieurs sources de données
  • Propose un package unique pour travailler sur les données
  • Possède une édition communautaire avec de nombreux contributeurs ainsi qu'une édition Enterprise.
  • La capacité de fonctionner sur le cluster Hadoop
  • JavaLe code de script écrit dans les composants d'étape peut être réutilisé dans d'autres composants.

Inconvénients du Pentaho

Voici les inconvénients/inconvénients de l’utilisation de l’outil Pentaho BI :

  • La conception de l’interface peut être faible et il n’existe pas d’interface unifiée pour tous les composants.
  • Évolution de l’outil beaucoup plus lente par rapport aux autres outils BI.
  • Pentaho Business Analytics propose un nombre limité de composants.
  • Mauvais soutien de la communauté. Donc, si vous n'obtenez pas de composant fonctionnel, vous devez attendre la sortie de la prochaine version.

Résumé

  • Pentaho est un outil de Business Intelligence qui fournit un large éventail de l'intelligence d'entreprise des solutions aux clients
  • Il offre des fonctionnalités ETL pour les besoins de business intelligence.
  • Les suites Pentaho offrent des composants tels que le rapport, l'analyse, le tableau de bord et l'exploration de données
  • Pentaho Business Intelligence est largement utilisé par 1) les analystes commerciaux 2) les programmeurs de logiciels open source 3) les chercheurs et 4) les étudiants.
  • Le processus d'installation de Pentaho comprend : 1) Configuration matérielle requise 2) Configuration logicielle requise, 3) Téléchargement de la suite Bl, 4) Démarrage de la suite Bl et 5) Administration de la suite Bl
  • Les composants importants de la console d'administration Pentaho sont 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
  • Pentaho est un outil d'intégration de données (PDI) tandis que la pile BI est un Outil ETL.
  • Le plus grand avantage de Pentaho est qu’il s’agit d’un outil de Business Intelligence simple et facile à utiliser.
  • Le principal inconvénient de Pentaho est qu’il s’agit d’une évolution d’outil beaucoup plus lente par rapport aux autres outils BI.