Tutoriel Apache NiFi
Rรฉsumรฉ du didacticiel Apache NiFi
Ce didacticiel Apache NiFi couvre tous les sujets de base ร avancรฉs ร partir de zรฉro. Vous apprendrez les concepts tels que la dรฉfinition NiFi, l'historique, l'architecture, les fonctionnalitรฉs, le processus d'installation, les cas d'utilisation. Vous apprendrez รฉgalement pourquoi vous devez utiliser Apache NiFi et les meilleures pratiques d'exรฉcution d'Apache NiFi.
Quโest-ce quโApache NiFi ?
Apache NiFi est un logiciel open source permettant d'automatiser et de gรฉrer le flux de donnรฉes entre les systรจmes. Il s'agit d'un systรจme puissant et fiable pour traiter et distribuer des donnรฉes. Il fournit une interface utilisateur Web pour crรฉer, surveiller et contrรดler les flux de donnรฉes. Il dispose d'un processus de flux de donnรฉes hautement configurable et modifiable pour modifier les donnรฉes au moment de l'exรฉcution.
Apache NiFi est facilement extensible grรขce au dรฉveloppement de composants personnalisรฉs.
Pourquoi utiliser Apache NIfi ?
Voici les raisons dโutiliser Apache Nifi :
- Vous permet d'effectuer une ingestion de donnรฉes pour extraire des donnรฉes dans NiFi, ร partir de nombreuses sources de donnรฉes et crรฉer des fichiers de flux
- Il offre un contrรดle en temps rรฉel qui vous aide ร gรฉrer le mouvement des donnรฉes entre n'importe quelle source et destination.
- Visualisez DataFlow au niveau de l'entreprise
- Fournir des outils et des extensions communs
- Vous permet de profiter des bibliothรจques existantes et Java fonctionnalitรฉ de l'รฉcosystรจme
- Aide les organisations ร intรฉgrer Nifi ร leur infrastructure existante
- NiFi est conรงu pour รฉvoluer en clusters qui offrent une livraison garantie des donnรฉes
- Visualisez et surveillez les performances et le comportement dans un bulletin de flux qui offre des informations et une documentation en ligne.
- Vous aide ร dรฉmarrer et arrรชter les composants sรฉparรฉment ou au niveau du groupe
- Il vous aide ร รฉcouter, rรฉcupรฉrer, diviser, agrรฉger, acheminer, transformer et glisser-dรฉposer Dataflow
Histoire dโApache NiFi
- Dรฉveloppรฉ ร la NSA depuis plus de huit ans
- 2014- Il a รฉtรฉ donnรฉ au logiciel Apache Foundation
- 2015 - NiFi est devenu un รฉlรฉment officiel d'Apache Project Suite
- Depuis, toutes les 6 ร 8 semaines, Apache NiFi publie une nouvelle mise ร jour
sauf si Architecture
Apache NiFi a une architecture bien pensรฉe. Une fois les donnรฉes rรฉcupรฉrรฉes ร partir de sources externes, elles sont reprรฉsentรฉes sous forme de FlowFile dans l'architecture Apache NiFi.

Voici les composants clรฉs de l'architecture NiFi
| Composant Nifi | Description |
|---|---|
| Fichier de flux | FlowFile est constituรฉ de donnรฉes originales auxquelles sont attachรฉes des mรฉta-informations. Il vous permet de traiter non seulement des donnรฉes CSV ou autres donnรฉes basรฉes sur des enregistrements, mais รฉgalement des images, des vidรฉos, de l'audio ou toute autre donnรฉe binaire. |
| Processeur Flowfile | Effectue le travail qui agit comme un รฉlรฉment constitutif du flux de donnรฉes dans NiFi. |
| Contrรดleur de dรฉbit | Conserve une trace de la faรงon dont les processus sont connectรฉs. Il gรจre les threads et leurs allocations que tous les processus utilisent. |
| Web Server | Le serveur Web hรฉberge les commandes et l'API basรฉes sur HTTP de NiFi. |
| Extension | Il existe de nombreux types d'extensions NiFi qui fonctionnent et s'exรฉcutent au sein de la JVM. |
| La connexion | Agit comme un lien entre les processeurs qui contiennent une file dโattente et les relations qui affectent lโendroit oรน les donnรฉes sont acheminรฉes. |
| Contre-pression | Empรชchez le systรจme d'รชtre saturรฉ en contrรดlant la quantitรฉ ou la taille des donnรฉes des fichiers de flux qui peuvent รชtre stockรฉs dans la file d'attente. |
| Groupe de processus | Un groupe de processus est un ensemble de processus et de leurs connexions, qui reรงoivent et envoient des donnรฉes ร l'aide de ports. |
| Rรฉfรฉrentiel Flowfile | Dans le rรฉfรฉrentiel FlowFile, NiFi garde une trace de l'รฉtat des dรฉtails dont il dispose sur un FlowFile donnรฉ qui est actif dans le flux. |
| Rรฉfรฉrentiel de contenu | Le rรฉfรฉrentiel de contenu est une zone dans laquelle existent les octets de contenu rรฉels d'un FlowFile donnรฉ. |
| Rรฉfรฉrentiel de provenance | Le rรฉfรฉrentiel de provenance est une zone oรน toutes les donnรฉes sur les รฉvรฉnements de provenance sont collectรฉes. |
Fonctionnalitรฉs Apache NiFi
- NiFi prend en charge la mise en mรฉmoire tampon de toutes les donnรฉes en file d'attente et offre une capacitรฉ de contre-pression car ces files d'attente peuvent atteindre des limites spรฉcifiรฉes.
- NiFi permet de dรฉfinir un ou plusieurs schรฉmas de priorisation
- Fournit des processeurs de connexion pour de nombreuses sources de donnรฉes
- Prend en charge tout appareil qui fonctionne Java
- Idรฉal pour les endroits ร connectivitรฉ limitรฉe
- Prise en charge du dรฉpannage et de l'optimisation des flux
- Offre une authentification/autorisation basรฉe sur les rรดles
- Permet le tรฉlรฉchargement, la rรฉcupรฉration et la relecture de fichiers individuels
- Crรฉez vos processeurs, vos services de contrรดleur et bien plus encore
- Assurer le cryptage du contenu et la communication via des protocoles sรฉcurisรฉs
- Permet un dรฉveloppement rapide et des tests efficaces
- Permet le dรฉveloppement de composants simples ร fonction unique qui peuvent รชtre rรฉutilisรฉs et combinรฉs pour crรฉer des flux plus complexes
- Permet l'isolation du chargeur de classe pour une gestion plus facile des dรฉpendances
Comment installer Apache NiFi
Vous trouverez ci-dessous un processus รฉtape par รฉtape pour l'installation d'Apache NiFi.
รtape 1) Allez dans le lien,
et cliquez sur "Continuer ร vous abonner"
รtape 2) Sur la page suivante,
Cliquez sur ยซ Accepter les conditions ยป
รtape 3) Vous verrez cette page,
Merci de vous รชtre abonnรฉ ร ce produit ! Nous traitons votre demande.
รtape 4) Actualisez la page aprรจs 5 minutes.
Cliquez sur ยซ Continuer vers la configuration ยป
รtape 5) Sur la page suivante,
Conservez les paramรจtres par dรฉfaut et cliquez sur ยซ Continuer le lancement ยป
รtape 6) Sur la page suivante,
Cliquez sur Lancer. Vous devrez peut-รชtre crรฉer une clรฉ
รtape 7) Vous verrez ce message de rรฉussite.
Toutes nos fรฉlicitations! Une instance de ce logiciel est dรฉployรฉe avec succรจs sur EC2 !
รtape 8) Remarque,
L'identifiant de l'instance et le DNS public de l'instance EC2
รtape 9) Dans le groupe de sรฉcuritรฉ,
Ajouter toutes les rรจgles de trafic aux entrรฉes et sorties
รtape 10) Pour accรฉder ร Nifi,
utilisez simplement l'URL
http://publicdns:8080/nifi
Dans notre cas, cela devient
http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/
L'Utilisateur: admin
Mot de passe: ID d'instance
รtape 11) Tu verras,
รcran d'accueil NiFi
Cas d'utilisation de Nifi
Vous trouverez ci-dessous une liste de cas d'utilisation d'Apache NiFi :
| Industrie | Utilisation |
|---|---|
| Assurance |
|
| Soins de santรฉ |
|
| Tรฉlรฉcommunication |
|
| Secteur Industriel & Fabrication |
|
| Pรฉtrole et Gaz - Industrie |
|
| Services financiers |
|
Meilleures pratiques Exรฉcuter Apache NiFi
- Idรฉal pour sรฉparer les environnements de test/dรฉveloppement/production dans NiFi
- Vous devez diviser votre flux en groupes de processus
- Utilisez une convention de dรฉnomination, utilisez des commentaires et des รฉtiquettes
- Organisez vos projets en trois parties : ingestion, test et suivi
- Utiliser des noms uniques pour les variables
Inconvรฉnient de Nifi
- Besoin de contrรดles prรฉcis de sรฉcuritรฉ et de conformitรฉ
- Vous devez trรจs bien connaรฎtre le systรจme sous-jacent lorsque vous travaillez avec Apache NiFi
- Doit maintenir une chaรฎne de traรงabilitรฉ pour les donnรฉes
- Le transport/la messagerie pourrait ne pas suffire
- Les besoins en accรจs aux donnรฉes dรฉpassent les ressources disponibles pour le transport
- Toutes les donnรฉes ne sont pas crรฉรฉes de la mรชme maniรจre
- L'autorisation SSL et au niveau du sujet peut ne pas รชtre suffisante
Rรฉsumรฉ
- Apache NiFi est un logiciel open source pour automatiser et gรฉrer le flux de donnรฉes entre les systรจmes
- NiFi est conรงu pour รฉvoluer en clusters qui offrent une livraison garantie des donnรฉes
- Nifi a รฉtรฉ dรฉveloppรฉ ร la NSA pendant plus de huit ans
- Une fois les donnรฉes rรฉcupรฉrรฉes ร partir de sources externes, elles sont reprรฉsentรฉes sous forme de FlowFile dans l'architecture Apache NiFi.
- FlowFile, processeur, contrรดleur, serveur Web, connexion, contre-pression, rรฉfรฉrentiel sont des composants importants de l'architecture NiFi
- Le langage d'expression NiFi prend en charge tout appareil qui exรฉcute Java
- Vous pouvez facilement installer NiFi sur AWS
- Le NiFi est utilisรฉ dans divers secteurs tels que la santรฉ, les assurances, les tรฉlรฉcommunications, la fabrication, la finance, le pรฉtrole et le gaz, entre autres.
- Il est recommandรฉ d'organiser vos projets en trois parties : ingestion, test et surveillance.











