Tutoriel Apache NiFi

Rรฉsumรฉ du didacticiel Apache NiFi

Ce didacticiel Apache NiFi couvre tous les sujets de base ร  avancรฉs ร  partir de zรฉro. Vous apprendrez les concepts tels que la dรฉfinition NiFi, l'historique, l'architecture, les fonctionnalitรฉs, le processus d'installation, les cas d'utilisation. Vous apprendrez รฉgalement pourquoi vous devez utiliser Apache NiFi et les meilleures pratiques d'exรฉcution d'Apache NiFi.

Quโ€™est-ce quโ€™Apache NiFi ?

Apache NiFi est un logiciel open source permettant d'automatiser et de gรฉrer le flux de donnรฉes entre les systรจmes. Il s'agit d'un systรจme puissant et fiable pour traiter et distribuer des donnรฉes. Il fournit une interface utilisateur Web pour crรฉer, surveiller et contrรดler les flux de donnรฉes. Il dispose d'un processus de flux de donnรฉes hautement configurable et modifiable pour modifier les donnรฉes au moment de l'exรฉcution.

Apache NiFi est facilement extensible grรขce au dรฉveloppement de composants personnalisรฉs.

Pourquoi utiliser Apache NIfi ?

Voici les raisons dโ€™utiliser Apache Nifi :

  • Vous permet d'effectuer une ingestion de donnรฉes pour extraire des donnรฉes dans NiFi, ร  partir de nombreuses sources de donnรฉes et crรฉer des fichiers de flux
  • Il offre un contrรดle en temps rรฉel qui vous aide ร  gรฉrer le mouvement des donnรฉes entre n'importe quelle source et destination.
  • Visualisez DataFlow au niveau de l'entreprise
  • Fournir des outils et des extensions communs
  • Vous permet de profiter des bibliothรจques existantes et Java fonctionnalitรฉ de l'รฉcosystรจme
  • Aide les organisations ร  intรฉgrer Nifi ร  leur infrastructure existante
  • NiFi est conรงu pour รฉvoluer en clusters qui offrent une livraison garantie des donnรฉes
  • Visualisez et surveillez les performances et le comportement dans un bulletin de flux qui offre des informations et une documentation en ligne.
  • Vous aide ร  dรฉmarrer et arrรชter les composants sรฉparรฉment ou au niveau du groupe
  • Il vous aide ร  รฉcouter, rรฉcupรฉrer, diviser, agrรฉger, acheminer, transformer et glisser-dรฉposer Dataflow

Histoire dโ€™Apache NiFi

  • Dรฉveloppรฉ ร  la NSA depuis plus de huit ans
  • 2014- Il a รฉtรฉ donnรฉ au logiciel Apache Foundation
  • 2015 - NiFi est devenu un รฉlรฉment officiel d'Apache Project Suite
  • Depuis, toutes les 6 ร  8 semaines, Apache NiFi publie une nouvelle mise ร  jour

sauf si Architecture

Apache NiFi a une architecture bien pensรฉe. Une fois les donnรฉes rรฉcupรฉrรฉes ร  partir de sources externes, elles sont reprรฉsentรฉes sous forme de FlowFile dans l'architecture Apache NiFi.

sauf si Architecture
sauf si Architecture

Voici les composants clรฉs de l'architecture NiFi

Composant Nifi Description
Fichier de flux FlowFile est constituรฉ de donnรฉes originales auxquelles sont attachรฉes des mรฉta-informations. Il vous permet de traiter non seulement des donnรฉes CSV ou autres donnรฉes basรฉes sur des enregistrements, mais รฉgalement des images, des vidรฉos, de l'audio ou toute autre donnรฉe binaire.
Processeur Flowfile Effectue le travail qui agit comme un รฉlรฉment constitutif du flux de donnรฉes dans NiFi.
Contrรดleur de dรฉbit Conserve une trace de la faรงon dont les processus sont connectรฉs. Il gรจre les threads et leurs allocations que tous les processus utilisent.
Web Server Le serveur Web hรฉberge les commandes et l'API basรฉes sur HTTP de NiFi.
Extension Il existe de nombreux types d'extensions NiFi qui fonctionnent et s'exรฉcutent au sein de la JVM.
La connexion Agit comme un lien entre les processeurs qui contiennent une file dโ€™attente et les relations qui affectent lโ€™endroit oรน les donnรฉes sont acheminรฉes.
Contre-pression Empรชchez le systรจme d'รชtre saturรฉ en contrรดlant la quantitรฉ ou la taille des donnรฉes des fichiers de flux qui peuvent รชtre stockรฉs dans la file d'attente.
Groupe de processus Un groupe de processus est un ensemble de processus et de leurs connexions, qui reรงoivent et envoient des donnรฉes ร  l'aide de ports.
Rรฉfรฉrentiel Flowfile Dans le rรฉfรฉrentiel FlowFile, NiFi garde une trace de l'รฉtat des dรฉtails dont il dispose sur un FlowFile donnรฉ qui est actif dans le flux.
Rรฉfรฉrentiel de contenu Le rรฉfรฉrentiel de contenu est une zone dans laquelle existent les octets de contenu rรฉels d'un FlowFile donnรฉ.
Rรฉfรฉrentiel de provenance Le rรฉfรฉrentiel de provenance est une zone oรน toutes les donnรฉes sur les รฉvรฉnements de provenance sont collectรฉes.

Fonctionnalitรฉs Apache NiFi

  • NiFi prend en charge la mise en mรฉmoire tampon de toutes les donnรฉes en file d'attente et offre une capacitรฉ de contre-pression car ces files d'attente peuvent atteindre des limites spรฉcifiรฉes.
  • NiFi permet de dรฉfinir un ou plusieurs schรฉmas de priorisation
  • Fournit des processeurs de connexion pour de nombreuses sources de donnรฉes
  • Prend en charge tout appareil qui fonctionne Java
  • Idรฉal pour les endroits ร  connectivitรฉ limitรฉe
  • Prise en charge du dรฉpannage et de l'optimisation des flux
  • Offre une authentification/autorisation basรฉe sur les rรดles
  • Permet le tรฉlรฉchargement, la rรฉcupรฉration et la relecture de fichiers individuels
  • Crรฉez vos processeurs, vos services de contrรดleur et bien plus encore
  • Assurer le cryptage du contenu et la communication via des protocoles sรฉcurisรฉs
  • Permet un dรฉveloppement rapide et des tests efficaces
  • Permet le dรฉveloppement de composants simples ร  fonction unique qui peuvent รชtre rรฉutilisรฉs et combinรฉs pour crรฉer des flux plus complexes
  • Permet l'isolation du chargeur de classe pour une gestion plus facile des dรฉpendances

Comment installer Apache NiFi

Vous trouverez ci-dessous un processus รฉtape par รฉtape pour l'installation d'Apache NiFi.

ร‰tape 1) Allez dans le lien,

et cliquez sur "Continuer ร  vous abonner"

Installer Apache NiFi

ร‰tape 2) Sur la page suivante,

Cliquez sur ยซ Accepter les conditions ยป

Installer Apache NiFi

ร‰tape 3) Vous verrez cette page,

Merci de vous รชtre abonnรฉ ร  ce produit ! Nous traitons votre demande.

Installer Apache NiFi

ร‰tape 4) Actualisez la page aprรจs 5 minutes.

Cliquez sur ยซ Continuer vers la configuration ยป

Installer Apache NiFi

ร‰tape 5) Sur la page suivante,

Conservez les paramรจtres par dรฉfaut et cliquez sur ยซ Continuer le lancement ยป

Installer Apache NiFi

ร‰tape 6) Sur la page suivante,

Cliquez sur Lancer. Vous devrez peut-รชtre crรฉer une clรฉ

Installer Apache NiFi

ร‰tape 7) Vous verrez ce message de rรฉussite.

Toutes nos fรฉlicitations! Une instance de ce logiciel est dรฉployรฉe avec succรจs sur EC2 !

Installer Apache NiFi

ร‰tape 8) Remarque,

L'identifiant de l'instance et le DNS public de l'instance EC2

Installer Apache NiFi

ร‰tape 9) Dans le groupe de sรฉcuritรฉ,

Ajouter toutes les rรจgles de trafic aux entrรฉes et sorties

Installer Apache NiFi

ร‰tape 10) Pour accรฉder ร  Nifi,

utilisez simplement l'URL

http://publicdns:8080/nifi

Dans notre cas, cela devient

http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/

L'Utilisateur: admin

Mot de passe: ID d'instance

Installer Apache NiFi

ร‰tape 11) Tu verras,

ร‰cran d'accueil NiFi

Installer Apache NiFi

Cas d'utilisation de Nifi

Vous trouverez ci-dessous une liste de cas d'utilisation d'Apache NiFi :

Industrie Utilisation
Assurance
  • Analyse des risques et de la souscription
  • Analyse des rรฉclamations
  • Assurance basรฉe sur l'utilisation
  • Dรฉveloppement de nouveaux produits
Soins de santรฉ
  • Vue unique du patient
  • Surveillance des signes vitaux en temps rรฉel
  • Optimisation du DME
  • Optimisation de la chaรฎne d'approvisionnement
Tรฉlรฉcommunication
  • Vue unique du client
  • Analyse CDR
  • Allocation dynamique de bande passante
Secteur Industriel & Fabrication
  • Entretien prรฉventif
  • Optimisation de la chaรฎne d'approvisionnement
  • Contrรดle Qualitรฉ
Pรฉtrole et Gaz - Industrie
  • Surveillance en temps rรฉel
  • Vue unique du Operaproduction
  • Maintenance Prรฉdictive
  • Archive et analyses
  • Classification des donnรฉes non structurรฉes
Services financiers
  • Lutte anti-blanchiment
  • Dรฉtection de fraude
  • Gestion des risques et des donnรฉes

Meilleures pratiques Exรฉcuter Apache NiFi

  • Idรฉal pour sรฉparer les environnements de test/dรฉveloppement/production dans NiFi
  • Vous devez diviser votre flux en groupes de processus
  • Utilisez une convention de dรฉnomination, utilisez des commentaires et des รฉtiquettes
  • Organisez vos projets en trois parties : ingestion, test et suivi
  • Utiliser des noms uniques pour les variables

Inconvรฉnient de Nifi

  • Besoin de contrรดles prรฉcis de sรฉcuritรฉ et de conformitรฉ
  • Vous devez trรจs bien connaรฎtre le systรจme sous-jacent lorsque vous travaillez avec Apache NiFi
  • Doit maintenir une chaรฎne de traรงabilitรฉ pour les donnรฉes
  • Le transport/la messagerie pourrait ne pas suffire
  • Les besoins en accรจs aux donnรฉes dรฉpassent les ressources disponibles pour le transport
  • Toutes les donnรฉes ne sont pas crรฉรฉes de la mรชme maniรจre
  • L'autorisation SSL et au niveau du sujet peut ne pas รชtre suffisante

Rรฉsumรฉ

  • Apache NiFi est un logiciel open source pour automatiser et gรฉrer le flux de donnรฉes entre les systรจmes
  • NiFi est conรงu pour รฉvoluer en clusters qui offrent une livraison garantie des donnรฉes
  • Nifi a รฉtรฉ dรฉveloppรฉ ร  la NSA pendant plus de huit ans
  • Une fois les donnรฉes rรฉcupรฉrรฉes ร  partir de sources externes, elles sont reprรฉsentรฉes sous forme de FlowFile dans l'architecture Apache NiFi.
  • FlowFile, processeur, contrรดleur, serveur Web, connexion, contre-pression, rรฉfรฉrentiel sont des composants importants de l'architecture NiFi
  • Le langage d'expression NiFi prend en charge tout appareil qui exรฉcute Java
  • Vous pouvez facilement installer NiFi sur AWS
  • Le NiFi est utilisรฉ dans divers secteurs tels que la santรฉ, les assurances, les tรฉlรฉcommunications, la fabrication, la finance, le pรฉtrole et le gaz, entre autres.
  • Il est recommandรฉ d'organiser vos projets en trois parties : ingestion, test et surveillance.

Rรฉsumez cet article avec :