Tutorial de Apache NiFi
Resumen del tutorial de Apache NiFi
Este tutorial de Apache NiFi cubre todos los temas bรกsicos y avanzados desde cero. Aprenderรก conceptos como la definiciรณn de NiFi, su historia, su arquitectura, sus caracterรญsticas, el proceso de instalaciรณn y los casos de uso. Tambiรฉn aprenderรก por quรฉ necesita usar Apache NiFi y las mejores prรกcticas para ejecutar Apache NiFi.
ยฟQuรฉ es Apache NiFi?
apache nifi es un software de cรณdigo abierto para automatizar y gestionar el flujo de datos entre sistemas. Es un sistema potente y confiable para procesar y distribuir datos. Proporciona una interfaz de usuario basada en web para crear, monitorear y controlar flujos de datos. Tiene un proceso de flujo de datos altamente configurable y modificable para modificar datos en tiempo de ejecuciรณn.
Apache NiFi es fรกcilmente extensible mediante el desarrollo de componentes personalizados.
ยฟPor quรฉ utilizar Apache NIfi?
Estas son las razones para usar Apache Nifi:
- Le permite realizar ingestiรณn de datos para extraer datos a NiFi, desde numerosas fuentes de datos y crear archivos de flujo.
- Ofrece control en tiempo real que le ayuda a gestionar el movimiento de datos entre cualquier origen y destino.
- Visualice DataFlow a nivel empresarial
- Proporcionar herramientas y extensiones comunes.
- Le permite aprovechar las bibliotecas existentes y Java funcionalidad del ecosistema
- Ayuda a las organizaciones a integrar Nifi con su infraestructura existente
- NiFi estรก diseรฑado para escalar en clรบsteres que ofrecen una entrega garantizada de datos.
- Visualice y supervise el rendimiento y el comportamiento en un boletรญn de flujo que ofrece informaciรณn y documentaciรณn en lรญnea.
- Le ayuda a iniciar y detener componentes por separado o a nivel de grupo
- Le ayuda a escuchar, buscar, dividir, agregar, enrutar, transformar y arrastrar y soltar Dataflow
Historia de Apache NiFi
- Desarrollado en la NSA durante mรกs de ocho aรฑos.
- 2014- Fue donado a Apache Software. Foundation
- 2015: NiFi se convirtiรณ en parte oficial de Apache Project Suite
- Desde entonces, cada 6-8 semanas, Apache NiFi lanza una nueva actualizaciรณn
a no ser que Architectura
Apache NiFi tiene una arquitectura bien pensada. Una vez que se obtienen los datos de fuentes externas, se representan como FlowFile dentro de la arquitectura Apache NiFi.

Estos son los componentes clave de la arquitectura NiFi
| Componente Nifi | Descripciรณn |
|---|---|
| Archivo de flujo | FlowFile son datos originales con metainformaciรณn adjunta. Le permite procesar no sรณlo CSV u otros datos basados โโen registros, sino tambiรฉn imรกgenes, vรญdeos, audio o cualquier otro dato binario. |
| Procesador de archivos de flujo | Realiza el trabajo que actรบa como componente bรกsico del flujo de datos en NiFi. |
| Controlador de flujo | Mantiene un registro de cรณmo se conectan los procesos. Gestiona los subprocesos y sus asignaciones que utilizan todos los procesos. |
| servidor web | El servidor web aloja la API y los comandos basados โโen HTTP de NiFi. |
| Extension | Hay muchos tipos de extensiones NiFi que operan y se ejecutan dentro de la JVM. |
| Conexiรณn | Actรบa como un vรญnculo entre los procesadores que contienen una cola y relaciones que afectan dรณnde se enrutan los datos. |
| Contrapresiรณn | Evite que el sistema se sobrecargue controlando la cantidad o el tamaรฑo de los datos de los archivos de flujo que se pueden almacenar en la cola. |
| Grupo de proceso | Un grupo de procesos es un conjunto de procesos y sus conexiones, que recibe y envรญa datos con la ayuda de puertos. |
| Repositorio de archivos de flujo | En el repositorio FlowFile, NiFi realiza un seguimiento del estado de los detalles que tiene sobre un FlowFile determinado que estรก activo en el flujo. |
| Repositorio de contenido | El repositorio de contenido es un รกrea donde existen los bytes de contenido reales de un FlowFile determinado. |
| Repositorio de procedencia | El Repositorio de Procedencia es un รกrea donde se recopilan todos los datos de eventos de procedencia. |
Caracterรญsticas de Apache NiFi
- NiFi admite el almacenamiento en bรบfer de todos los datos en cola y ofrece una capacidad de contrapresiรณn a medida que esas colas pueden alcanzar lรญmites especรญficos.
- NiFi permite configurar uno o mรกs esquemas de priorizaciรณn
- Proporciona procesadores de conexiรณn para muchas fuentes de datos.
- Admite cualquier dispositivo que se ejecute Java
- Ideal para lugares de conectividad limitada
- Soporte para resoluciรณn de problemas y optimizaciรณn de flujo.
- Ofrece autenticaciรณn/autorizaciรณn basada en roles
- Permite la descarga, recuperaciรณn y reproducciรณn de archivos individuales.
- Cree sus procesadores, servicios de controlador y mรกs
- Proporcionar cifrado de contenido y comunicaciรณn a travรฉs de protocolos seguros.
- Permite un desarrollo rรกpido y pruebas efectivas.
- Permite el desarrollo de componentes simples de una sola funciรณn que se pueden reutilizar y combinar para crear flujos mรกs complejos.
- Permite el aislamiento del cargador de clases para una gestiรณn mรกs sencilla de las dependencias.
Cรณmo instalar Apache NiFi
A continuaciรณn se muestra un proceso paso a paso para la instalaciรณn de Apache NiFi
Paso 1) Vaya a el enlace,
y haga clic en "Continuar para suscribirse"
Paso 2) En la pรกgina siguiente,
Haga clic en "Aceptar tรฉrminos"
Paso 3) Verรกs esta pรกgina,
ยกGracias por suscribirte a este producto! Estamos procesando su peticiรณn.
Paso 4) Actualiza la pรกgina despuรฉs de 5 minutos.
Haga clic en โContinuar a Configuraciรณnโ
Paso 5) En la pรกgina siguiente,
Mantenga la configuraciรณn predeterminada y haga clic en "Continuar para iniciar"
Paso 6) En la pรกgina siguiente,
Haga clic en Iniciar. Es posible que necesites crear una clave.
Paso 7) Verรก este mensaje de รฉxito.
ยกFelicitaciones! ยกSe implementรณ exitosamente una instancia de este software en EC2!
Paso 8) Nota,
La identificaciรณn de la instancia y el DNS pรบblico de la instancia EC2.
Paso 9) En el grupo de seguridad,
Agregar todas las reglas de trรกfico entrante y saliente
Paso 10) Para acceder a Nifi,
simplemente usa la URL
http://publicdns:8080/nifi
En nuestro caso se convierte
http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/
El sistema de reservas de escritorios, interactivo y fรกcil de usar, ayuda a gestores y empresas a adaptarse a la nueva rutina laboral. El sistema inteligente optimiza espacios y horarios segรบn necesidades reales.: administrador
Contraseรฑa: ID de instancia
Paso 11) Ya verรกs,
Pantalla de inicio de NiFi
Casos de uso de Nifi
A continuaciรณn se muestra una lista de casos de uso de Apache NiFi:
| Experiencia | Uso |
|---|---|
| Seguros |
|
| HealthCare |
|
| Telecomunicaciรณn |
|
| Manufactura |
|
| Petrรณleo y Gas-Industria |
|
| Servicios Financieros |
|
Mejores prรกcticas para ejecutar Apache NiFi
- Ideal para separar entornos de prueba/desarrollo/producciรณn en NiFi
- Debes dividir tu flujo en grupos de procesos.
- Utilice una convenciรณn de nomenclatura, utilice comentarios y etiquetas.
- Organice sus proyectos en tres partes: ingesta, prueba y monitoreo
- Utilice nombres รบnicos para la variable
Desventaja de Nifi
- Necesita controles precisos de seguridad y cumplimiento
- Necesita conocer muy bien el sistema subyacente mientras trabaja con Apache NiFi
- Debe mantener la cadena de custodia de los datos.
- El transporte y la mensajerรญa pueden no ser suficientes
- Las necesidades de acceso a datos superan los recursos disponibles para transportar
- No todos los datos se crean por igual
- La autorizaciรณn SSL y a nivel de tema puede no ser suficiente
Resumen
- Apache NiFi es un software de cรณdigo abierto para automatizar y gestionar el flujo de datos entre sistemas.
- NiFi estรก diseรฑado para escalar en clรบsteres que ofrecen una entrega garantizada de datos.
- Nifi fue desarrollado en la NSA durante mรกs de ocho aรฑos
- Una vez que se obtienen datos de fuentes externas, se representan como FlowFile dentro de la arquitectura Apache NiFi.
- FlowFile, procesador, controlador, servidor web, conexiรณn, contrapresiรณn y repositorio son componentes importantes de la arquitectura NiFi
- El lenguaje de expresiรณn NiFi admite cualquier dispositivo que ejecute Java
- Puede instalar NiFi fรกcilmente en AWS
- NiFi se utiliza en diversas industrias, como la atenciรณn mรฉdica, los seguros, las telecomunicaciones, la manufactura, las finanzas, el petrรณleo y el gas, entre otras.
- Como prรกctica recomendada, organice sus proyectos en tres partes: ingesta, prueba y monitoreo.











