Samouczek Apache NiFi
Podsumowanie samouczka Apache NiFi
Ten samouczek Apache NiFi obejmuje wszystkie podstawowe i zaawansowane tematy od podstaw. Poznasz takie pojฤcia jak definicja NiFi, historia, architektura, funkcje, proces instalacji, przypadki uลผycia. Dowiesz siฤ rรณwnieลผ, dlaczego musisz uลผywaฤ Apache NiFi i najlepszych praktyk uruchamiania Apache NiFi.
Co to jest Apache NiFi?
Apache NiFi to oprogramowanie typu open source sลuลผฤ ce do automatyzacji i zarzฤ dzania przepลywem danych pomiฤdzy systemami. Jest to wydajny i niezawodny system do przetwarzania i dystrybucji danych. Zapewnia internetowy interfejs uลผytkownika umoลผliwiajฤ cy tworzenie, monitorowanie i kontrolowanie przepลywรณw danych. Posiada wysoce konfigurowalny i modyfikowalny proces przepลywu danych w celu modyfikowania danych w czasie wykonywania.
Apache NiFi moลผna ลatwo rozszerzyฤ poprzez opracowanie niestandardowych komponentรณw.
Dlaczego warto uลผywaฤ Apache NIfi?
Oto powody, dla ktรณrych warto uลผywaฤ Apache Nifi:
- Umoลผliwia pozyskiwanie danych w celu pobierania danych z wielu ลบrรณdeล danych do NiFi i tworzenia plikรณw przepลywu
- Oferuje kontrolฤ w czasie rzeczywistym, ktรณra pomaga zarzฤ dzaฤ przepลywem danych pomiฤdzy dowolnym ลบrรณdลem i miejscem docelowym
- Wizualizuj DataFlow na poziomie przedsiฤbiorstwa
- Zapewnij wspรณlne narzฤdzia i rozszerzenia
- Umoลผliwia korzystanie z istniejฤ cych bibliotek i Java funkcjonalnoลฤ ekosystemu
- Pomaga organizacjom zintegrowaฤ Nifi z istniejฤ cฤ infrastrukturฤ
- Rozwiฤ zanie NiFi zostaลo zaprojektowane z myลlฤ o skalowaniu w klastrach, ktรณre gwarantujฤ dostarczanie danych
- Wizualizuj i monitoruj wydajnoลฤ i zachowanie w biuletynie przepลywu, ktรณry zapewnia wglฤ d i dokumentacjฤ wbudowanฤ
- Pomaga uruchamiaฤ i zatrzymywaฤ komponenty oddzielnie lub na poziomie grupy
- Pomaga sลuchaฤ, pobieraฤ, dzieliฤ, agregowaฤ, kierowaฤ, przeksztaลcaฤ oraz przeciฤ gaฤ i upuszczaฤ Dataflow
Historia Apache NiFi
- Opracowywany w NSA przez ponad osiem lat
- 2014 โ Zostaล przekazany firmie Apache Software Foundation
- 2015- NiFi staลo siฤ oficjalnฤ czฤลciฤ pakietu Apache Project Suite
- Od tego czasu co 6-8 tygodni Apache NiFi wydaje nowฤ aktualizacjฤ
NiFi Architektura
Apache NiFi ma przemyลlanฤ architekturฤ. Po pobraniu danych ze ลบrรณdeล zewnฤtrznych sฤ one reprezentowane jako FlowFile wewnฤ trz architektury Apache NiFi.

Oto kluczowe komponenty architektury NiFi
| Komponent Nifi | OPIS |
|---|---|
| Plik przepลywu | FlowFile to oryginalne dane z doลฤ czonymi metainformacjami. Umoลผliwia przetwarzanie nie tylko danych CSV lub innych danych opartych na rekordach, ale takลผe zdjฤฤ, filmรณw, dลบwiฤku i innych danych binarnych. |
| Procesor Flowfile | Wykonuje pracฤ stanowiฤ cฤ element budulcowy przepลywu danych w NiFi. |
| Regulator przepลywu | Rejestruje sposรณb, w jaki procesy sฤ ze sobฤ powiฤ zane. Zarzฤ dza wฤ tkami i ich przydziaลami, z ktรณrych korzystajฤ wszystkie procesy. |
| web Server | Serwer internetowy obsลuguje polecenia i interfejs API oparte na protokole HTTP firmy NiFi. |
| Rozbudowa | Istnieje wiele typรณw rozszerzeล NiFi, ktรณre dziaลajฤ i sฤ wykonywane w ramach JVM. |
| Przyลฤ cze | Dziaลa jako poลฤ czenie miฤdzy procesorami zawierajฤ cymi kolejkฤ i relacje, ktรณre wpลywajฤ na to, gdzie dane sฤ kierowane. |
| Ciลnienie zwrotne | Zatrzymaj przepeลnienie systemu, kontrolujฤ c iloลฤ lub rozmiar danych plikรณw przepลywowych, ktรณre moลผna przechowywaฤ w kolejce. |
| Grupa Procesowa | Grupa procesรณw to zbiรณr procesรณw i ich poลฤ czeล, ktรณre odbierajฤ i wysyลajฤ dane za pomocฤ portรณw. |
| Repozytorium Flowfile | W repozytorium FlowFile firma NiFi ลledzi stan szczegรณลรณw, jakie posiada na temat danego pliku FlowFile aktywnego w przepลywie. |
| Repozytorium treลci | Repozytorium treลci to obszar, w ktรณrym znajdujฤ siฤ rzeczywiste bajty treลci danego FlowFile. |
| Repozytorium pochodzenia | Repozytorium pochodzenia to obszar, w ktรณrym gromadzone sฤ wszystkie dane dotyczฤ ce zdarzeล pochodzenia. |
Funkcje Apache NiFi
- NiFi obsลuguje buforowanie wszystkich danych w kolejce i oferuje moลผliwoลฤ wykonania nacisku wstecznego, poniewaลผ kolejki te mogฤ osiฤ gnฤ ฤ okreลlone limity
- NiFi umoลผliwia ustawienie jednego lub wiฤcej schematรณw priorytetyzacji
- Zapewnia procesory poลฤ czeล dla wielu ลบrรณdeล danych
- Obsลuguj kaลผde dziaลajฤ ce urzฤ dzenie Java
- Idealny do miejsc o ograniczonej ลฤ cznoลci
- Wsparcie w rozwiฤ zywaniu problemรณw i optymalizacji przepลywu
- Oferuje uwierzytelnianie/autoryzacjฤ opartฤ na rolach
- Umoลผliwia pobieranie, odzyskiwanie i odtwarzanie pojedynczych plikรณw
- Twรณrz swoje procesory, usลugi kontrolerรณw i nie tylko
- Zapewnij szyfrowanie treลci i komunikacjฤ za poลrednictwem bezpiecznych protokoลรณw
- Umoลผliwia szybki rozwรณj i efektywne testowanie
- Umoลผliwia tworzenie prostych komponentรณw o pojedynczej funkcji, ktรณre moลผna ponownie wykorzystywaฤ i ลฤ czyฤ, aby tworzyฤ bardziej zลoลผone przepลywy
- Umoลผliwia izolacjฤ moduลu ลadujฤ cego klasy w celu ลatwiejszego zarzฤ dzania zaleลผnoลciami
Jak zainstalowaฤ Apache NiFi
Poniลผej znajduje siฤ krok po kroku proces instalacji Apache NiFi
Krok 1) Iลฤ do poลฤ czenie,
i kliknij โKontynuuj subskrypcjฤโ
Krok 2) Na nastฤpnej stronie
Kliknij โAkceptuj warunkiโ
Krok 3) Zobaczysz tฤ stronฤ,
Dziฤkujemy za subskrypcjฤ tego produktu! Przetwarzamy Twojฤ proลbฤ.
Krok 4) Odลwieลผ stronฤ po 5 minutach.
Kliknij โKontynuuj konfiguracjฤโ
Krok 5) Na nastฤpnej stronie
Zachowaj ustawienia domyลlne i kliknij โKontynuuj uruchamianieโ
Krok 6) Na nastฤpnej stronie
Kliknij Uruchom. Moลผe byฤ konieczne utworzenie klucza
Krok 7) Zobaczysz ten komunikat o powodzeniu.
Gratulacje! Instancja tego oprogramowania zostaลa pomyลlnie wdroลผona na EC2!
Krok 8) Uwaga,
Identyfikator instancji i publiczny DNS instancji EC2
Krok 9) W grupie bezpieczeลstwa
Dodaj reguลฤ dotyczฤ cฤ caลego ruchu dla ruchu przychodzฤ cego i wychodzฤ cego
Krok 10) Aby uzyskaฤ dostฤp do Nifi,
po prostu uลผyj adresu URL
http://publicdns:8080/nifi
W naszym przypadku tak siฤ dzieje
http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/
System Rezerwacji Sal Smart Spacesยฎ rozwiฤ zuje problem zarzฤ dzania rezerwacjami sal, biurek i przestrzeni wspรณlnych. Zmiany w ostatniej chwili sฤ od razu widoczne, co uลatwia pracฤ recepcji i uลผytkownikom. Kalendarz w czasie rzeczywistym pokazuje wolne zasoby, ich parametry, a nawet zaplanowane sprzฤ tanie.: Admin
Hasลo: Identyfikator instancji
Krok 11) Zobaczysz,
Ekran gลรณwny NiFi
Przypadki uลผycia Nifi
Poniลผej znajduje siฤ lista przypadkรณw uลผycia Apache NiFi:
| Przemysลowe | Stosowanie |
|---|---|
| Ubezpieczenia |
|
| HealthCare |
|
| Telekomunikacja |
|
| Produkcja |
|
| Przemysล naftowy i gazowy |
|
| Usลugi finansowe |
|
Najlepsze praktyki Uruchamianie Apache NiFi
- Idealny do oddzielenia ลrodowisk testowych/programistycznych/produkcyjnych w NiFi
- Powinieneล podzieliฤ przepลyw na grupy procesรณw
- Stosuj konwencjฤ nazewnictwa, uลผywaj komentarzy i etykiet
- Uporzฤ dkuj swoje projekty w trzech czฤลciach: pozyskiwanie, testowanie i monitorowanie
- Uลผyj unikalnych nazw zmiennych
Wada Nifi
- Potrzebujesz precyzyjnych kontroli bezpieczeลstwa i zgodnoลci
- Pracujฤ c z Apache NiFi, musisz bardzo dobrze znaฤ podstawowy system
- Musi utrzymywaฤ ลaลcuch dostaw danych
- Transport / Wiadomoลci mogฤ nie wystarczyฤ
- Potrzeby dostฤpu do danych przekraczajฤ dostฤpne zasoby do transportu
- Nie wszystkie dane sฤ tworzone jednakowo
- Autoryzacja na poziomie SSL i tematu moลผe nie wystarczyฤ
Podsumowanie
- Apache NiFi to oprogramowanie typu open source sลuลผฤ ce do automatyzacji i zarzฤ dzania przepลywem danych pomiฤdzy systemami
- Rozwiฤ zanie NiFi zostaลo zaprojektowane z myลlฤ o skalowaniu w klastrach, ktรณre gwarantujฤ dostarczanie danych
- Nifi byล rozwijany w NSA przez ponad osiem lat
- Po pobraniu danych ze ลบrรณdeล zewnฤtrznych sฤ one reprezentowane jako FlowFile w architekturze Apache NiFi.
- FlowFile, procesor, kontroler, serwer WWW, poลฤ czenie, ciลnienie zwrotne, repozytorium to waลผne elementy architektury NiFi
- Jฤzyk wyraลผeล NiFi obsลuguje kaลผde dziaลajฤ ce urzฤ dzenie Java
- Moลผesz ลatwo zainstalowaฤ NiFi na AWS
- NiFi jest wykorzystywane w rรณลผnych branลผach, takich jak miฤdzy innymi opieka zdrowotna, ubezpieczenia, telekomunikacja, produkcja, finanse, ropa i gaz
- Najlepsza praktyka polega na podzieleniu projektรณw na trzy czฤลci: pozyskiwanie, testowanie i monitorowanie











