Apache NiFi bemutató

⚡ Okos összefoglaló

Az Apache NiFi bemutatója bemutatja a nyílt forráskódú adatintegrációs platformot, amelyet a rendszerek közötti automatizált, megbízható áramláshoz terveztek. LessAz anyagok kiterjednek az architektúrára, a processzorokra, a terminológiákra, a funkciókra, a telepítésre, a használati esetekre, az előnyökre, a hátrányokra és az éles telepítések bevált gyakorlataira.

  • 🔁 Áramlásalapú tervezés: A NiFi vizuális vásznat használ az adatfolyamok felépítéséhez konfigurálható processzorokból, amelyeket útválasztási sorok kötnek össze.
  • 🏗️ Megosztott Architectúra: A webszerver, az áramlásvezérlő és a tárházak együttesen biztosítják a skálázható, hibatűrő adatmozgatást.
  • 🇧🇷 Gazdag processzorkönyvtár: Több száz processzor kezeli a Kafka, MQTT, REST API-kat, adatbázisokat, fájlrendszereket és felhőalapú forrásokat.
  • 🔒 Erős biztonság: A TLS, a többfelhasználós hitelesítés és a titkosított adattárak biztosítják a vállalati adatkezelést.
  • 📊 Végponttól végpontig eredet: Minden FlowFile traca forrástól a célállomásig audit, hibakeresés és megfelelőség céljából.
  • 🤖 AI-folyamatra kész: Kombinálja a NiFi-t LLM végpontokkal és vektoros adatbázisokkal a visszakereséssel kiegészített generálási munkafolyamatokhoz.

Apache NiFi bemutató

Apache NiFi oktatóanyag összefoglalója

Ez az apache NiFi oktatóanyag a semmiből lefedi az összes alapvető és haladó témát. Megtanulja az olyan fogalmakat, mint a NiFi definíciója, története, architektúrája, jellemzői, telepítési folyamata, használati esetei. Azt is megtudhatja, hogy miért kell az apache NiFi-t használni, és megtudhatja az apache NiFi futtatásának legjobb gyakorlatait.

Mi az Apache NiFi?

Apache NiFi egy nyílt forráskódú szoftver a rendszerek közötti adatáramlás automatizálására és kezelésére. Ez egy hatékony és megbízható rendszer az adatok feldolgozására és terjesztésére. Webalapú felhasználói felületet biztosít az adatfolyamok létrehozásához, figyeléséhez és vezérléséhez. Rendelkezik egy nagymértékben konfigurálható és módosítható adatfolyam-folyamattal az adatok futás közbeni módosításához.

Az Apache NiFi egyszerűen bővíthető egyedi komponensek fejlesztésével.

Miért érdemes Apache NIfi-t használni?

Íme az Apache Nifi használatának okai:

  • Lehetővé teszi az adatfeldolgozást, hogy adatokat vonjon be a NiFi-be, számos adatforrásból, és folyamatfájlokat hozzon létre
  • Valós idejű vezérlést kínál, amely segít kezelni az adatok mozgását bármely forrás és cél között
  • Vizualizálja a DataFlow-t vállalati szinten
  • Biztosítson közös szerszámokat és bővítményeket
  • Lehetővé teszi, hogy kihasználja a meglévő könyvtárak és Java ökoszisztéma funkcionalitása
  • Segít a szervezeteknek integrálni a Nifi-t meglévő infrastruktúrájukkal
  • A NiFi-t úgy tervezték, hogy a fürtökben skálázható legyen, amelyek garantált adattovábbítást kínálnak
  • Vizualizálja és figyelje a teljesítményt és a viselkedést egy folyamatközleményben, amely betekintést és beépített dokumentációt kínál
  • Segíti az összetevők külön-külön vagy csoportszintű indítását és leállítását
  • Segít meghallgatni, lekérni, felosztani, összesíteni, irányítani, átalakítani és áthúzni az adatfolyamot

Az Apache NiFi története

  • Az NSA-nál több mint nyolc évig fejlesztették
  • 2014- Az Apache szoftvernek adományozták Foundation
  • 2015 – A NiFi az Apache Project Suite hivatalos részévé vált
  • Azóta 6-8 hetente az Apache NiFi új frissítést ad ki

NiFi Architectúra

Az Apache NiFi jól átgondolt architektúrával rendelkezik. A külső forrásokból származó adatok lekérése után FlowFile-ként jelennek meg az Apache NiFi architektúrán belül.

NiFi Architectúra
NiFi Architectúra

Íme a NiFi architektúra kulcsfontosságú összetevői

Nifi komponens Leírás
FlowFile A FlowFile eredeti adat metainformációkkal. Nemcsak CSV vagy más rekord alapú adatok feldolgozását teszi lehetővé, hanem képeket, videókat, hangot vagy bármilyen más bináris adatot is.
Flowfile processzor Elvégzi azt a munkát, amely az adatáramlás építőköveként működik a NiFi-ben.
Áramlásszabályozó Nyilvántartást vezet a folyamatok összekapcsolásáról. Kezeli az összes folyamat által használt szálakat és allokációikat.
web szerver A webszerver a NiFi HTTP-alapú parancsait és API-ját tartalmazza.
Kiterjesztés Számos NiFi-bővítmény létezik, amelyek a JVM-en belül működnek és futnak.
csatlakozás Kapcsolatként működik a sort tartalmazó processzorok és a kapcsolat(ok) között, amely befolyásolja az adatok továbbítását.
Ellennyomás A sorban tárolható folyamatfájlok mennyiségének vagy adatméretének szabályozásával akadályozza meg a rendszer túlterheltségét.
Folyamat csoport A folyamatcsoport folyamatok és kapcsolataik összessége, amely portok segítségével fogad és küld adatokat.
Flowfile Repository A FlowFile adattárban a NiFi tárolja a következőket: track, amely azt jelzi, hogy milyen részletekkel rendelkezik egy adott, a folyamatban aktív FlowFile-ról.
Tartalomtár A Content Repository egy olyan terület, ahol az adott FlowFile tényleges tartalombájtjai léteznek.
Származási Adattár A származási adattár egy olyan terület, ahol minden származási esemény adatot összegyűjtenek.

Apache NiFi funkciók

  • A NiFi támogatja az összes sorban álló adat pufferelését, és ellennyomást biztosít, mivel ezek a sorok elérhetik a meghatározott határokat
  • A NiFi lehetővé teszi egy vagy több prioritási séma beállítását
  • Számos adatforráshoz biztosít csatlakozási processzorokat
  • Támogatja az összes működő eszközt Java
  • Ideális korlátozott csatlakozási lehetőséggel rendelkező helyekhez
  • Támogatás a hibaelhárításhoz és az áramlásoptimalizáláshoz
  • Szerepalapú hitelesítést/engedélyezést kínál
  • Lehetővé teszi az egyes fájlok letöltését, helyreállítását és visszajátszását
  • Építse fel processzorait, vezérlőszolgáltatásait és még sok mást
  • Biztosítsa a tartalom titkosítását, a kommunikációt biztonságos protokollokon keresztül
  • Gyors fejlesztést és hatékony tesztelést tesz lehetővé
  • Lehetővé teszi egyszerű egyfunkciós komponensek fejlesztését, amelyek újrafelhasználhatók és kombinálhatók összetettebb áramlások létrehozásához
  • Lehetővé teszi az osztálybetöltő elkülönítését a függőségek könnyebb kezelése érdekében

Az Apache NiFi telepítése

Az alábbiakban lépésről lépésre bemutatjuk az Apache NiFi telepítésének folyamatát

Step 1) Tovább a kapcsolat,

és kattintson a „Tovább a feliratkozásra” gombra

Telepítse az Apache NiFi-t

Step 2) A következő oldalon

Kattintson a „Feltételek elfogadása” gombra

Telepítse az Apache NiFi-t

Step 3) Látni fogja ezt az oldalt,

Köszönjük, hogy feliratkozott erre a termékre! Kérelmét feldolgozzuk.

Telepítse az Apache NiFi-t

Step 4) Frissítse az oldalt 5 perc múlva.

Kattintson a „Tovább a konfigurációhoz” gombra

Telepítse az Apache NiFi-t

Step 5) A következő oldalon

Tartsa meg az alapértelmezett beállításokat, és kattintson a „Tovább az indításhoz” gombra.

Telepítse az Apache NiFi-t

Step 6) A következő oldalon

Kattintson az Indítás gombra. Lehet, hogy kulcsot kell létrehoznia

Telepítse az Apache NiFi-t

Step 7) Látni fogja ezt a sikerüzenetet.

Gratulálok! Ennek a szoftvernek egy példánya sikeresen telepítve van az EC2-n!

Telepítse az Apache NiFi-t

Step 8) Jegyzet,

Az EC2 példány példányazonosítója és nyilvános DNS-e

Telepítse az Apache NiFi-t

Step 9) A biztonsági csoportban

Adja hozzá az összes forgalmi szabályt a bejövő és a kimenőhöz

Telepítse az Apache NiFi-t

Step 10) A Nifi eléréséhez

egyszerűen használd a URL

http://publicdns:8080/nifi

A mi esetünkben azzá válik

http://ec2-100-26-156-57.compute-1.amazonaws.com:8080/nifi/

használó:admin

Jelszó: Példányazonosító

Telepítse az Apache NiFi-t

Step 11) Meglátod,

NiFi kezdőképernyő

Telepítse az Apache NiFi-t

Nifi használati esetek

Az alábbiakban felsoroljuk az Apache NiFi használati eseteit:

Ipar Használat
Biztosítás
  • Kockázat- és kockázatelemzés
  • Claims Analytics
  • Használat alapú biztosítás
  • Új termék fejlesztés
Egészségügy
  • Egyetlen nézet a páciensről
  • Valós idejű életjel-figyelés
  • EMR optimalizálás
  • Ellátási lánc optimalizálása
Távközlés
  • Az ügyfél egyetlen nézete
  • CDR elemzés
  • Dinamikus sávszélesség-kiosztás
Gyártás
  • Megelőző karbantartás
  • Ellátási lánc optimalizálása
  • Minőség-ellenőrzés
Olaj- és gázipar
  • Valós idejű megfigyelés
  • Egyetlen nézet a OperaCIÓ
  • Prediktív karbantartás
  • Archive & Analytics
  • Strukturálatlan adatosztályozás
Pénzügyi szolgáltatások
  • Pénzmosás elleni
  • Csalások felderítése
  • Kockázat-adatkezelés

Bevált gyakorlatok Apache NiFi futtatása

  • Ideális a tesztelési/fejlesztői/gyártási környezetek szétválasztására NiFi-ben
  • A folyamatot folyamatcsoportokra kell bontania
  • Használjon elnevezési konvenciót, használjon megjegyzéseket és címkéket
  • Szervezze projektjeit három részre: feldolgozás, tesztelés és megfigyelés
  • Használjon egyedi neveket a változókhoz

A Nifi hátránya

  • Pontos biztonsági és megfelelőségi ellenőrzésekre van szükség
  • Az Apache NiFi-vel végzett munka során nagyon jól ismernie kell a mögöttes rendszert
  • Fenn kell tartania az adatok felügyeleti láncát
  • Előfordulhat, hogy a szállítás/üzenetküldés nem elég
  • Az adathozzáférési igény meghaladja a szállításhoz rendelkezésre álló erőforrásokat
  • Nem minden adat egyformán jön létre
  • Előfordulhat, hogy az SSL és témaszintű engedélyezés nem elegendő

GYIK

A NiFi vizuális, alacsony kódú adatfolyamot biztosít beépített útválasztással és átalakítással. A Kafka egy üzenetküldési gerinchálózat; az Airflow pedig kötegelt feladatokat vezérel. A NiFi gyakran mozgat adatokat a Kafka és a downstream célállomások között.

Igen. A NiFi betölti a streamelt adatokat, meghívja a modell végpontjait, és a predikciókat a tárolóba irányítja. Kafka, MiNiFi és vektoros adatbázisok segítségével végponttól végpontig terjedő mesterséges intelligenciát és visszakereséssel kiegészített generálási munkafolyamatokat épít.

A mesterséges intelligencia eszközei processzorláncokat javasolnak, kifejezésnyelvi kódrészleteket generálnak, és folyamatmintákat magyaráznak el. Felgyorsítják a fejlesztést, és segítenek az újoncoknak megérteni a NiFi konfigurációját és útválasztási logikáját.

A FlowFile a NiFi-n keresztül mozgó adat. Tartalmat és attribútumokat tartalmaz, például metaadatokat, származási és útvonalinformációkat, amelyeket a processzorok használnak az adatfolyamon belüli döntések meghozatalához.

A NiFi támogatja a TLS-t, a többfelhasználós hitelesítést, az LDAP-t, a Kerberos-t, az OIDC-t és a titkosított adattárakat. A szerepköralapú szabályzatok korlátozzák, hogy kik tekinthetik meg, módosíthatják vagy kezelhetik az adott adatfolyamokat.

A NiFi vízszintesen klaszterekkel, függőlegesen magok hozzáadásával és ellennyomású sorokon keresztül skálázódik. A peremhálózaton lévő MiNiFi ágensek egy központi NiFi klaszterbe továbbítják az adatokat.

A NiFi egy teljes értékű szerver gazdag webes felhasználói felülettel az adatfolyamatok tervezéséhez. A MiNiFi egy könnyű ügynök, amely a peremhálózaton fut, és adatokat továbbít a NiFi-nek.

A kezdők napok alatt felépíthetik első munkafolyamatukat. A klaszterezés, a biztonság, az egyedi processzorok és a nagy áteresztőképességű finomhangolás elsajátítása két-négy hónapnyi éles projekttapasztalatot igényel.

Foglald össze ezt a bejegyzést a következőképpen: