PDF JPG
本書有DRM加密保護,需使用HyRead閱讀軟體開啟
  • Apache NiFi|讓你輕鬆建立Data Pipeline
  • 點閱:33
  • 作者: 蘇揮原編著
  • 出版社:碁峰資訊
  • 出版年:2023
  • ISBN:9786263244160
  • EISBN:9786263245099 PDF
  • 格式:PDF,JPG

 ‧精簡的設定和範例介紹,快速掌握Apache NiFi核心精髓
  ‧整合當今主流的資料工程架構與相關服務說明
  ‧掌握資料流設計的特性與重點,踏出資料工程第一步

  本書介紹Apache NiFi這套服務工具,讀者可以於該服務設計自動化處理資料流(Data Pipeline)。所有的設計與設定都是以No Code與WEB UI方式處理,具備強大的操作互動性和易用性。另外支援大多數的資料載體,如:Relational Database、Document DB、Column-Based、DataWarehouse 、Message Queue等對接處理,並支援目前主流的三大雲平台-AWS(Amazon Web Service)、GCP(Google Cloud Platform)和Microsoft Azure,涵蓋大部分企業使用到的應用與服務,都可透過Apache NiFi做到一站式整合與資料流設計,確保資料處理邏輯以及流入和流出的方向和目的地。同時在面對大量資料處理時也可以運用高擴展的特性來平行執行,也能更細節地去追蹤資料的變化與狀態,最後做到完整的流程與錯誤控制以避免產生資料遺漏的窘境。


  本書會介紹當今在資料工程常見的架構,接著介紹Apache NiFi的架構與元件、建置流程與設定、操作方式、與外部服務的整合和應用、資料追蹤等各個資料工程常見的應用處理。最後會提及資料工程領域的發展和重點分析,讓對於這塊領域較陌生或有興趣的讀者們,除了可以在本書學到Apache NiFi的核心價值之外,也能意識到該領域的後續發展與重點,給予讀者具體方向進行未來的發展和準備。

作者簡介

蘇揮原 Mars Su

  畢業於國立臺灣科技大學資管所,目前於趨勢科技(TrendMicro)擔任Staff Data Engineer,參與過Streaming Data Pipeline架構設計與開發,以及NLP應用處理,熱衷於資料工程和機器學習等領域的研究與探索。


  過往曾獲得iTHome 2021鐵人賽AI&Data組冠軍以及擔任過PyCon APAC 2022講者。
  • 01 Data Pipeline 的重要性(第1-1頁)
    • 1.1 何謂 Data Pipeline?(第1-2頁)
    • 1.2 何謂 Streaming 和Batch?(第1-7頁)
    • 1.3 何謂 Lambda、Kappa 和 Delta 架構?(第1-9頁)
    • 1.4 為什麼需要使用 Apache NiFi?(第1-13頁)
    • 1.5 小結(第1-20頁)
  • 02 Apache NiFi 的架構與建置(第2-1頁)
    • 2.1 Apache NiFi 架構與規格(第2-2頁)
    • 2.2 Apache NiFi Data Flow 的版控 -NiFi Registry(第2-7頁)
    • 2.3 如何建置 Apache NiFi & NiFi Registry(第2-13頁)
    • 2.4 小結(第2-32頁)
  • 03 Apache NiFi Componenet 介紹(第3-1頁)
    • 3.1 FlowFile 的概念與操作(第3-3頁)
    • 3.2 Processor 的概念與操作(第3-20頁)
    • 3.3 Connection 的概念與操作(第3-29頁)
    • 3.4 Processor Group 的概念與操作(第3-35頁)
    • 3.5 Controller Service 的概念與操作(第3-48頁)
    • 3.6 Templates、Label 和 Funnel 的概念與操作(第3-56頁)
    • 3.7 NiFi Registry 的概念與操作(第3-65頁)
    • 3.8 小結(第3-75頁)
  • 04 Apache NiFi 的語法(第4-1頁)
    • 4.1 Variables 和 Parameters 的範圍與差異(第4-2頁)
    • 4.2 何謂NiFi Expression Language?(第4-12頁)
    • 4.3 小結(第4-29頁)
  • 05 Apache NiFi 和 DB 對接與實務(第5-1頁)
    • 5.1 何謂 RDB 和DocumentDB?(第5-2頁)
    • 5.2 如何對 MySQL 對接與操作?(第5-3頁)
    • 5.3 如何與 MongoDB 對接與操作?(第5-10頁)
    • 5.4 小結(第5-19頁)
  • 06 Apache NiFi 和 Message Queue 對接與實務(第6-1頁)
    • 6.1 什麼是Message Queue?(第6-2頁)
    • 6.2 什麼是Apache Kafka?(第6-4頁)
    • 6.3 如何對Apache Kafka 對接與操作?(第6-6頁)
    • 6.4 小結(第6-12頁)
  • 07 Apache NiFi 和 Cloud 對接與實務(第7-1頁)
    • 7.1 如何串接 AWS 服務?(第7-2頁)
    • 7.2 如何串接 GCP 服務?(第7-19頁)
    • 7.3 小結(第7-35頁)
  • 08 Apache NiFi 監控與追蹤邏輯(第8-1頁)
    • 8.1 訂定適當的監控指標(第8-2頁)
    • 8.2 Apache NiFi 的 Reporting Task 和整合應用(第8-7頁)
    • 8.3 Apache NiFi 的基本偵錯 Alert 機制(第8-15頁)
    • 8.4 小結(第8-20頁)
  • 09 資料工程的重要性與未來(第9-1頁)
    • 9.1 資料工程是什麼?為何重要?(第9-2頁)
    • 9.2 未來資料工程的變化與趨勢(第9-6頁)
紙本書 NT$ 580
單本電子書
NT$ 580

還沒安裝 HyRead 3 嗎?馬上免費安裝~
QR Code