當前位置：首頁 > 科技 > 軟件

Kafka 在分布式系統中的七大應用場景

來源：責編：時間：2023-10-25 15:48:58 378觀看

導讀Kafka 介紹Kafka 是一個開源的分布式流式平臺，它可以處理大量的實時數據，并提供高吞吐量，低延遲，高可靠性和高可擴展性。Kafka 的核心組件包括生產者（Producer），消費者（Consumer），主題（Topic），分區（Partition），副本（Replica），日志（Log），偏移

Kafka 介紹

Kafka 是一個開源的分布式流式平臺，它可以處理大量的實時數據，并提供高吞吐量，低延遲，高可靠性和高可擴展性。Kafka 的核心組件包括生產者（Producer），消費者（Consumer），主題（Topic），分區（Partition），副本（Replica），日志（Log），偏移量（Offset）和代理（Broker）。Kafka 的主要特點有：

數據磁盤持久化：Kafka 將消息直接寫入到磁盤，而不依賴于內存緩存，從而提高了數據的持久性和容錯性。
零拷貝：Kafka 利用操作系統的零拷貝特性，減少了數據在內核空間和用戶空間之間的復制，降低了 CPU 和內存的開銷。
數據批量發送：Kafka 支持生產者和消費者批量發送和接收數據，減少了網絡請求的次數和開銷。
數據壓縮：Kafka 支持多種壓縮算法，如 gzip，snappy，lz4 等，可以有效地減少數據的大小和傳輸時間。
主題劃分為多個分區：Kafka 將一個主題劃分為多個分區，每個分區是一個有序的消息隊列，分區之間可以并行地讀寫數據，提高了系統的并發能力。
分區副本機制：Kafka 為每個分區設置多個副本，分布在不同的代理節點上，保證了數據的冗余和一致性。其中一個副本被選為領導者（Leader），負責處理該分區的讀寫請求，其他副本為追隨者（Follower），負責從領導者同步數據，并在領導者失效時進行故障轉移。

Kafka 最初是為分布式系統中海量日志處理而設計的。它可以通過持久化功能將消息保存到磁盤直到過期，并讓消費者按照自己的節奏提取消息。與它的前輩不同（RabbitMQ、ActiveMQ），Kafka 不僅僅是一個消息隊列，它還是一個開源的分布式流處理平臺。

Kafka 的應用場景

Kafka 作為一款熱門的消息隊列中間件，具備高效可靠的消息異步傳遞機制，主要用于不同系統間的數據交流和傳遞。下面給大家介紹一下 Kafka 在分布式系統中的 7 個常用應用場景。

日志處理與分析
推薦數據流
系統監控與報警
CDC（數據變更捕獲）
系統遷移
事件溯源
消息隊列

1. 日志處理與分析

日志收集是 Kafka 最初的設計目標之一，也是最常見的應用場景之一。可以用 Kafka 收集各種服務的日志，如 web 服務器、服務器日志、數據庫服務器等，通過 Kafka 以統一接口服務的方式開放給各種消費者，例如 Flink、Hadoop、Hbase、ElasticSearch 等。這樣可以實現分布式系統中海量日志數據的處理與分析。

下圖是一張典型的 ELK（Elastic-Logstash-Kibana）分布式日志采集架構。

購物車服務將日志數據寫在 log 文件中。
Logstash 讀取日志文件發送到 Kafka 的日志主題中。
ElasticSearch 訂閱日志主題，建立日志索引，保存日志數據。
開發者通過 Kibana 連接到 ElasticSeach 即可查詢其日志索引內容。

2. 推薦數據流

流式處理是 Kafka 在大數據領域的重要應用場景之一。可以用 Kafka 作為流式處理平臺的數據源或數據輸出，與 Spark Streaming、Storm、Flink 等框架進行集成，實現對實時數據的處理和分析，如過濾、轉換、聚合、窗口、連接等。

淘寶、京東這樣的線上商城網站會通過用戶過去的一些行為（點擊、瀏覽、購買等）來和相似的用戶計算用戶相似度，以此來給用戶推薦可能感興趣的商品。

下圖展示了常見推薦系統的工作流程。

將用戶的點擊流數據發送到 Kafka 中。
Flink 讀取 Kafka 中的流數據實時寫入數據湖中其進行聚合處理。
機器學習使用來自數據湖的聚合數據進行訓練，算法工程師也會對推薦模型進行調整。

這樣推薦系統就能夠持續改進對每個用戶的推薦相關性。

3. 系統監控與報警

Kafka 常用于傳輸監控指標數據。例如，大一點的分布式系統中有數百臺服務器的 CPU 利用率、內存使用情況、磁盤使用率、流量使用等指標可以發布到 Kafka。然后，監控應用程序可以使用這些指標來進行實時可視化、警報和異常檢測。

下圖展示了常見監控報警系統的工作流程。

采集器（agent）讀取購物車指標發送到 Kafka 中。
Flink 讀取 Kafka 中的指標數據進行聚合處理。
實時監控系統和報警系統讀取聚合數據作展示以及報警處理。

4. CDC（數據變更捕獲）

CDC（數據變更捕獲）用來將數據庫中的發生的更改以流的形式傳輸到其他系統以進行復制或者緩存以及索引更新等。

Kafka 中有一個連接器組件可以支持 CDC 功能，它需要和具體的數據源結合起來使用。數據源可以分成兩種：源數據源（ data source ，也叫作“源系統”）和目標數據源（ Data Sink ，也叫作“目標系統”）。Kafka 連接器和源系統一起使用時，它會將源系統的數據導人到 Kafka 集群。Kafka 連接器和目標系統一起使用時，它會將 Kafka 集群的數據導人到目標系統。

下圖展示了常見 CDC 系統的工作流程。

源數據源將事務日志發送到 Kafka。
Kafka 的連接器將事務日志寫入目標數據源。
目標數據源包含 ElasticSearch、Redis、備份數據源等。

5. 系統遷移

Kafka 可以用來作為老系統升級到新系統過程中的消息傳遞中間件（Kafka），以此來降低遷移風險。

例如，在一個老系統中，有購物車 V1、訂單 V1、支付 V1 三個服務，現在我們需要將訂單 V1 服務升級到訂單 V2 服務。

下圖展示了老系統遷移到新系統的工作流程。

先將老的訂單 V1 服務進行改造接入 Kafka，并將輸出結果寫入 ORDER 主題。
新的訂單 V2 服務接入 Kafka 并將輸出結果寫入 ORDERNEW 主題。
對賬服務訂閱 ORDER 和 ORDERNEW 兩個主題并進行比較。如果它們的輸出結構相同，則新服務通過測試。

6. 事件溯源

事件溯源是 Kafka 在微服務架構中的重要應用場景之一。可以用 Kafka 記錄微服務間的事件，如訂單創建、支付完成、發貨通知等。這些事件可以被其他微服務訂閱和消費，實現業務邏輯的協調和同步。

簡單來說事件溯源就是將這些事件通過持久化存儲在 Kafka 內部。如果發生任何故障、回滾或需要重放消息，我們都可以隨時重新應用 Kafka 中的事件。

7. 消息隊列

Kafka 最常見的應用場景就是作為消息隊列。Kafka 提供了一個可靠且可擴展的消息隊列，可以處理大量數據。

Kafka 可以實現不同系統間的解耦和異步通信，如訂單系統、支付系統、庫存系統等。在這個基礎上 Kafka 還可以緩存消息，提高系統的可靠性和可用性，并且可以支持多種消費模式，如點對點或發布訂閱。

參考資料

https://levelup.gitconnected.com/top-8-kafka-use-cases-distributed-systems-d47fc733c7c1
https://blog.bytebytego.com/p/ep76-netflixs-tech-stack
https://www.confluent.io/learn/apache-kafka-benefits-and-use-cases/

本文鏈接：http://www.tebozhan.com/showinfo-26-14822-0.htmlKafka 在分布式系統中的七大應用場景

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：十個容易被忽視的FastAPI實用功能

下一篇：從零開始，運用 Ruby 語言創建一個 DNS 查詢

標簽：

熱門焦點

一加Ace2 Pro官宣：普及16G內存引領24G

一加官方今天繼續為本月發布的新機一加Ace2 Pro帶來預熱，公布了內存方面的信息。“淘汰 8GB ，12GB 起步，16GB 普及，24GB 引領，還有呢？#一加Ace2Pro#，2023 年 8 月，敬請期待。”同時
跑分安卓第一！Redmi K60至尊版8月發布！盧偉冰：目標年度性能之王

8月5日消息，Redmi K60至尊版將于8月發布，在此前舉行的戰略發布會上，官方該機將搭載搭載天璣9200+處理器，安兔兔V10跑分超177萬分，是目前安卓陣營最高的分數
摸魚心法第一章——和配置文件說拜拜

為了能摸魚我們團隊做了容器化，但是帶來的問題是服務配置文件很麻煩，然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比，簡單對比下獨立配置中心和k8s作為配
掘力計劃第 20 期：Flutter 混合開發的混亂之治

在掘力計劃系列活動第20場，《Flutter 開發實戰詳解》作者，掘金優秀作者，Github GSY 系列目負責人戀貓的小郭分享了Flutter 混合開發的混亂之治。Flutter 基于自研的 Skia 引擎
2天漲粉255萬，又一賽道在抖音爆火

來源：運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期，旅游賽道徹底火了：有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億；有的「博主」火了&m
三星電子Q2營收60萬億韓元存儲業務營收同比仍下滑超過50%

7月27日消息，據外媒報道，從三星電子所發布的財報來看，他們主要利潤來源的存儲芯片業務在今年二季度仍不樂觀，營收同比仍在大幅下滑，所在的設備解決方案
SN570 NVMe SSD固態硬盤價格與性能兼具

SN570 NVMe SSD固態硬盤是西部數據發布的最新一代WD Blue系列的固態硬盤，不僅閃存技術更為精進，性能也得到了進一步的躍升。WD Blue SN570 NVMe SSD的包裝外
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了，這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
利用職權私自解除被封帳號 Meta開除20多名員工

11月18日消息，據外媒援引知情人士表示，過去一年時間內，Facebook母公司Meta解雇或處罰了20多名員工以及合同工，指控這些人通過內部系統以不當方式重置用戶帳號，其

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

Kafka 在分布式系統中的七大應用場景

Kafka 介紹

Kafka 的應用場景

1. 日志處理與分析

2. 推薦數據流

3. 系統監控與報警

4. CDC（數據變更捕獲）

5. 系統遷移

6. 事件溯源

7. 消息隊列

參考資料

一加Ace2 Pro官宣：普及16G內存引領24G

跑分安卓第一！Redmi K60至尊版8月發布！盧偉冰：目標年度性能之王

摸魚心法第一章——和配置文件說拜拜

掘力計劃第 20 期：Flutter 混合開發的混亂之治

2天漲粉255萬，又一賽道在抖音爆火

三星電子Q2營收60萬億韓元存儲業務營收同比仍下滑超過50%

SN570 NVMe SSD固態硬盤價格與性能兼具

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

利用職權私自解除被封帳號 Meta開除20多名員工

最新推薦

猜你喜歡

熱門推薦

相關資訊