Kafka 是一個(gè)開(kāi)源的分布式流式平臺(tái),它可以處理大量的實(shí)時(shí)數(shù)據(jù),并提供高吞吐量,低延遲,高可靠性和高可擴(kuò)展性。Kafka 的核心組件包括生產(chǎn)者(Producer),消費(fèi)者(Consumer),主題(Topic),分區(qū)(Partition),副本(Replica),日志(Log),偏移量(Offset)和代理(Broker)。Kafka 的主要特點(diǎn)有:
Kafka 最初是為分布式系統(tǒng)中海量日志處理而設(shè)計(jì)的。它可以通過(guò)持久化功能將消息保存到磁盤(pán)直到過(guò)期,并讓消費(fèi)者按照自己的節(jié)奏提取消息。與它的前輩不同(RabbitMQ、ActiveMQ),Kafka 不僅僅是一個(gè)消息隊(duì)列,它還是一個(gè)開(kāi)源的分布式流處理平臺(tái)。
Kafka 作為一款熱門(mén)的消息隊(duì)列中間件,具備高效可靠的消息異步傳遞機(jī)制,主要用于不同系統(tǒng)間的數(shù)據(jù)交流和傳遞。下面給大家介紹一下 Kafka 在分布式系統(tǒng)中的 7 個(gè)常用應(yīng)用場(chǎng)景。
日志收集是 Kafka 最初的設(shè)計(jì)目標(biāo)之一,也是最常見(jiàn)的應(yīng)用場(chǎng)景之一。可以用 Kafka 收集各種服務(wù)的日志,如 web 服務(wù)器、服務(wù)器日志、數(shù)據(jù)庫(kù)服務(wù)器等,通過(guò) Kafka 以統(tǒng)一接口服務(wù)的方式開(kāi)放給各種消費(fèi)者,例如 Flink、Hadoop、Hbase、ElasticSearch 等。這樣可以實(shí)現(xiàn)分布式系統(tǒng)中海量日志數(shù)據(jù)的處理與分析。
下圖是一張典型的 ELK(Elastic-Logstash-Kibana)分布式日志采集架構(gòu)。
流式處理是 Kafka 在大數(shù)據(jù)領(lǐng)域的重要應(yīng)用場(chǎng)景之一。可以用 Kafka 作為流式處理平臺(tái)的數(shù)據(jù)源或數(shù)據(jù)輸出,與 Spark Streaming、Storm、Flink 等框架進(jìn)行集成,實(shí)現(xiàn)對(duì)實(shí)時(shí)數(shù)據(jù)的處理和分析,如過(guò)濾、轉(zhuǎn)換、聚合、窗口、連接等。
淘寶、京東這樣的線上商城網(wǎng)站會(huì)通過(guò)用戶(hù)過(guò)去的一些行為(點(diǎn)擊、瀏覽、購(gòu)買(mǎi)等)來(lái)和相似的用戶(hù)計(jì)算用戶(hù)相似度,以此來(lái)給用戶(hù)推薦可能感興趣的商品。
下圖展示了常見(jiàn)推薦系統(tǒng)的工作流程。
這樣推薦系統(tǒng)就能夠持續(xù)改進(jìn)對(duì)每個(gè)用戶(hù)的推薦相關(guān)性。
Kafka 常用于傳輸監(jiān)控指標(biāo)數(shù)據(jù)。例如,大一點(diǎn)的分布式系統(tǒng)中有數(shù)百臺(tái)服務(wù)器的 CPU 利用率、內(nèi)存使用情況、磁盤(pán)使用率、流量使用等指標(biāo)可以發(fā)布到 Kafka。然后,監(jiān)控應(yīng)用程序可以使用這些指標(biāo)來(lái)進(jìn)行實(shí)時(shí)可視化、警報(bào)和異常檢測(cè)。
下圖展示了常見(jiàn)監(jiān)控報(bào)警系統(tǒng)的工作流程。
CDC(數(shù)據(jù)變更捕獲)用來(lái)將數(shù)據(jù)庫(kù)中的發(fā)生的更改以流的形式傳輸?shù)狡渌到y(tǒng)以進(jìn)行復(fù)制或者緩存以及索引更新等。
Kafka 中有一個(gè)連接器組件可以支持 CDC 功能,它需要和具體的數(shù)據(jù)源結(jié)合起來(lái)使用。數(shù)據(jù)源可以分成兩種:源數(shù)據(jù)源( data source ,也叫作“源系統(tǒng)”)和目標(biāo)數(shù)據(jù)源( Data Sink ,也叫作“目標(biāo)系統(tǒng)”)。Kafka 連接器和源系統(tǒng)一起使用時(shí),它會(huì)將源系統(tǒng)的數(shù)據(jù)導(dǎo)人到 Kafka 集群。Kafka 連接器和目標(biāo)系統(tǒng)一起使用時(shí),它會(huì)將 Kafka 集群的數(shù)據(jù)導(dǎo)人到目標(biāo)系統(tǒng)。
下圖展示了常見(jiàn) CDC 系統(tǒng)的工作流程。
Kafka 可以用來(lái)作為老系統(tǒng)升級(jí)到新系統(tǒng)過(guò)程中的消息傳遞中間件(Kafka),以此來(lái)降低遷移風(fēng)險(xiǎn)。
例如,在一個(gè)老系統(tǒng)中,有購(gòu)物車(chē) V1、訂單 V1、支付 V1 三個(gè)服務(wù),現(xiàn)在我們需要將訂單 V1 服務(wù)升級(jí)到訂單 V2 服務(wù)。
下圖展示了老系統(tǒng)遷移到新系統(tǒng)的工作流程。
事件溯源是 Kafka 在微服務(wù)架構(gòu)中的重要應(yīng)用場(chǎng)景之一。可以用 Kafka 記錄微服務(wù)間的事件,如訂單創(chuàng)建、支付完成、發(fā)貨通知等。這些事件可以被其他微服務(wù)訂閱和消費(fèi),實(shí)現(xiàn)業(yè)務(wù)邏輯的協(xié)調(diào)和同步。
簡(jiǎn)單來(lái)說(shuō)事件溯源就是將這些事件通過(guò)持久化存儲(chǔ)在 Kafka 內(nèi)部。如果發(fā)生任何故障、回滾或需要重放消息,我們都可以隨時(shí)重新應(yīng)用 Kafka 中的事件。
Kafka 最常見(jiàn)的應(yīng)用場(chǎng)景就是作為消息隊(duì)列。Kafka 提供了一個(gè)可靠且可擴(kuò)展的消息隊(duì)列,可以處理大量數(shù)據(jù)。
Kafka 可以實(shí)現(xiàn)不同系統(tǒng)間的解耦和異步通信,如訂單系統(tǒng)、支付系統(tǒng)、庫(kù)存系統(tǒng)等。在這個(gè)基礎(chǔ)上 Kafka 還可以緩存消息,提高系統(tǒng)的可靠性和可用性,并且可以支持多種消費(fèi)模式,如點(diǎn)對(duì)點(diǎn)或發(fā)布訂閱。
本文鏈接:http://www.tebozhan.com/showinfo-26-14822-0.htmlKafka 在分布式系統(tǒng)中的七大應(yīng)用場(chǎng)景
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 十個(gè)容易被忽視的FastAPI實(shí)用功能
下一篇: 從零開(kāi)始,運(yùn)用 Ruby 語(yǔ)言創(chuàng)建一個(gè) DNS 查詢(xún)