AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

從 Pulsar Client 的原理到它的監控面板

來源: 責編: 時間:2023-08-05 11:44:50 4434觀看
導讀背景前段時間業務團隊偶爾會碰到一些 Pulsar 使用的問題,比如消息阻塞不消費了、生產者消息發送緩慢等各種問題。雖然我們有個監控頁面可以根據 topic 維度查看他的發送狀態,比如速率、流量、消費狀態等信息。但也有幾

ETf28資訊網——每日最新資訊28at.com

背景

前段時間業務團隊偶爾會碰到一些 Pulsar 使用的問題,比如消息阻塞不消費了、生產者消息發送緩慢等各種問題。ETf28資訊網——每日最新資訊28at.com

雖然我們有個監控頁面可以根據 topic 維度查看他的發送狀態,比如速率、流量、消費狀態等信息。ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

但也有幾個問題:ETf28資訊網——每日最新資訊28at.com

  • 無法在應用維度查看他所依賴的所有  topic 的各種狀態。
  • 監控的信息還不夠,比如發送/消費延遲、發送/消費失敗等數據。

總之就是缺少一個全局的監控視角,通過這些指標可以很方便的分析出當時的運行情況。ETf28資訊網——每日最新資訊28at.com

基于這個需求經過一段時間的折騰,現在已經上線使用幾個月,目前比較穩定,效果圖如下:ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

現在就可以在每個應用的監控面板里看到自己使用了哪些 topic,分別的生產消費情況如何。ETf28資訊網——每日最新資訊28at.com

核心流程

要實現這些功能就得在應用的 metrics 中加入相關的監控信息,但官方的 Java client 是沒有暴露出這些指標的。ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

但 pulsar-client-go 是自帶了這些指標的ETf28資訊網——每日最新資訊28at.com

由于 SDK 不支持所以只能自己想辦法實現了,為此其實有兩種實現方案:ETf28資訊網——每日最新資訊28at.com

  • 魔改 Java client,在需要監控的地方手動埋點指標。
  • 由于我們使用了 SkyWalking,所以可以編寫插件,以 agent 的方式獲取數據、埋點指標。

不過第一種方案有以下一些問題:ETf28資訊網——每日最新資訊28at.com

  • 需要自己維護一個代碼分支,還需要定期和官方保持一致,難免會出現代碼沖突。
  • 需要推動業務方進行依賴升級,線上有著幾百個應用,推動起來時間太慢。

第二種方案的好處就不言而喻了:ETf28資訊網——每日最新資訊28at.com

  • 升級無感知,只需要在我們的基礎鏡像中加上插件即可。
  • Java client 的版本也更容易統一。

Client 原理

但其實不管是哪種方案我們都得熟悉 Java Client 的實現原理,才能知道哪些數據是我們需要重點關注的,可以幫助我們更好的定位問題。ETf28資訊網——每日最新資訊28at.com

圖片ETf28資訊網——每日最新資訊28at.com


ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

本文重點不在于此,具體代碼就不仔細分析了。ETf28資訊網——每日最新資訊28at.com

從上圖可以看出,如果我們想要監控消費是否存在阻塞的情況,這幾個內部隊列是需要重點監控的,一旦他們出現堆積,那就會出現消費阻塞。ETf28資訊網——每日最新資訊28at.com

其實這些數據都可以通過。ETf28資訊網——每日最新資訊28at.com

org.apache.pulsar.client.api.ProducerStatsorg.apache.pulsar.client.api.ConsumerStats

這兩個接口獲取到生產者和消費者的大部分指標,只是這里還有一個小插曲。ETf28資訊網——每日最新資訊28at.com

那就是在獲取消費者隊列大小的時候,獲取到的數據一直為空。ETf28資訊網——每日最新資訊28at.com

最終經過源碼排查,原來是我們大量使用的 messageListener 在獲取隊列大小時有 bug,導致獲取到的數據一直都為 0.ETf28資訊網——每日最新資訊28at.com

相關的 issue 和 PR 可以在這兩個鏈接查看,問題原因和修復過程都有具體描述:https://github.com/apache/pulsar/issues/20076 https://github.com/apache/pulsar/pull/20245ETf28資訊網——每日最新資訊28at.com

但這個修復得在新版本才能使用,就導致我們現在的監控頁面一直顯示為空。ETf28資訊網——每日最新資訊28at.com

開發 SkyWalking 插件

然后就是開發一個 SkyWalking 的插件了,其實直接使用 SW 開發插件是上手 Java-Agent 比較快的方式。ETf28資訊網——每日最新資訊28at.com

SW 的 SDK 封裝了許多 agent 原生接口,使得開發起來非常容易;當然缺點也有,就是得集成整個 SW 的 agent。ETf28資訊網——每日最新資訊28at.com

這里我簡單介紹下這個插件的運行流程:ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

  • 在創建和刪除 consumer 的時候維護 consumerPool
  • 啟動一個定時任務,定期從這些 consumer 中獲取指標數據。

ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

當消費多分區 topic 時,為了能唯一標志一個 consumer,所以給每個消費者都加了一個 hashcode 的 label。ETf28資訊網——每日最新資訊28at.com

因為我們所有的 Java 技術棧都是使用的 Prometheus 的包來生成 metrics ,所以該插件也是使用該包生成的數據。ETf28資訊網——每日最新資訊28at.com

<dependency>    <groupId>io.prometheus</groupId>    <artifactId>simpleclient</artifactId>    <version>0.12.0</version>    <scope>provided</scope>  </dependency>

為了兼容一些特殊 Java 應用沒有該包時會啟動報錯,所以在初始化插件的時候需要檢測當前 classpath 下是否存在該依賴。ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

這些功能 SW 已經封裝好了,對我們來說也是開箱即用。ETf28資訊網——每日最新資訊28at.com

其實 SW 插件自己也是支持 metrics 的,由于我們只是使用了它的 trace 功能,所以這里就沒有使用它的 API。ETf28資訊網——每日最新資訊28at.com

關于開發一個 SW 插件的流程也比較簡單,可以參考官方文檔或者是一些現成的插件源碼。https://skywalking.apache.org/docs/skywalking-java/next/en/setup/service-agent/java-agent/java-plugin-development-guide/ETf28資訊網——每日最新資訊28at.com

總結

有了這個監控面板后,對于 Pulsar 客戶端內部的一些運行情況就不再是黑盒了,還可以基于此做一些報警,比如消費堆積、發送延遲過大等。ETf28資訊網——每日最新資訊28at.com

當然僅僅只有這個面板依然是不夠的,后續我們又開發了可以通過 messageId 查詢它的整個生命周期,包括:ETf28資訊網——每日最新資訊28at.com

  • 生產者、消費者信息
  • 消息生產時間
  • 推送時間
  • ack 時間等

ETf28資訊網——每日最新資訊28at.com

同時借助與 Pulsar-SQL 的能力,還能以列表的形式展示當前 topic 的消息列表。ETf28資訊網——每日最新資訊28at.com

ETf28資訊網——每日最新資訊28at.com

當然在實現這兩個功能的同時也踩了不少坑,提了幾個 PR ,后面在抽時間做具體的分享。ETf28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-91-0.html從 Pulsar Client 的原理到它的監控面板

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 一年經驗在二線城市面試后端的經驗分享

下一篇: 三言兩語說透設計模式的藝術-單例模式

標簽:
  • 熱門焦點
Top