一年前的《彩虹橋架構演進之路》側(cè)重探討了穩(wěn)定性和功能性兩個方向。在過去一年中,盡管業(yè)務需求不斷增長且流量激增了數(shù)倍,彩虹橋仍保持著零故障的一個狀態(tài),算是不錯的階段性成果。而這次的架構演進,主要分享一下近期針對性能層面做的一些架構調(diào)整和優(yōu)化。其中最大的調(diào)整就是 Proxy-DB 層的線程模式從 BIO 改造成了性能更好的 NIO。下面會詳細介紹一下具體的改造細節(jié)以及做了哪些優(yōu)化。
閱讀本文預計需要 20~30 分鐘,整體內(nèi)容會有些枯燥難懂,建議閱讀前先看一下上一篇彩虹橋架構演進的文章(彩虹橋架構演進之路)以及 MySQL 協(xié)議相關基礎知識。
先來復習一下彩虹橋的全景架構圖:
圖片
針對 Proxy 這一層,可以大致分成 Frontend、Core、Backend 三層:
Frontend-服務暴露層:使用 Netty 作為服務器,按照 MySQL 協(xié)議對接收&返回的數(shù)據(jù)進行編解碼。
Core-功能&內(nèi)核層:通過解析、改寫、路由等內(nèi)核能力實現(xiàn)數(shù)據(jù)分片、讀寫分離、影子庫路由等核心功能。
Backend-底層DB交互層:通過 JDBC 實現(xiàn)與數(shù)據(jù)庫交互、對結果集改列、歸并等操作。
這里 Core 層為純計算操作,而 Frontend、Backend 都涉及 IO 操作,F(xiàn)rontend 層使用 Netty 暴露服務為 NIO 模式,但是 Backend 使用了數(shù)據(jù)庫廠商提供的傳統(tǒng) JDBC 驅(qū)動,為 BIO 模式。所以 Proxy 的整體架構還是 BIO 模式。在 BIO 模型中,每個連接都需要一個獨立的線程來處理。這種模型有一些明顯的缺點:
我們看最簡單的一個場景:在 JDBC 在發(fā)起請求后,當前線程會一直阻塞直到數(shù)據(jù)庫返回數(shù)據(jù),當出現(xiàn)大量慢查或者數(shù)據(jù)庫出現(xiàn)故障時,會導致大量線程阻塞,最終雪崩。在上一篇彩虹橋架構演進文章中,我們做了一些改進來避免了 BIO 模型下的一些問題,比如使用線程池隔離來解決單庫阻塞導致全局雪崩的問題。
圖片
但是隨著邏輯庫數(shù)量的增多,最終導致 Proxy 的線程數(shù)膨脹。系統(tǒng)的可伸縮性和吞吐量都受到了挑戰(zhàn)。因此有必要將現(xiàn)有的基于 JDBC 驅(qū)動的阻塞式連接升級為采用 NIO(非阻塞 I/O)方式連接數(shù)據(jù)庫。
想把 Proxy 整體架構從 BIO->NIO,最簡單的方式就是把傳統(tǒng)的 BIO 數(shù)據(jù)庫驅(qū)動 JDBC 換成 NIO 的數(shù)據(jù)庫驅(qū)動,但是在調(diào)研過后發(fā)現(xiàn)開源的 NIO 驅(qū)動并不多,而且基本上沒有什么最佳實踐。最后在參考 ShardingSphere 社區(qū)之前做的調(diào)研后(https://github.com/apache/shardingsphere/issues/13957),決定使用 Vertx 來替換 JDBC。最開始使用 Vert.x 的原因,第一是 Vertx 的異步編碼方式更友好,編碼復雜度相對較低,第二是因為它實現(xiàn)了主流數(shù)據(jù)庫的驅(qū)動。但最終的結果不盡人意,由于 Vertx 相關抽象化的架構,導致鏈路較長時,整個調(diào)用棧深非常夸張。最終壓測出來的吞吐量提升只有 5% 不到,而且存在很多兼容性問題。于是推倒重來,決定自研數(shù)據(jù)庫驅(qū)動和連接池。
由于 JDBC 驅(qū)動會自動把 MySQL 的字節(jié)數(shù)據(jù)編解碼成 Java 對象,然后 Proxy 再把這些結果集經(jīng)過一些加工(元信息修正、結果集歸并)后再進行編碼返回給上游。如果自研驅(qū)動的話,就可以把編解碼流程控制的更細致一些,把 Proxy 不需要加工的數(shù)據(jù)直接轉(zhuǎn)發(fā)給上游,跳過無意義的編解碼。后面會介紹一下哪些場景是不需要 Proxy 對結果集進行加工的。
圖片
圖片
所以首先我們需要了解一下,如何與數(shù)據(jù)庫進行數(shù)據(jù)交互,以 MySQL 為例,使用 Netty 連接 MySQL,簡單的交互流程如下。
圖片
使用 Netty 與 MySQL 連接建立后,我們要做的就是按照 MySQL 協(xié)議規(guī)定的數(shù)據(jù)格式,先鑒權后再發(fā)送具體的命令包即可。下面是 MySQL 官方文檔中鑒權流程和命令執(zhí)行流程:
下面就是按照 MySQL 的文檔,去實現(xiàn)編解碼 Handle,我們簡單看一下實現(xiàn)的代碼。
圖片
就是針對 MySQL 返回的數(shù)據(jù)包解碼,根據(jù)長度解析出 Palyload 封裝成 MySQLPacketPayload 傳給對應的 Handle 處理。
把具體的命令類轉(zhuǎn)換成具體的 MySQL 數(shù)據(jù)包,這里的 MySQLPacket 有多個實現(xiàn)類,跟 MySQL的Command 類型一一對應。
現(xiàn)在還需要一個類似 java.sql.Connection 的實現(xiàn)類,來組裝 MySQLPacket 并寫入到 Netty 通道中,并且解析編碼后的 MySQLPacketPayload 轉(zhuǎn)換成 ResultSet。
圖片
圖片
看起來比較簡單,交互流程和傳統(tǒng)的 JDBC 幾乎一樣,但是由于現(xiàn)在是異步化流程,所有的 Response 都是通過回調(diào)返回,所以這里有 2 個難點:
首先 NettyDbConnection 引入了一個無鎖化非阻塞隊列 ConcurrentLinkedQueue。
圖片
在發(fā)送 Command 時,如何沒有正在進行中的 Command,則直接發(fā)送,如果有正在進行中的 Command,直接扔到隊列中,等待上一條 Command 處理完成后推動下一條命令的執(zhí)行。保證了單個連接命令串行化。
其次,NettyDbConnection 在執(zhí)行命令時,傳入一個 Promise,在 MySQL 數(shù)據(jù)包全部返回后,這個 Promise 將會被設置完成,即可于發(fā)起命令的 Request 一一綁定。
圖片
前面介紹了 NettyDbConnection 這個類,實現(xiàn)了與 MySQL 的交互,并且提供了執(zhí)行 SQL 的高級 API,但實際使用過程中,不可能每次都創(chuàng)建一個連接執(zhí)行完 SQL 就關閉。所以需要對 NettyDbConnection 進行池化,統(tǒng)一管理連接的生命周期。其功能類似于傳統(tǒng)連接池 HikariCP,在完成基本能力的基礎上,做了很多性能優(yōu)化。
這里除了 EventLoop 親和性,其他幾個功能只要用過傳統(tǒng)的數(shù)據(jù)庫連接池應該都比較熟悉,這里不做過多展開。這里主要針對 EventLoop 親和性展開介紹一下。
在文章開頭我們說到 Proxy 的三層模塊,F(xiàn)rontend、Core、Backend,如果現(xiàn)在我們把 Backend 層于數(shù)據(jù)庫交互的組件換成了我們自研的驅(qū)動,那么 Proxy 就即是Netty Server,也是Netty Client,所以 Frontend 和 Backend 可以共用一個 EventLoopGroup。為了降低線程上下文切換,在單個請求從 Frontend 接收、經(jīng)過 Core 層計算后轉(zhuǎn)發(fā)到 MySQL ,再到接收 MySQL 服務響應,以及最終的回寫給 Client 端,這一些列操作盡量放在一個 EventLoop 線程中處理。
圖片
具體的做法就是 Backend 在選擇與數(shù)據(jù)庫連接時,優(yōu)先選擇與當前 EventLoop 綁定的連接。也就是前面提到的 EventLoop 親和性,這樣就能保證大部分場景下一次請求從頭到尾都由同一個 EventLoop 處理,下面我們看一下具體的代碼實現(xiàn)。
在 NettyDbConnectionPool 類中使用一個 Map 存儲連接池中的空閑連接,Key 為 EventLoop,Value 為當前 EventLoop 綁定的空閑連接隊列。
圖片
在獲取時,優(yōu)先獲取當前 EventLoop 綁定的連接,如果當前 EventLoop 未綁定連接,則會借用其他 EventLoop 的連接。
圖片
為了提高 EventLoop 命中率,需要注意幾點配置:
下面放一張壓測環(huán)境(8C16G、連接池最大連接數(shù) 10~30)的命中率監(jiān)控,大部分保持在 75% 左右。
圖片
前面說到,有部分 SQL 的結果集是不需要 Proxy 進行加工的,也就是可以直接把 MySQL 返回的數(shù)據(jù)流原封不動轉(zhuǎn)發(fā)給上游,直接省去編解碼操作。那什么 SQL 是不需要 Proxy 進行加工的呢,我們舉個例子說明一下。
假設邏輯庫 A 里面有一張表 User 做了分庫,分了 2 個庫 DB1 和 DB2,分片算法是 user_id%2。
SELECT id, name FROM user WHERE user_id in (1, 2)
SELECT id, name FROM user WHERE user_id in (1)
很顯然 SQL 1由于有 2 個分片 Value,最終匹配到了 2 個節(jié)點,SQL 2 只會匹配到 1 個節(jié)點。
圖片
SQL 1 由于需要對結果集進行歸并,所以無法跳過編解碼,SQL 2 不需要對結果集歸并,只需要把結果集中的列定義數(shù)據(jù)做修正后,真正的 Row 數(shù)據(jù)無需處理,這種情況就可以把 Row 數(shù)據(jù)直接轉(zhuǎn)發(fā)至上游。
Backend 層用自研連接池+驅(qū)動替換原先的 HikariCP+JDBC 后,從 Frontend-Core-Backend 全鏈路涉及到阻塞的操作需要全部替換成異步化編碼,也就是通過 Netty 的 Promise 和 Future 來實現(xiàn)。
圖片
由于部分場景拿到 Future 時,可能當前 Future 已經(jīng)完成了,如果每次都是無腦的加 Listener 會讓調(diào)用棧加長,所以我們定義了一個通用的工具類來處理 Future,即 future.isDone() 時直接執(zhí)行,反之才會 addListener,最大化降低整個調(diào)用棧的深度。
經(jīng)過幾輪性能壓測后,NIO架構相較于BIO架構性能有較大提升:
NIO 架構的改造工作量相當巨大,中間也經(jīng)歷了一些曲折,但是最終的結果令人滿意。得益于 ShardingShpere 本身內(nèi)核層面的高性能加上本次 NIO 改造后,彩虹橋在 DAL 中間件性能層面基本上可以算是第一梯隊了。
本文鏈接:http://www.tebozhan.com/showinfo-26-16532-0.html彩虹橋架構演進之路-性能篇
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 聽說你會架構設計?來,弄一個微信群聊系統(tǒng)
下一篇: 使用Ray輕松進行Python分布式計算