大家好,我是小?,一個漂泊江湖多年的 985 非科班程序員,曾混跡于國企、互聯網大廠和創業公司的后臺開發攻城獅。
在計算機科學領域,分布式系統是一門極具挑戰性的研究方向,也是互聯網應用中必不可少的優化實踐,而 CAP 理論和 BASE 理論則是分布式系統中的兩個關鍵的概念。
今天,小?將帶大家深入淺出地探討這些概念,幫助大家更好地理解分布式系統的奧秘。
首先,讓我們來談談分布式系統。你可以將分布式系統想象成一個龐大的計算機網絡,由多個計算機或服務器節點組成,它們可能分布在不同的地理位置上。
圖片
如圖所示,應用層的三個節點都發布在不同的城市。這些節點之間可以相互通信和協作,共同完成復雜的任務。
想象一下,你是一名團隊領導,有一項任務需要完成。如果你獨自一人完成,可能需要花費很長時間。
但如果你將任務分解成幾個子任務,分派給你的團隊成員,他們可以并行工作,更快地完成任務。這就是分布式系統的核心思想。
接下來,讓我們談談 CAP 理論,它是分布式系統設計中非常重要的一個原則。
CAP 是指在分布式系統中,Consistency(一致性)、Availability(可用性)和 Partition tolerance(分區容錯性)這三個基本原則。
一致性意味著無論你從分布式系統的哪個節點讀取數據,你都會獲得相同的數據副本,它確保了數據的準確性。
在分布式系統中,廣泛的一致性分為三種,分別是強一致性、弱一致性和最終一致性。
強一致性要求用戶在分布式系統中訪問數據時,不管是哪個節點的響應,數據都應該完全一致。
比如在訂單系統中球鞋庫存還剩 10 雙,張三剛買了一雙球鞋,數據更新完成后,接下來李四看到的球鞋數量就只有 9 雙,否則就可能會出現超賣的情況。
但這需要更多的時間和精力來協調,就像李四在買鞋的時候,必須排隊先等張三的購買動作結束后才可以繼續,效率較低。
弱一致性是指,在分布式系統中的數據被更新后,也允許讓后續的訪問拿到更新之前的老數據。
就像參加聚會一樣,每個人都有自己的鐘表。各自的鐘表時間可能會有點不一樣,但是這不影響大家聚在一起玩耍。
弱一致性提高了業務的效率,但有時會導致一些混亂,想象一下如果聚會人員的時間差太多,就會陷入長久的等待。
最終一致性是弱一致性的特殊形式,要求系統的數據更新完成,在一段時間以后,后續的所有訪問都能拿到最新的數據。
這就像朋友圈的消息傳播。當你發了一條消息,它不會立刻被所有朋友看到,但最終,每個人都會看到相同的消息。
一般的業務系統基于性價比的考量,絕大多數都是采用最終一致性作為分布式系統的設計思想。
而 CAP 理論里的一致性,則要求是強一致性。正如官方文檔中描述的那樣:All nodes see the same data at the same time,所有節點在同一時間內數據完全一致。
可用性意味著分布式系統的每個請求都應該得到響應,而且應該在有限的時間內完成。
可用性確保了系統的穩定性和可靠性,它描述的是系統能夠很好地為用戶服務,不會出現用戶操作失敗或者訪問超時的情況,影響用戶體驗。
即官方所說Reads and writes always succeed,服務在正常響應時間內一直可用。
分區容錯性是指系統能夠在網絡分區或通信故障的情況下繼續運行,也就是節點之間的網絡通信出現故障了,或者系統中的某一個節點出問題了,我們仍然需要保證業務系統可用。
即 The system continues to operate despite arbitrary message loss or failure of part of the system,分布式系統在遇到某個節點或者網絡分區故障時,仍然能夠對外提供滿足一致性或可用性的服務。
這時,有分布式基礎的同學可能就會問了,CAP 理論確實很重要,但是這三個特性似乎不能同時滿足,是吧?
沒錯,這就是 CAP 理論的核心觀點。
CAP 理論告訴我們,在一個分布式系統中,我們最多只能同時滿足其中 2 個特性,而無法同時滿足 3 個。
圖片
為什么 C,A,P 三者不可兼得?首先,我們得知道,在分布式系統中,由于網絡不可靠,為了保證服務可以時刻對外提供服務,所以分區容錯性是一定要保證的。
試想如果只有一個分區,談分布式就沒有意義了。而多個分區,一定會有分區的故障問題,分布式系統中保證分區容錯就變成最基本的訴求了。
所以現在我們只需考慮在分區容錯的基礎上,能否同時滿足一致性和可用性,我們可以用反證法來證明。
假設現在有兩個分區 P1 和 P2,分區上都有同一份數據 D1 和 D2, 現在它們是完全相同的。
圖片
接下來,有一個請求 1 訪問了 P1,更改了 D1 上的數據。然后又有一個請求 2 訪問了 P2,去訪問 D2 的同一份數據。
這時,我們需要權衡。
如果先保證滿足一致性和分區容錯,即 CP。
這個過程很容易出現:D1 已經更新數據,但是查詢 D2 時,數據返回的還是老數據。
為了保證 D2 和 D1 數據完全一致,必須在更新 D1 數據時給 P2 上的 D2 數據上鎖,等待 D1 更新完成后再同步更新 D2。
這個過程中,鎖住的 D2 就沒法給請求 2 實時響應,也就是違背了 P2 上的可用性。
所以在滿足一致性的前提下,CAP 無法同時滿足。
如果先保證滿足可用性和分區容錯,即 AP。
可用性要求 P1 和 P2 都可以實時響應,因此在 D2 剛更新完還未同步給 D1 時,兩個 DB 的數據是不一致的,也就違背了 P1 和 P2 上的數據一致性。
所以在滿足可用性的前提下,CAP 亦無法同時滿足。
CAP 三者不可兼得,該怎么選擇呢?一般根據我們的業務可以有以下選擇。
保證分區的強一致性(C),不要求可用(A)。
相當于請求到達某個系統之前,需要等待數據完全同步以后,才會得到系統的數據響應,一般在數據需嚴格保持一致的金融系統中會使用這種模式。
保證分區的可用性(A),不要求強一致性(C)。
當請求訪問某個分區的數據時,可能拿到未同步的老數據,這種模式一般只要求數據滿足最終一致性,進而保證系統響應速度和高可用。
AP 在業界使用范圍較廣,比如著名的 BASE 理論(下文會細講)。
上文已經說過,分布式系統中無法同時保證系統的強一致性(C)和可用性(A)。
這是因為分布式系統中的分區是客觀存在無法避免的,而單體系統中的數據庫可以通過事務保證數據的一致性和可用性,比如 MySQL 中事務的四大特性(原子性、一致性、隔離性和持久性,簡稱 ACID)。
BASE 理論是當今互聯網分布式系統的實踐總結,它的核心思想在于,既然在分布式系統中實現強一致性的代價太大,那不如退而求其次。
只需要各應用分區在提供高可用服務的基礎上,盡最大能力保證數據一致性,也就是保證數據的最終一致性。
BASE 理論是 CAP 中保證分區容錯(P)的前提下,對可用性(A)和一致性(C)的權衡,它由 Basically Available(基本可用),Soft State(軟狀態),Eventually-Consistent(最終一致性)三方面構成,簡稱 BASE 理論。
分布式系統中,CAP 理論提供了一個理論框架,而 BASE 理論則提供了一種實際操作的指導原則。
BASE 理論認為,分布式系統在面臨故障或異常情況時,可以選擇降低性能或一致性要求,以保持基本的可用性。
這意味著系統可能會出現一些短暫的不一致性,但最終會達到一致狀態。
正如一個銀行系統的系統設計,一般有功能需求和非功能需求,我們首先需要保證核心功能需求的基本可用性。
在銀行系統里,用戶提款、轉賬等交易模塊就是核心功能,是用戶的基本需求,不能出問題。
而非核心功能可以出現異常,但需要保證在一段時間內修復。
非功能需求是指用戶業務不依賴的其它需求,比如性能相關的:要求用戶轉賬在 0.5 秒內完成,但是由于網絡延遲等原因,可以延遲響應至1~2 秒。
由于系統出現此類異常,從而影響了系統的高可用性,但核心流程依然可用,即基本可用性。
軟狀態是指系統服務可能處于中間狀態,數據在保證一致性的過程中可能延遲同步,但不會影響系統的可用性。
比如我們在購買火車票付款結束之后,就可能處在一個既沒有完全成功,也沒有失敗的中間等待狀態。用戶需要等待系統的數據完全同步以后,才會得到是否購票成功的最終狀態。
BASE 理論認識到,在分布式系統中,狀態可能會隨時間變化而軟化,而不是立即達到一致狀態。
這意味著我們需要容忍一些狀態的不確定性,比如我們在火車票候補排隊時是不確定是否可以候補成功的。
最終一致性是 BASE 理論的核心思想。它指出,分布式系統可以在一段時間內保持不一致狀態,但最終會收斂到一致狀態。
它不像強一致性那樣,需要分區數據保證實時一致,導致系統數據的同步代價過高。也不像弱一致性那樣,數據更新后不保證數據一致,導致后續的請求只能訪問到老數據。
當前業界的分布式系統,甚至關系數據庫系統的數據,大都是用最終一致性實現的。比如 MySQL 的主從備份,就是在一段時間內通過 binlog 日志和監聽線程讓從庫和主庫的數據保持最終一致。
總的來說,BASE 理論其實就是犧牲了各節點數據的強一致性,允許不同節點的數據在一段時間內不一致,來獲得更高的性能和高可用性。
在單體系統中,數據庫還能通過 ACID 來實現事務的強一致性,但分布式事務需要考慮節點通信的延遲和網絡故障。
所以,BASE 理論是我們在實際的分布式系統中經常使用的方案。
本文鏈接:http://www.tebozhan.com/showinfo-26-10898-0.html深入淺出:分布式、CAP 和 BASE 理論
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 這種方法可以解決開發中的重復“造輪子”