AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 科技  > 軟件

如何向面試官證明你做的系統(tǒng)是高可用的?

來源: 責(zé)編: 時(shí)間:2023-10-28 16:30:33 408觀看
導(dǎo)讀通常,面試官在評(píng)估你的系統(tǒng)架構(gòu)設(shè)計(jì)能力時(shí),經(jīng)常會(huì)要求你分享在上一家公司如何設(shè)計(jì)系統(tǒng)架構(gòu),以便了解你的設(shè)計(jì)能力和思維過程。在解釋架構(gòu)設(shè)計(jì)時(shí),你會(huì)逐步向面試官證明自己負(fù)責(zé)的系統(tǒng)如何實(shí)現(xiàn)高可用性。這需要涉及一個(gè)公認(rèn)

通常,面試官在評(píng)估你的系統(tǒng)架構(gòu)設(shè)計(jì)能力時(shí),經(jīng)常會(huì)要求你分享在上一家公司如何設(shè)計(jì)系統(tǒng)架構(gòu),以便了解你的設(shè)計(jì)能力和思維過程。v4s28資訊網(wǎng)——每日最新資訊28at.com

在解釋架構(gòu)設(shè)計(jì)時(shí),你會(huì)逐步向面試官證明自己負(fù)責(zé)的系統(tǒng)如何實(shí)現(xiàn)高可用性。這需要涉及一個(gè)公認(rèn)的指標(biāo) - 服務(wù)水平協(xié)議(Service-Level Agreement,SLA)。服務(wù)水平協(xié)議是由服務(wù)提供者和用戶雙方簽訂的合同或協(xié)議,規(guī)定了雙方的商務(wù)關(guān)系或部分商務(wù)關(guān)系。簡單來說,SLA是衡量服務(wù)可用性的一個(gè)重要指標(biāo)。v4s28資訊網(wǎng)——每日最新資訊28at.com

業(yè)界通常使用"幾個(gè)9"的標(biāo)準(zhǔn)來衡量互聯(lián)網(wǎng)應(yīng)用的可用性。例如,京東的可用性是四個(gè)9(99.99%)。這意味著京東的服務(wù)承諾在所有運(yùn)行時(shí)間中只有0.01%的不可用時(shí)間,也就是說一年中只有大約52.6分鐘不可用。這個(gè)99.99%被稱為系統(tǒng)的可用性指標(biāo)。v4s28資訊網(wǎng)——每日最新資訊28at.com

52.6 分鐘是怎么計(jì)算出來的呢?v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

從公式中可以看出, SLA 等于 4 個(gè) 9,也就是可用時(shí)長達(dá)到了 99.99% ,不可用時(shí)長則為是0.01%,一年是 365 天, 8760 個(gè)小時(shí),一年的不可用時(shí)長就是 52.6 分鐘,那么:v4s28資訊網(wǎng)——每日最新資訊28at.com

SLA 等于 3 個(gè) 9,就相當(dāng)于一年不可用時(shí)長等于 526 分鐘;v4s28資訊網(wǎng)——每日最新資訊28at.com

SLA 等于 5 個(gè) 9,就相當(dāng)于一年不可用時(shí)長等于 5.26 分鐘。v4s28資訊網(wǎng)——每日最新資訊28at.com

可以發(fā)現(xiàn),用 SLA 等于 4 個(gè)9 作為參照物,少個(gè) 9 相當(dāng)于小數(shù)點(diǎn)往后移一位,多個(gè) 9 相當(dāng)于小數(shù)點(diǎn)往前移一位(我把系統(tǒng)可用性指標(biāo)總結(jié)成一張表格)。v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

案例分析

在評(píng)估系統(tǒng)的高可用性時(shí),僅僅按時(shí)間指標(biāo)度量是不夠的。因?yàn)樵诨ヂ?lián)網(wǎng)公司,低峰期和高峰期對業(yè)務(wù)的影響是不同的,這需要綜合考慮。你可以采用以下方法來回答關(guān)于高可用性的問題:v4s28資訊網(wǎng)——每日最新資訊28at.com

  1. 度量方式的選擇:首先介紹兩種主要的度量方式,即"幾個(gè)9"的概念和影響請求量占比的方式,解釋它們的優(yōu)缺點(diǎn)。
  2. 綜合考慮:強(qiáng)調(diào)在實(shí)際業(yè)務(wù)中,綜合考慮兩種度量方式更有利于全面評(píng)估高可用性。舉例說明在不同時(shí)間段停機(jī)對業(yè)務(wù)的不同影響。
  3. 科學(xué)性和實(shí)際性:說明使用請求量占比來評(píng)估高可用性更科學(xué),因?yàn)樗苯拥仃P(guān)聯(lián)到業(yè)務(wù)損失。然后,結(jié)合實(shí)際業(yè)務(wù)場景,展示你的思考和決策,以體現(xiàn)你的實(shí)踐經(jīng)驗(yàn)和專業(yè)性。
  4. 閉環(huán)思路:提到"可評(píng)估"、"可監(jiān)控"和"可保證"的思路,強(qiáng)調(diào)了綜合性的方法,不僅僅依賴于理論概念,還需要實(shí)際的措施來確保高可用性。

案例解答

我們可以通過設(shè)計(jì)一個(gè)監(jiān)控系統(tǒng)來保證系統(tǒng)服務(wù)SLA達(dá)到四個(gè)9,這個(gè)監(jiān)控系統(tǒng)可以分為三個(gè)核心部分:基礎(chǔ)設(shè)施監(jiān)控報(bào)警、系統(tǒng)應(yīng)用監(jiān)控報(bào)警,以及存儲(chǔ)服務(wù)監(jiān)控報(bào)警。通過這個(gè)監(jiān)控系統(tǒng)的設(shè)計(jì),我們可以更好地了解哪些環(huán)節(jié)對整個(gè)系統(tǒng)的可用性產(chǎn)生影響,這將幫助我們在面試中更清晰地展示系統(tǒng)高可用性設(shè)計(jì)的理念。v4s28資訊網(wǎng)——每日最新資訊28at.com

基礎(chǔ)設(shè)施監(jiān)控v4s28資訊網(wǎng)——每日最新資訊28at.com

監(jiān)控報(bào)警指標(biāo)分為兩種類型。v4s28資訊網(wǎng)——每日最新資訊28at.com

系統(tǒng)要素指標(biāo):主要有 CPU、內(nèi)存,和磁盤。v4s28資訊網(wǎng)——每日最新資訊28at.com

網(wǎng)絡(luò)要素指標(biāo):主要有帶寬、網(wǎng)絡(luò) I/O、CDN、DNS、安全策略、和負(fù)載策略。v4s28資訊網(wǎng)——每日最新資訊28at.com

為什么我們要監(jiān)控這些指標(biāo)?因?yàn)樗鼈兪桥袛嘞到y(tǒng)的基礎(chǔ)環(huán)境是否為高可用的重要核心指標(biāo)。v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

v4s28資訊網(wǎng)——每日最新資訊28at.com

監(jiān)控工具有一些常見的選擇,它們可以幫助你有效地監(jiān)控系統(tǒng)的性能。這些工具包括:v4s28資訊網(wǎng)——每日最新資訊28at.com

  1. ZABBIX:這是一個(gè)開源的監(jiān)控系統(tǒng),非常流行且具有廣泛的資料支持。它可以監(jiān)控系統(tǒng)的各種關(guān)鍵指標(biāo),如CPU使用率、內(nèi)存、磁盤、網(wǎng)絡(luò)帶寬等。
  2. Open-Falcon:由小米開源的監(jiān)控系統(tǒng),受到小米、滴滴、美團(tuán)等公司內(nèi)部的廣泛應(yīng)用。它也可以監(jiān)控各種基礎(chǔ)設(shè)施指標(biāo)。
  3. Prometheus:這是另一個(gè)開源的監(jiān)控系統(tǒng),特別擅長支持Kubernetes(K8S)環(huán)境的監(jiān)控。它也可以監(jiān)控CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等指標(biāo)。

這些工具提供了豐富的監(jiān)控功能,可以幫助你監(jiān)測系統(tǒng)的各個(gè)方面,從基礎(chǔ)的CPU和內(nèi)存使用到更高級(jí)的K8S監(jiān)控。此外,你還可以結(jié)合運(yùn)營商提供的監(jiān)控平臺(tái),以覆蓋整個(gè)基礎(chǔ)設(shè)施監(jiān)控的需求。v4s28資訊網(wǎng)——每日最新資訊28at.com

監(jiān)控報(bào)警策略一般由時(shí)間維度、報(bào)警級(jí)別、閾值設(shè)定三部分組成。v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

為了幫助你更好地理解監(jiān)控報(bào)警策略,讓我用一個(gè)例子來說明。假設(shè)我們正在監(jiān)控一個(gè)系統(tǒng)的CPU、內(nèi)存和磁盤使用情況,監(jiān)測的時(shí)間間隔是每分鐘,并且我們設(shè)置了一些占比的閾值。基于這些條件,我們可以制定以下監(jiān)控報(bào)警策略:v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

為了第一時(shí)間監(jiān)測到指標(biāo)的健康度,報(bào)警級(jí)別可以分為緊急、重要,以及一般。當(dāng) CPU、內(nèi)存,以及磁盤使用率這三項(xiàng)指標(biāo)的每分鐘采集的指標(biāo)達(dá)到 90% 使用率時(shí),就觸發(fā)“緊急報(bào)警”;達(dá)到 80% 觸發(fā)“重要報(bào)警”;70% 觸發(fā)“一般報(bào)警”。v4s28資訊網(wǎng)——每日最新資訊28at.com

系統(tǒng)應(yīng)用監(jiān)控v4s28資訊網(wǎng)——每日最新資訊28at.com

業(yè)務(wù)狀態(tài)監(jiān)控報(bào)警是關(guān)注系統(tǒng)自身狀態(tài)的監(jiān)控報(bào)警,與基礎(chǔ)設(shè)施監(jiān)控類似,它也由監(jiān)控指標(biāo)、監(jiān)控工具和報(bào)警策略組成。不同之處在于,系統(tǒng)應(yīng)用監(jiān)控報(bào)警的核心監(jiān)控指標(biāo)主要包括以下6個(gè)關(guān)鍵指標(biāo):流量、耗時(shí)、錯(cuò)誤、心跳、客戶端數(shù)和連接數(shù)。用于實(shí)現(xiàn)這些監(jiān)控指標(biāo)的工具包括CAT、SkyWalking、Pinpoint、Zipkin等。v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

v4s28資訊網(wǎng)——每日最新資訊28at.com

存儲(chǔ)服務(wù)監(jiān)控

一般來講,常用的第三方存儲(chǔ)有 DB、ES、Redis、MQ 等。v4s28資訊網(wǎng)——每日最新資訊28at.com

在面試中,當(dāng)回答關(guān)于監(jiān)控和保障系統(tǒng)可用性的問題時(shí),可以結(jié)合三個(gè)核心監(jiān)控部分(基礎(chǔ)設(shè)施監(jiān)控、系統(tǒng)應(yīng)用監(jiān)控、存儲(chǔ)服務(wù)監(jiān)控)來闡述你的全局監(jiān)控視角,強(qiáng)調(diào)你的設(shè)計(jì)思路。例如,你可以這樣回答:v4s28資訊網(wǎng)——每日最新資訊28at.com

"為了確保系統(tǒng)的可用性和穩(wěn)定性,我設(shè)計(jì)了一套綜合性的監(jiān)控體系,用于在生產(chǎn)環(huán)境中對系統(tǒng)進(jìn)行全面監(jiān)控。這包括基礎(chǔ)設(shè)施、系統(tǒng)應(yīng)用和存儲(chǔ)服務(wù)的監(jiān)控。具體的監(jiān)控指標(biāo)和細(xì)節(jié)可以根據(jù)實(shí)際業(yè)務(wù)場景進(jìn)行定制,比如在游戲領(lǐng)域,我們更關(guān)注流量和客戶端連接數(shù)等關(guān)鍵指標(biāo)。這種綜合性的監(jiān)控系統(tǒng)有助于我們迅速發(fā)現(xiàn)潛在問題并及時(shí)采取措施來維護(hù)系統(tǒng)的高可用性。"v4s28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)面試官進(jìn)一步追問如何應(yīng)對線上告警時(shí),你可以回答:v4s28資訊網(wǎng)——每日最新資訊28at.com

"當(dāng)面對線上告警時(shí),我會(huì)迅速響應(yīng),并根據(jù)告警的嚴(yán)重性采取相應(yīng)的措施。首先,我會(huì)查看告警的詳細(xì)信息,分析問題所在,以確定是否是假警報(bào)或真實(shí)問題。如果是真實(shí)問題,我將根據(jù)事先設(shè)定的報(bào)警策略來通知相關(guān)團(tuán)隊(duì)成員。然后,我們會(huì)在團(tuán)隊(duì)內(nèi)部協(xié)作,采取緊急措施來解決問題,包括故障排查、系統(tǒng)恢復(fù)和監(jiān)控指標(biāo)調(diào)整等。一旦問題得到解決,我會(huì)進(jìn)行事后分析,以確保我們可以從中吸取教訓(xùn),以防止未來類似問題的發(fā)生。總之,我會(huì)盡最大努力確保系統(tǒng)的高可用性,同時(shí)確保及時(shí)有效地響應(yīng)和處理告警情況。"v4s28資訊網(wǎng)——每日最新資訊28at.com

這種回答方式突出了你對全局監(jiān)控和緊急事件處理的理解,以及你的責(zé)任感和應(yīng)對危機(jī)的能力。v4s28資訊網(wǎng)——每日最新資訊28at.com

對于線上故障,要有應(yīng)急響應(yīng)機(jī)制,我總結(jié)以下幾點(diǎn)供你參考:v4s28資訊網(wǎng)——每日最新資訊28at.com

圖片圖片v4s28資訊網(wǎng)——每日最新資訊28at.com

總結(jié)

  1. 系統(tǒng)高可用評(píng)估:在面試中,我們學(xué)習(xí)了如何評(píng)估系統(tǒng)的高可用性,強(qiáng)調(diào)了以停機(jī)時(shí)間對系統(tǒng)請求量的影響作為科學(xué)評(píng)估指標(biāo)。
  2. 監(jiān)控系統(tǒng)設(shè)計(jì):了解了設(shè)計(jì)監(jiān)控系統(tǒng)時(shí)的三個(gè)核心要點(diǎn),包括基礎(chǔ)設(shè)施監(jiān)控、系統(tǒng)應(yīng)用監(jiān)控和存儲(chǔ)服務(wù)監(jiān)控。這有助于確保線上服務(wù)的穩(wěn)定運(yùn)行。
  3. 故障處理:強(qiáng)調(diào)了故障處理是進(jìn)階過程中不可或缺的經(jīng)歷,面試官也特別重視這個(gè)能力。對于不同類型的故障,建議形成一套體系化的知識(shí)框架來處理。

圖片 圖片 v4s28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-15584-0.html如何向面試官證明你做的系統(tǒng)是高可用的?

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: Next.js 14 正式發(fā)布,更快、更強(qiáng)、更可靠!你Get到了嗎?

下一篇: 微服務(wù)Saas如何做私有化部署

標(biāo)簽:
  • 熱門焦點(diǎn)
Top