Linux被廣泛用于服務(wù)器系統(tǒng),很多線上服務(wù)在上線前要做壓力測試,對(duì)發(fā)現(xiàn)的性能問題要進(jìn)一步排查和開發(fā)優(yōu)化性能。
比如通過 top 、iostat 等命令找到了引起資源異常的進(jìn)程后,就要進(jìn)一步對(duì)該進(jìn)程/線程的內(nèi)存占用、文件系統(tǒng)IO系統(tǒng)調(diào)用次數(shù)、Socket和網(wǎng)絡(luò)通訊阻塞問題等做跟蹤分析。由于此時(shí)往往更希望接近真實(shí)場景的運(yùn)行方式,所以除了采用代碼斷點(diǎn)調(diào)試的方式外,最保真、最快速跟蹤到實(shí)際環(huán)境問題根源的就是用Linux系統(tǒng)自帶的strace軟件啟動(dòng)問題軟件,獲得直接的數(shù)據(jù)實(shí)現(xiàn),故障分析、性能分析。
這是一款Linux下瑞士軍刀級(jí)別的工具,開發(fā)者、運(yùn)維人員如果不熟悉,那么非常有必要繼續(xù)往下看。學(xué)會(huì)后可以事半功倍地解決工作中遇到的各類軟件開發(fā)和軟件運(yùn)維問題。
統(tǒng)計(jì)異常系統(tǒng)調(diào)用耗時(shí)、系統(tǒng)調(diào)用次數(shù)過多的情況:使用strace跟蹤vs code 這個(gè)代碼編輯器的運(yùn)行(軟件文件路徑為 /usr/bin/code )為例:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
除了輸出啟動(dòng)過程從哪些目錄,加載了什么動(dòng)態(tài)庫,用到了什么系統(tǒng)調(diào)用(系統(tǒng)接口函數(shù)),函數(shù)調(diào)用返回值,入?yún)⒅档榷加写蛴 S捎谏厦鎱?shù)中使用了-C也就是要求打印匯總報(bào)告,所以在最后會(huì)列出vs code啟動(dòng)過程中涉及到多少系統(tǒng)調(diào)用、每個(gè)系統(tǒng)調(diào)用的時(shí)間百分比、時(shí)間總計(jì)、調(diào)用次數(shù)、錯(cuò)誤次數(shù)、系統(tǒng)調(diào)用的函數(shù)名。
并在最后一行列出匯總值。
假如我們的業(yè)務(wù)代碼中有個(gè)功能存在bug,過多調(diào)用了系統(tǒng)調(diào)用(次數(shù)維度),或者傳入的參數(shù)不科學(xué)導(dǎo)致系統(tǒng)調(diào)用執(zhí)行時(shí)間過長(時(shí)間維度),那么,通過strace 的報(bào)告我們可以馬上觀察到線索。再翻看 strace 的 -o strace.log 逐個(gè)系統(tǒng)調(diào)用跟蹤的日志記錄文件,就可以具體排查以下多方面:
最后總結(jié)下:
sudo strace -o strace.log -T -S time -k -O1ns -C -v /usr/bin/code --no-sandbox --user-data-dir /root/data
這個(gè)示例命令中參數(shù)的意思:
本文鏈接:http://www.tebozhan.com/showinfo-26-51230-0.html如何快速分析軟件運(yùn)行瓶頸在哪里?推薦Linux下的一個(gè)強(qiáng)大命令工具
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 老后端被借調(diào)去寫Java了,含淚總結(jié)的Java多線程編程基礎(chǔ)
下一篇: C語言中的柔性數(shù)組解析