快科技4月3日消息,NVIDIA在官網(wǎng)表示,在新的MLPerf V5.0基準測試中,NVIDIA的Blackwell平臺取得了令人矚目的成績。
MLPerf是一個衡量人工智能硬件、軟件和服務(wù)性能的標準化基礎(chǔ)測試平臺,它由圖靈獎得主大衛(wèi)·帕特森聯(lián)合谷歌、斯坦福、哈佛大學(xué)等頂尖企業(yè)和學(xué)術(shù)機構(gòu)成立,是權(quán)威性大、影響力廣的國際AI性能基準測試。
新更新的MLPerf 添加了Llama 3.1 405B,這是大和難以運行的開放權(quán)重模型之一。
NVIDIA表示,雖然許多公司在其硬件上運行MLPerf基準測試以衡量性能,但只有NVIDIA及其合作伙伴提交并發(fā)布了Llama 3.1 405B基準測試的結(jié)果。
具體來看,GB200 NVL72系統(tǒng)通過連接72個NVIDIA Blackwell GPU,作為一個單一的超大GPU運行,在Llama 3.1 405B基準測試中,與H200 NVL8相比,實現(xiàn)了高達30倍的吞吐量提升。
據(jù)介紹,在生產(chǎn)環(huán)境中,推理部署通常受到兩個關(guān)鍵指標的延遲限制:首次響應(yīng)時間(TTFT)和每個輸出令牌的時間(TPOT)。
新的Llama 2 70B Interactive基準測試將TPOT縮短了5倍,TTFT降低了4.4倍,模擬了更快的用戶體驗。
在這一測試中,NVIDIA使用8個Blackwell GPU的DGX B200系統(tǒng),性能比使用8個H200 GPU的系統(tǒng)高出三倍,為這一更具挑戰(zhàn)性的Llama 2 70B基準測試設(shè)定了新的高標準。
本文鏈接:http://www.tebozhan.com/showinfo-24-141080-0.html吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf記錄居第一
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com