快科技8月3日消息,國產GPU近年來不斷取得突破,前不久礪算科技的7G01芯片性能達到了RTX 4060級別,更早之前摩爾線程也推出過高性能GPU,不僅在游戲方面可圈可點,AI也是一大重點。
在AI領域當前強的GPU是NVIDIA推出的,硬件架構及CUDA生態構筑了幾乎難以逾越的壁壘,那國產GPU在這方面到底差距多大?這事引發了很多爭議,知乎用戶@菽陌松囿作為業內人員,有過實際測試,公布了一些數據值得參考。
根據他的說法,(摩爾線程的GPU)kernel launch做到5us,nv大概是幾十us(有點忘記了),gemm mfu做到98%,nv大概85%,FA mfu做到95%,nv是68%。
此外,他還提到了N卡的一些不足,比如通信offload ace,nv根本就沒考慮,是DeepSeek幫他們做的sm隔離,15%的sm是浪費的。
當然,摩爾線程的GPU也不是沒有問題,比如支持Link但帶寬受限于硬件還有些差距,但這不是障礙。
他強調這些數據是經過研發同事確認的,不會糊弄同仁,意味著這些數據結果相當靠譜,反正這番對比下來還是有些讓人驚喜的,也頗為意外。
總體來說,他認為摩爾線程的GPU從硬件、kmd、umd算子庫全部都是重寫的,反擊了那些認為摩爾線程沒有東西的人的說法。
他援引的數據詳細信息可以參考摩爾線程官號公布的文章,里面有更全面的技術解析,只不過是沒有nv數據對比的,菽陌松囿提供的數據對比可以觀察下兩者在AI上的表現,雖然這并不是說國產的GPU可以全面超越N卡,但也不是部分網友認為的只是使用了國外IP套殼的說法。
本文鏈接:http://www.tebozhan.com/showinfo-24-175322-0.html國產GPU對比NVIDIA顯卡:數據有驚喜
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com