快科技2月5日消息,DeepSeek的硬件設(shè)施雖然沒有公布詳細(xì)情況,但普遍認(rèn)為大量使用了NVIDIA AI芯片,包括H100、H800、H20等不同型號(hào),但根據(jù)新曝料,DeepSeek也驗(yàn)證了華為新的AI芯片——昇騰910C。
昇騰910C是在2024年晚些時(shí)候被曝出的,據(jù)稱已向部分客戶批量供貨,包括阿里巴巴、百度、騰訊等巨頭,首批大約7萬(wàn)顆,平均每顆僅2萬(wàn)元左右。
消息顯示,昇騰910C采用了中芯國(guó)際的7nm工藝制造,chiplets雙芯片整合封裝,晶體管數(shù)量達(dá)530億個(gè),整體國(guó)產(chǎn)化率已達(dá)55%左右。
它可以平替NVIDIA H100,同樣用于大規(guī)模的AI訓(xùn)練和推理,F(xiàn)P8、FP16、FP32、FP64等不同數(shù)據(jù)類型下均有不俗表現(xiàn)。
昇騰910C
按照新說(shuō)法,DeepSeek團(tuán)隊(duì)的實(shí)測(cè)數(shù)據(jù)顯示,華為昇騰910C在AI推理中的表現(xiàn)出乎意料地好,已經(jīng)達(dá)到NVIDIA H100芯片的60%左右。
更進(jìn)一步地,通過手寫CUNN內(nèi)核和優(yōu)化,昇騰910C的性能還可以進(jìn)一步提升。
據(jù)稱,DeepSeek從第一天起就支持華為昇騰芯片,并且自主維護(hù)PyTorch倉(cāng)庫(kù),只需一行代碼就能將CUDA轉(zhuǎn)換為CANN(昇騰AI異構(gòu)計(jì)算框架),性能優(yōu)化的潛力也相當(dāng)巨大,通過定制優(yōu)化可達(dá)到更高性能。
不過需要注意的是,目前已知的只是昇騰910C AI推理性能很優(yōu)秀,但是AI訓(xùn)練性能可能還是不夠理想。
昇騰910
本文鏈接:http://www.tebozhan.com/showinfo-24-128886-0.html國(guó)產(chǎn)7nm工藝!曝華為昇騰910C AI推理性能達(dá)NVIDIA H100 60%:DeepSeek已驗(yàn)證
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com