快科技2月3日消息,DeepSeek大模型的出色表現(xiàn)引發(fā)美國AI行業(yè)上下震動,不僅性能與OpenAI O1旗鼓相當,更關(guān)鍵的是訓(xùn)練成本低得多,也引發(fā)了美國政府的猜疑和調(diào)查,新加坡都被牽扯進來。
DeepSeek官方?jīng)]有詳細披露大模型訓(xùn)練的硬件規(guī)模,只說用了數(shù)量有限的2048顆H800 GPU,在兩個月內(nèi)訓(xùn)練了6710億個參數(shù)的V3大模型,相當于280萬個GPU小時。
相比之下,Meta花了16381顆H100 GPU、54天實現(xiàn),訓(xùn)練了4050億個參數(shù)的Llama 3大模型,相當于3080萬個GPU小時,硬件成本相差多達11倍。
半導(dǎo)體研究機構(gòu)SemiAccurate提出,DeepSeek應(yīng)該囤積了大約6萬顆NVIDIA GPU,包括1萬顆A100、1萬顆H100、1萬顆H800、3萬顆H20,總成本超過140億元。
其中,A100、H100始終都在美國限制對華出口只列,H800作為特供版一度合規(guī),之后也被限制,目前只有H20是完全合規(guī)的。
歐美普遍認為,DeepSeek通過美國出口監(jiān)管漏洞,獲得了NVIDIA高端的H100 GPU,而且數(shù)量不少,多可能有5萬顆。
根據(jù)NVIDIA的財報,2022年底,美國剛剛限制AI芯片對華出口的時候,新加坡貢獻的收入占比只有9%,但是到了現(xiàn)在,這個比例已經(jīng)高達22%,顯得很不正常。
因此,美國白宮、FBI等機構(gòu)正在調(diào)查,DeepSeek是否通過位于新加坡的第三方公司,獲得了管制出口的NVIDIA AI GPU。
同時,美國有關(guān)人士呼吁對新加坡進出口采取更嚴格的監(jiān)督、管控措施,避免受限產(chǎn)品轉(zhuǎn)而進入中國。
不過,截至目前,美國政府尚未發(fā)現(xiàn)任何確鑿證據(jù)。
NVIDIA則回應(yīng)稱,一直嚴格遵守法律要求,與新加坡的大多數(shù)交易都是運往其他地方的貨物,而不是中國。
NVIDIA強調(diào),與新加坡相關(guān)的收入并不意味著轉(zhuǎn)移到中國,其公開文件顯示的是客戶賬單地址而非發(fā)貨地址。
本文鏈接:http://www.tebozhan.com/showinfo-24-128633-0.htmlDeepSeek引發(fā)美國地震!懷疑中國通過新加坡獲取NVIDIA AI芯片
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com