快科技2月3日消息,DeepSeek大模型的出色表現引發美國AI行業上下震動,不僅性能與OpenAI O1旗鼓相當,更關鍵的是訓練成本低得多,也引發了美國政府的猜疑和調查,新加坡都被牽扯進來。
DeepSeek官方沒有詳細披露大模型訓練的硬件規模,只說用了數量有限的2048顆H800 GPU,在兩個月內訓練了6710億個參數的V3大模型,相當于280萬個GPU小時。
相比之下,Meta花了16381顆H100 GPU、54天實現,訓練了4050億個參數的Llama 3大模型,相當于3080萬個GPU小時,硬件成本相差多達11倍。
半導體研究機構SemiAccurate提出,DeepSeek應該囤積了大約6萬顆NVIDIA GPU,包括1萬顆A100、1萬顆H100、1萬顆H800、3萬顆H20,總成本超過140億元。
其中,A100、H100始終都在美國限制對華出口只列,H800作為特供版一度合規,之后也被限制,目前只有H20是完全合規的。
歐美普遍認為,DeepSeek通過美國出口監管漏洞,獲得了NVIDIA高端的H100 GPU,而且數量不少,多可能有5萬顆。
根據NVIDIA的財報,2022年底,美國剛剛限制AI芯片對華出口的時候,新加坡貢獻的收入占比只有9%,但是到了現在,這個比例已經高達22%,顯得很不正常。
因此,美國白宮、FBI等機構正在調查,DeepSeek是否通過位于新加坡的第三方公司,獲得了管制出口的NVIDIA AI GPU。
同時,美國有關人士呼吁對新加坡進出口采取更嚴格的監督、管控措施,避免受限產品轉而進入中國。
不過,截至目前,美國政府尚未發現任何確鑿證據。
NVIDIA則回應稱,一直嚴格遵守法律要求,與新加坡的大多數交易都是運往其他地方的貨物,而不是中國。
NVIDIA強調,與新加坡相關的收入并不意味著轉移到中國,其公開文件顯示的是客戶賬單地址而非發貨地址。
本文鏈接:http://www.tebozhan.com/showinfo-24-128633-0.htmlDeepSeek引發美國地震!懷疑中國通過新加坡獲取NVIDIA AI芯片
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com