2 月 4 日消息,中科曙光國家先進計算產業創新中心有限公司昨日發文宣布,海光信息技術團隊成功完成 DeepSeek V3 和 R1 模型與海光 DCU(深度計算單元)國產化適配,并正式上線。
用戶在“光合開發者社區”中的“光源”板塊訪問并下載相關模型,或登錄光源官網搜索“DeepSeek”,即可基于 DCU 平臺部署和使用相關模型。
據介紹,DeepSeek V3 和 R1 模型基于 Transformer 架構,采用了 Multi-Head Latent Attention(MLA)和 DeepSeek MoE 兩大核心技術。MLA 通過減少 KV 緩存顯著降低了內存占用,提升了推理效率;DeepSeek MoE 則通過輔助損失(auxiliary loss)實現了專家負載的智能平衡,進一步優化了模型性能。
查詢獲悉,DCU 是海光信息推出的高性能 GPGPU 架構 AI 加速卡,致力于為行業客戶提供自主可控的全精度通用 AI 加速計算解決方案。目前,DCU 已在科教、金融、醫療、政務、智算中心等多個領域實現規模化應用。
本文鏈接:http://www.tebozhan.com/showinfo-45-10488-0.htmlDeepSeek V3 和 R1 模型完成海光 DCU 國產化適配并正式上線
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com