2 月 4 日消息,DeepSeek 開源模型(如 V3、R1 系列)在多語言理解與復雜推理任務中展現了卓越性能。摩爾線程智能科技(北京)有限責任公司今日發文宣布,摩爾線程實現了對 DeepSeek 蒸餾模型推理服務部署。
從摩爾線程官方獲悉,通過 DeepSeek 提供的蒸餾模型,能夠將大規模模型的能力遷移至更小、更高效的版本,在國產 GPU 上實現高性能推理。
開源框架適配:基于 Ollama 開源框架,摩爾線程完成 DeepSeek-R1-Distill-Qwen-7B 蒸餾模型的部署,并在多種中文任務中展現了優異的性能,驗證摩爾線程自研全功能 GPU 的通用性與 CUDA 兼容性。
自研引擎加速:通過摩爾線程自主研發的高性能推理引擎,結合軟硬件協同優化技術,通過定制化的算子加速和內存管理,顯著提升了模型的計算效率和資源利用率。這一引擎不僅支持 DeepSeek 蒸餾模型的高效運行,還為未來更多大規模模型的部署提供了技術保障。
另外,用戶也可以基于 MTT S80 和 MTT S4000 進行 DeepSeek-R1 蒸餾模型的推理部署,此前已有用戶在 MTT S80 上手動完成實踐。
本文鏈接:http://www.tebozhan.com/showinfo-45-10443-0.html國產 GPU 助力,摩爾線程實現對 DeepSeek 蒸餾模型推理服務部署
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com