快科技2月5日消息,DeepSeek開源大模型的推出,可以說徹底顛覆了AI行業的發展,各大平臺都在積極適配支持,比如國產GPU,除了摩爾線程、華為昇騰,壁仞也第一時間加入了這一行列。
壁仞科技透露,憑借自主研發的壁礪系列GPU產品出色的兼容性能,只用數個小時,就完成對DeepSeek R1全系列蒸餾模型的支持,涵蓋從1.5B到70B各等級參數版本,包括LLaMA蒸餾模型和千問蒸餾模型。
壁仞科技成為少數實現國際、國內多模型同步高效適配的芯片平臺之一,證明了國產芯片對復雜AI應用任務的駕馭能力。
據介紹,DeepSeek提供了一種高效的模型蒸餾技術,能夠將大規模模型的能力遷移至更小、更高效的版本,并且通過MLA、DeepSeek MoE兩大核心技術,顯著降低顯存占用,優化模型性能。
壁仞科技壁礪系列GPU產品在短時間內成功支持DeepSeek全系列蒸餾模型,說明其在AI推理任務中具備強大的兼容性和易用性。
同時,壁仞科技已聯合上海智能算力、中興通訊、科華數據、無問芯穹、開源中國(Gitee AI)、UCloud、一驀科技等戰略伙伴,基于壁礪系列訓推產品106M、106B、106E、110E,全面開展包括R1在內的DeepSeek全系列模型的適配與上線,滿足不同規模參數量模型的部署需求——
輕量級模型(1.5B-8B):
適配智能終端與邊緣計算設備,實現低延時實時推理。
中大規模模型(14B-32B):
服務于大規模企業級應用和高并發任務,滿足數據安全與定制化需求。
大規模模型(70B):
依托云端超算集群,支撐前沿AI研究與復雜任務處理。
即日起,壁仞AI算力平臺正式上線DeepSeek R1蒸餾模型推理服務,全球開發者可云端體驗1.5B、7B、8B、14B、32B、70B全系列模型服務。
體驗地址為:
https://sgc.birentech.com:1443/
該服務具備兩大核心優勢:
一是零部署成本,可免去硬件采購與環境搭建,實現“開箱即用”的云端推理體驗。
二是多場景覆蓋,針對LLM等不同任務預置優化配置方案。
本文鏈接:http://www.tebozhan.com/showinfo-24-128870-0.html只花了幾個小時!國產壁仞GPU閃電支持DeepSeek
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com