快科技2月5日消息,DeepSeek開源大模型的推出,可以說徹底顛覆了AI行業(yè)的發(fā)展,各大平臺(tái)都在積極適配支持,比如國產(chǎn)GPU,除了摩爾線程、華為昇騰,壁仞也第一時(shí)間加入了這一行列。
壁仞科技透露,憑借自主研發(fā)的壁礪系列GPU產(chǎn)品出色的兼容性能,只用數(shù)個(gè)小時(shí),就完成對(duì)DeepSeek R1全系列蒸餾模型的支持,涵蓋從1.5B到70B各等級(jí)參數(shù)版本,包括LLaMA蒸餾模型和千問蒸餾模型。
壁仞科技成為少數(shù)實(shí)現(xiàn)國際、國內(nèi)多模型同步高效適配的芯片平臺(tái)之一,證明了國產(chǎn)芯片對(duì)復(fù)雜AI應(yīng)用任務(wù)的駕馭能力。
據(jù)介紹,DeepSeek提供了一種高效的模型蒸餾技術(shù),能夠?qū)⒋笠?guī)模模型的能力遷移至更小、更高效的版本,并且通過MLA、DeepSeek MoE兩大核心技術(shù),顯著降低顯存占用,優(yōu)化模型性能。
壁仞科技壁礪系列GPU產(chǎn)品在短時(shí)間內(nèi)成功支持DeepSeek全系列蒸餾模型,說明其在AI推理任務(wù)中具備強(qiáng)大的兼容性和易用性。
同時(shí),壁仞科技已聯(lián)合上海智能算力、中興通訊、科華數(shù)據(jù)、無問芯穹、開源中國(Gitee AI)、UCloud、一驀科技等戰(zhàn)略伙伴,基于壁礪系列訓(xùn)推產(chǎn)品106M、106B、106E、110E,全面開展包括R1在內(nèi)的DeepSeek全系列模型的適配與上線,滿足不同規(guī)模參數(shù)量模型的部署需求——
輕量級(jí)模型(1.5B-8B):
適配智能終端與邊緣計(jì)算設(shè)備,實(shí)現(xiàn)低延時(shí)實(shí)時(shí)推理。
中大規(guī)模模型(14B-32B):
服務(wù)于大規(guī)模企業(yè)級(jí)應(yīng)用和高并發(fā)任務(wù),滿足數(shù)據(jù)安全與定制化需求。
大規(guī)模模型(70B):
依托云端超算集群,支撐前沿AI研究與復(fù)雜任務(wù)處理。
即日起,壁仞AI算力平臺(tái)正式上線DeepSeek R1蒸餾模型推理服務(wù),全球開發(fā)者可云端體驗(yàn)1.5B、7B、8B、14B、32B、70B全系列模型服務(wù)。
體驗(yàn)地址為:
https://sgc.birentech.com:1443/
該服務(wù)具備兩大核心優(yōu)勢(shì):
一是零部署成本,可免去硬件采購與環(huán)境搭建,實(shí)現(xiàn)“開箱即用”的云端推理體驗(yàn)。
二是多場(chǎng)景覆蓋,針對(duì)LLM等不同任務(wù)預(yù)置優(yōu)化配置方案。
本文鏈接:http://www.tebozhan.com/showinfo-24-128870-0.html只花了幾個(gè)小時(shí)!國產(chǎn)壁仞GPU閃電支持DeepSeek
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com