近日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布推出全新稀疏模型架構(gòu)UltraMem。該架構(gòu)解決了MoE推理的高額訪存問(wèn)題,推理速度較MoE架構(gòu)提升2-6倍,推理成本最高降83%。
UltraMem具有出色的Scaling特性,實(shí)驗(yàn)顯示,在同等計(jì)算資源下,訓(xùn)練規(guī)模達(dá)2000萬(wàn)value的UltraMem模型能同時(shí)實(shí)現(xiàn)領(lǐng)先的推理速度和模型性能。該創(chuàng)新成果已被ICLR 2025接收,為AI領(lǐng)域提供新思路。
UltraMem參考PKM設(shè)計(jì),但針對(duì)其缺陷進(jìn)行改進(jìn),實(shí)現(xiàn)更高效訪存和優(yōu)質(zhì)檢索,同時(shí)降低顯存和部署成本。在降低推理成本和提升速度的同時(shí),UltraMem還保持了模型效果。
實(shí)驗(yàn)表明,UltraMem在模型效果和推理速度方面均優(yōu)于MoE和PKM架構(gòu)。
推理成本的降低將助推AI技術(shù)在更多領(lǐng)域應(yīng)用,尤其是資源受限的場(chǎng)景。對(duì)于用戶而言,UltraMem架構(gòu)的突破和推理速度的提升可使AI應(yīng)用響應(yīng)更迅速,交互更流暢,優(yōu)化使用體驗(yàn),提高效率。
本文鏈接:http://www.tebozhan.com/showinfo-27-130227-0.html字節(jié)豆包推UltraMem架構(gòu),降推理成本83%
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 富士康應(yīng)對(duì)關(guān)稅挑戰(zhàn),劉揚(yáng)偉關(guān)注市場(chǎng)趨勢(shì)