當(dāng)前位置：首頁(yè) > 科技 > 芯片

字節(jié)豆包推UltraMem架構(gòu)，降推理成本83%

來(lái)源：責(zé)編：時(shí)間：2025-02-13 17:12:33 95觀看

導(dǎo)讀近日，字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布推出全新稀疏模型架構(gòu)UltraMem。該架構(gòu)解決了MoE推理的高額訪存問(wèn)題，推理速度較MoE架構(gòu)提升2-6倍，推理成本最高降83%。UltraMem具有出色的Scaling特性，實(shí)驗(yàn)顯示，在同等計(jì)算資源下，訓(xùn)練規(guī)模

近日，字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)宣布推出全新稀疏模型架構(gòu)UltraMem。該架構(gòu)解決了MoE推理的高額訪存問(wèn)題，推理速度較MoE架構(gòu)提升2-6倍，推理成本最高降83%。

UltraMem具有出色的Scaling特性，實(shí)驗(yàn)顯示，在同等計(jì)算資源下，訓(xùn)練規(guī)模達(dá)2000萬(wàn)value的UltraMem模型能同時(shí)實(shí)現(xiàn)領(lǐng)先的推理速度和模型性能。該創(chuàng)新成果已被ICLR 2025接收，為AI領(lǐng)域提供新思路。

UltraMem參考PKM設(shè)計(jì)，但針對(duì)其缺陷進(jìn)行改進(jìn)，實(shí)現(xiàn)更高效訪存和優(yōu)質(zhì)檢索，同時(shí)降低顯存和部署成本。在降低推理成本和提升速度的同時(shí)，UltraMem還保持了模型效果。

實(shí)驗(yàn)表明，UltraMem在模型效果和推理速度方面均優(yōu)于MoE和PKM架構(gòu)。

推理成本的降低將助推AI技術(shù)在更多領(lǐng)域應(yīng)用，尤其是資源受限的場(chǎng)景。對(duì)于用戶而言，UltraMem架構(gòu)的突破和推理速度的提升可使AI應(yīng)用響應(yīng)更迅速，交互更流暢，優(yōu)化使用體驗(yàn)，提高效率。

本文鏈接：http://www.tebozhan.com/showinfo-27-130227-0.html字節(jié)豆包推UltraMem架構(gòu)，降推理成本83%

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：富士康應(yīng)對(duì)關(guān)稅挑戰(zhàn)，劉揚(yáng)偉關(guān)注市場(chǎng)趨勢(shì)

下一篇：歐盟減排策略陷入兩難：拒中系EV與依賴其合作并存

標(biāo)簽：

熱門焦點(diǎn)

28個(gè)SpringBoot項(xiàng)目中常用注解，日常開發(fā)、求職面試不再懵圈

前言在使用SpringBoot開發(fā)中或者在求職面試中都會(huì)使用到很多注解或者問(wèn)到注解相關(guān)的知識(shí)。本文主要對(duì)一些常用的注解進(jìn)行了總結(jié)，同時(shí)也會(huì)舉出具體例子，供大家學(xué)習(xí)和參考。注解
最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬(wàn)

來(lái)源 | 電商在線文｜易琬玉編輯｜斯問(wèn)受訪店鋪：Ringdoll戒之人形圖源：微博@御座的黃山、“Ringdoll戒之人形”淘寶店鋪有關(guān)外貌的評(píng)價(jià)，黃山已經(jīng)聽累了。生于1985年的他，哪
“又被陳思誠(chéng)騙了”

作者｜張思齊出品｜眾面（ID：ZhongMian_ZM）如今的國(guó)產(chǎn)懸疑電影，成了陳思誠(chéng)的天下。最近大爆電影《消失的她》票房突破30億斷層奪魁暑期檔，陳思誠(chéng)再度風(fēng)頭無(wú)兩。你可以說(shuō)陳思誠(chéng)的
8月見！小米MIX Fold 3獲得3C認(rèn)證：支持67W快充

這段時(shí)間以來(lái)，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都得到了不少爆料，而小米新一代折疊屏旗艦——小米MIX Fold 3此前也屢屢被傳
三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

2023年7月26日，三星電子正式發(fā)布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外，Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期
三星Galaxy Z Fold5今日亮相：厚度縮減但仍略顯厚重

據(jù)官方此前宣布，三星將于7月26日也就是今天在韓國(guó)首爾舉辦Unpacked活動(dòng)，屆時(shí)將帶來(lái)帶來(lái)包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
iQOO 11S評(píng)測(cè)：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

【Techweb評(píng)測(cè)】去年底，iQOO推出了“電競(jìng)旗艦”iQOO 11系列，作為一款性能強(qiáng)機(jī)，該機(jī)不僅全球首發(fā)2K 144Hz E6全感屏，搭載了第二代驍龍8平臺(tái)及144Hz電競(jìng)
引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機(jī)市場(chǎng)長(zhǎng)期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS
DRAM存儲(chǔ)器10月價(jià)格下跌，NAND閃存本月價(jià)格與上月持平

10月30日，據(jù)韓國(guó)媒體消息，自今年年初以來(lái)一直在上漲的 DRAM 存儲(chǔ)器的交易價(jià)格僅在本月就下跌了近 10％，此次是全年首次降價(jià)，而NAND 閃存本月價(jià)格與上月持平。市

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

字節(jié)豆包推UltraMem架構(gòu)，降推理成本83%

28個(gè)SpringBoot項(xiàng)目中常用注解，日常開發(fā)、求職面試不再懵圈

最“俊美”淘寶賣家，靠直播和短視頻圈粉，上架秒光，年銷3000萬(wàn)

“又被陳思誠(chéng)騙了”

8月見！小米MIX Fold 3獲得3C認(rèn)證：支持67W快充

三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

三星Galaxy Z Fold5今日亮相：厚度縮減但仍略顯厚重

iQOO 11S評(píng)測(cè)：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

DRAM存儲(chǔ)器10月價(jià)格下跌，NAND閃存本月價(jià)格與上月持平

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊