AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

英偉達合作推出 Fast-dLLM 框架,AI 擴散模型推理速度最高飆升 27.6 倍

來源: 責(zé)編: 時間:2025-06-04 16:57:02 42觀看
導(dǎo)讀 6 月 3 日消息,科技媒體 marktechpost 昨日(6 月 2 日)發(fā)布博文,報道稱英偉達聯(lián)合麻省理工學(xué)院(MIT)、香港大學(xué),合作推出 Fast-dLLM 框架,大幅提升擴散模型(Diffusion-based LLMs)的推理速度。擴散模型被認為是傳統(tǒng)自回

6 月 3 日消息,科技媒體 marktechpost 昨日(6 月 2 日)發(fā)布博文,報道稱英偉達聯(lián)合麻省理工學(xué)院(MIT)、香港大學(xué),合作推出 Fast-dLLM 框架,大幅提升擴散模型(Diffusion-based LLMs)的推理速度。xuR28資訊網(wǎng)——每日最新資訊28at.com

擴散模型被認為是傳統(tǒng)自回歸模型(Autoregressive Models)的有力競爭者,采用雙向注意力機制(Bidirectional Attention Mechanisms),理論上能通過同步生成多個詞元(Multi-token Generation)加速解碼過程。xuR28資訊網(wǎng)——每日最新資訊28at.com

不過在實際應(yīng)用中,擴散模型的推理速度往往無法媲美自回歸模型,每次生成步驟都需要重復(fù)計算全部注意力狀態(tài),導(dǎo)致計算成本高昂。此外,多詞元同步解碼時,詞元間的依賴關(guān)系易被破壞,生成質(zhì)量下降,讓其難以滿足實際需求。xuR28資訊網(wǎng)——每日最新資訊28at.com

援引博文介紹,英偉達組建的聯(lián)合團隊為解決上述瓶頸,研發(fā)了 Fast-dLLM 框架。該框架引入兩大創(chuàng)新:塊狀近似 KV 緩存機制和置信度感知并行解碼策略。xuR28資訊網(wǎng)——每日最新資訊28at.com

xuR28資訊網(wǎng)——每日最新資訊28at.com

KV 緩存通過將序列劃分為塊(Blocks),預(yù)計算并存儲其他塊的激活值(KV Activations),在后續(xù)解碼中重復(fù)利用,顯著減少計算冗余。其 DualCache 版本進一步緩存前后綴詞元(Prefix and Suffix Tokens),利用相鄰?fù)评聿襟E的高相似性提升效率。xuR28資訊網(wǎng)——每日最新資訊28at.com

而置信度解碼則根據(jù)設(shè)定的閾值(Confidence Threshold),選擇性解碼高置信度的詞元,避免同步采樣帶來的依賴沖突,確保生成質(zhì)量。xuR28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM 在多項基準測試中展現(xiàn)了驚人表現(xiàn)。在 GSM8K 數(shù)據(jù)集上,生成長度為 1024 詞元時,其 8-shot 配置下實現(xiàn)了 27.6 倍加速,準確率達 76.0%;在 MATH 基準測試中,加速倍數(shù)為 6.5 倍,準確率約為 39.3%;在 HumanEval 和 MBPP 測試中,分別實現(xiàn)了 3.2 倍和 7.8 倍加速,準確率維持在 54.3% 和基線水平附近。xuR28資訊網(wǎng)——每日最新資訊28at.com

xuR28資訊網(wǎng)——每日最新資訊28at.com

整體來看,F(xiàn)ast-dLLM 在加速的同時,準確率僅下降 1-2 個百分點,證明其有效平衡速度與質(zhì)量。這項研究通過解決推理效率和解碼質(zhì)量問題,讓擴散模型在實際語言生成任務(wù)中具備了與自回歸模型競爭的實力,為未來廣泛應(yīng)用奠定了基礎(chǔ)。xuR28資訊網(wǎng)——每日最新資訊28at.com

xuR28資訊網(wǎng)——每日最新資訊28at.com

附上參考地址xuR28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding論文xuR28資訊網(wǎng)——每日最新資訊28at.com

Fast-dLLM: Training-free Acceleration of Diffusion LLM by Enabling KV Cache and Parallel Decoding項目界面xuR28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-13399-0.html英偉達合作推出 Fast-dLLM 框架,AI 擴散模型推理速度最高飆升 27.6 倍

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果A20芯片大升級!iPhone 18 Pro將首發(fā)2nm工藝,性能如何?

下一篇: 任天堂《塞爾達傳說》手機伴侶應(yīng)用被指使用生成式 AI 配音

標簽:
  • 熱門焦點
  • 花房集團上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集團在港交所成功上市,首日便受到追捧,當日最高漲幅達28.75%。繼360、360數(shù)科、魯大師后,這是“紅衣教主”周
  • 中文在線的“元宇宙”故事,資本聽膩了?

    被譽為“元宇宙”龍頭之一的中文在線,這下尷尬了。2022年1月11日,中國移動通信聯(lián)合會元宇宙產(chǎn)業(yè)委員會揭牌,接納涉足“元宇宙”的8家上市公司,包括中青寶、天下秀
  • Terra鏈上TVL躍升至第二

    據(jù)DefiLlama數(shù)據(jù)顯示,當前,Terra鏈上應(yīng)用鎖倉的加密資產(chǎn)價值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • 重溫 1602 年:DAO 是新的企業(yè)范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業(yè)有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權(quán) 。”1602 年,荷蘭東印度公司成立,許多人認為
  • 紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

    2 月 22 日,紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布,它將持有私人數(shù)字證券市場 tZERO 的所有權(quán)。根據(jù)公告,ICE 將成為 tZero 的“重要”少數(shù)股東,但
  • 數(shù)字經(jīng)濟、數(shù)據(jù)要素與數(shù)字治理

    深入理解數(shù)字經(jīng)濟與數(shù)據(jù)要素,有利于更準確理解和把握數(shù)字治理的基本規(guī)律,構(gòu)建面向未來的健康的數(shù)字治理體系,也才能更好地理解元宇宙的治理框架。 一、數(shù)字經(jīng)濟
  • 知識產(chǎn)權(quán)可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點:一些公司開始采取積極的方式來保護他們在元宇宙的知識產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識產(chǎn)權(quán)。Inside
  • Staking 收益翻倍?

    以太坊質(zhì)押可能很快就會有兩倍的利潤。Coinbase 估計,在 1 月份以太坊網(wǎng)絡(luò)合并后,持有 ETH 的回報將翻倍。增長預(yù)期假設(shè)來自加密貨幣交易所 Coinbase 的估計是準
  • 元宇宙+劇本殺:“在異世界里當演員”

    你玩過劇本殺嗎?體驗過“元宇宙+劇本殺”嗎?2月,恒信東方推出了一款次時代劇本殺原創(chuàng)作品——《失落的王朝》。其劇本和線索以數(shù)字化資產(chǎn)打造,通過VR技術(shù)塑造了與
Top