當前位置：首頁 > 元宇宙 > AI

騰訊攜手創新“無監督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

來源：責編：時間：2025-03-04 15:06:33 92觀看

導讀 3 月 2 日消息，科技媒體 marktechpost 昨日（3 月 1 日）發布博文，報道稱騰訊 AI Lab 攜手香港中文大學，提出名為“無監督前綴微調”（UPFT）的創新方法，顯著提升了大型語言模型的推理效率。該方法無需處理完整的推理過程

3 月 2 日消息，科技媒體 marktechpost 昨日（3 月 1 日）發布博文，報道稱騰訊 AI Lab 攜手香港中文大學，提出名為“無監督前綴微調”（UPFT）的創新方法，顯著提升了大型語言模型的推理效率。

該方法無需處理完整的推理過程，只需關注模型輸出的前 8 至 32 個詞元（token），即可有效改進模型的推理能力。UPFT 抓住了不同推理路徑中共同的關鍵早期步驟，在降低計算開銷的同時，實現了推理性能的提升。

大型語言模型在語言理解和生成方面表現出色，但提升其推理能力仍然是一項挑戰。傳統微調方法依賴大量標注數據或復雜的拒絕采樣，資源消耗巨大。UPFT 則另辟蹊徑，通過聚焦模型輸出的初始 tokens，解決了效率和對昂貴監督的依賴問題。

研究發現，針對同一問題，模型生成的各種推理路徑的初始步驟往往高度相似，UPFT 正是基于這種“前綴自洽性”，無需完整推理軌跡或大量標注數據，僅使用這些初始標記進行訓練。

UPFT 采用貝葉斯推理原理，將正確推理的概率分解為“覆蓋率”和“準確性”兩部分。通過訓練早期 tokens，UPFT 在探索多樣化推理路徑的同時，確保了結果的可靠性。實驗表明，UPFT 可將訓練中處理的 tokens 數量減少高達 95%，并顯著降低時間和內存需求。

UPFT 在 GSM8K、MATH500、AIME2024 和 GPQA 等推理基準測試中表現優異。例如，在 Qwen2.5-Math-7B-Instruct 模型上，UPFT 在減少訓練和推理 tokens 的同時，提升了平均準確率。在復雜推理任務中，UPFT 的性能提升尤為顯著，表明早期推理步驟包含解決問題的關鍵信息。

附上參考地址

The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models

Tencent AI Lab Introduces Unsupervised Prefix Fine-Tuning (UPFT): An Efficient Method that Trains Models on only the First 8-32 Tokens of Single Self-Generated Solutions

本文鏈接：http://www.tebozhan.com/showinfo-45-11338-0.html騰訊攜手創新“無監督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：清華大學 2025 年將適度擴招本科生，重點培養“AI+”拔尖創新人才

下一篇： GPT-4.5 性能提升有限、成本卻激增 30 倍，OpenAI 面臨性價比質疑

標簽：

熱門焦點

元宇宙的文旅賽道，還能如何發力？

來源：X增強現實蘋果推出Vision Pro，為XR行業注入一劑強心針。而在蘋果開發者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達成合作，其Disney+流媒體服務將于Vision Pro
字節跳動，剛剛投了一位虛擬女生

今年第一筆虛擬人融資出爐了。投資界獲悉，杭州李未可科技有限公司顯示發生股東變更，新增字節跳動關聯公司北京量子躍動科技有限公司。今天公司方面正式確認，本輪
上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

區塊鏈日報17日訊今日《元宇宙新鮮事》有：上海虹口將成立總額約10億元的元宇宙產業基金；香港市場首只元宇宙主題ETF擬于2月21日上市；元宇宙平臺Roblox出現違禁游
國內涌現70余家數字藏品平臺：合規、流量與利潤在博弈

作者：楊鄭君2月16日，迅雷鏈企業數字藏品服務平臺正式上線，繼阿里、騰訊、京東、百度、網易等之后，又一家互聯網企業正式加入到火熱的數字藏品平臺的競爭中。除互聯
韓國國民銀行將推出韓國首個加密貨幣 ETF

韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告，該銀行正在等待政府批準，并已建立一個準備就緒的數字資產
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術語，流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率，流動性最強的資產是現金本身?，F在讓我們試著從流動性的角
我們為什么需要Web3，距離Web3的實現還有多遠？

當今技術正在經歷著重要的變革，許多公司正在改變他們的經營模式以求變得更加的靈活，其中有很大一部分公司采用了不同的方式來發展自己的業務。其中之一就是Web3，
全球十大元宇宙概念游戲

A股市場中，不少游戲公司早早搭上了元宇宙概念。舉例，中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲，盡管游戲尚在研發中，這一消息已經讓中青寶的股價在51個交易
在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時間，豆瓣可謂命途多舛：APP屢次下架，平臺也被相關部門約談、處罰，國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能：這個曾經小

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

騰訊攜手創新“無監督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

元宇宙的文旅賽道，還能如何發力？

字節跳動，剛剛投了一位虛擬女生

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

國內涌現70余家數字藏品平臺：合規、流量與利潤在博弈

韓國國民銀行將推出韓國首個加密貨幣 ETF

解決NFT流動性問題：一文了解Floor DAO

我們為什么需要Web3，距離Web3的實現還有多遠？

全球十大元宇宙概念游戲

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

數字虛擬人23年最新變化！

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

元宇宙平臺會是上世紀末的互聯網嗎？

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

猜你喜歡

熱門推薦

相關資訊

騰訊攜手創新“無監督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率

最新推薦

猜你喜歡

熱門推薦

相關資訊

騰訊攜手創新“無監督前綴微調”技術：訓練 tokens 最多減少 95%，提升 AI 推理效率