當前位置：首頁 > 元宇宙 > AI

蘋果聯合推出 AI 交錯推理方法，Qwen2.5 模型響應速度快 80%、準確率提高 19.3%

來源：責編：時間：2025-06-02 11:04:47 47觀看

導讀 5 月 30 日消息，科技媒體 marktechpost 昨日（5 月 29 日）發布博文，報道稱蘋果公司攜手杜克大學，提出交錯推理（Interleaved Reasoning）的全新強化學習（Reinforcement learning，RL）方法，進一步提升大語言模型的推理能力。

5 月 30 日消息，科技媒體 marktechpost 昨日（5 月 29 日）發布博文，報道稱蘋果公司攜手杜克大學，提出交錯推理（Interleaved Reasoning）的全新強化學習（Reinforcement learning，RL）方法，進一步提升大語言模型的推理能力。

主流大語言模型在處理多步復雜問題時，常采用“先思考后回答”的長鏈式推理方式。然而，這種方法存在兩大痛點：一是響應時間過長，難以滿足實時交互需求；二是早期推理步驟出錯可能導致最終答案偏差。

研究人員指出，與人類在對話中隨時分享部分想法不同，模型往往等到推理全部完成才輸出結果，導致效率不高。

蘋果公司攜手杜克大學，研發了交錯推理技術，讓模型在推理過程中交替進行內部思考和輸出中間答案（sub-answer），從而提升速度與實用性。

交錯推理基于強化學習（RL）框架，采用特殊的訓練模板，包含 <think> 和 < answer > 標簽，確保模型在達到關鍵推理節點時輸出中間結果。

研究團隊設計了基于規則的獎勵機制，包括格式、最終準確率和條件性中間準確率，確保模型注重整體正確性。

測試中，交錯推理在 Qwen2.5 模型（1.5B 和 7B 參數）上表現優異，響應速度提升超 80%，準確率提高高達 19.3%。

此外，該方法僅在問答（QA）和邏輯數據集上訓練，卻能在 MATH、GPQA、MMLU 等更具挑戰性的基準測試中展現強大泛化能力。

研究還嘗試了多種獎勵策略，如全或無、部分積分和時間折扣獎勵，其中條件性和時間折扣獎勵效果最佳，顯著優于傳統方法。

附上參考地址

Interleaved Reasoning for Large Language Models via Reinforcement Learning

本文鏈接：http://www.tebozhan.com/showinfo-45-13293-0.html蘋果聯合推出 AI 交錯推理方法，Qwen2.5 模型響應速度快 80%、準確率提高 19.3%

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：小米多模態大模型 MiMo-VL 開源，官方稱多方面領先 Qwen2.5-VL-7B

下一篇： Yandex 發布最大音樂推薦開源數據集 Yambda

標簽：

熱門焦點

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“被曝光”的才是最吸引人的產品，相信有關注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發布”的iPhone SE 3和M2芯片，往遠了說有“折疊屏iP
企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
智能人機交互技術的春晚大考

1月初的一個早晨，京東智能客戶服務產品部緊急開會，進行關于尚未對外公布的“X項目”的初討論。1月5日，這個神秘的X項目對外公布，京東成為央視2022年春晚獨家互動合
Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

目前來看元宇宙不會影響到小型企業的發展，但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞，你一定或
Snoop Dogg 計劃推出致力于數字媒體NFT的專業公司

雅痞哥不知道這人是誰還上新聞，問了助理，解釋，相當于美版劉歡的地位吧。Snoop Dogg 在 NFT 領域已經有一段時間了，尤其是在最近有消息稱人們在元宇宙中購買房地產
從NFT數字收藏，洞察數字音樂版權市場發展趨勢

去年8月9日，騰訊音樂布局NFT數字收藏，在騰訊應用寶發布幻核app，騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

1. “無聊猿”BAYC交易總額突破14億美元3月10日，據DappRader最新數據顯示，“無聊猿”Bored Ape Yacht Club（BAYC）交易總額已突破14億美元，創下歷史新高，本文撰寫時為
初探元宇宙

2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺Roblox將“元宇宙”概念放入招股書中，被稱為“元宇宙”第一股后，Facebook更名為Meta, 引發全球范圍內
全球十大元宇宙概念游戲

A股市場中，不少游戲公司早早搭上了元宇宙概念。舉例，中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲，盡管游戲尚在研發中，這一消息已經讓中青寶的股價在51個交易

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果聯合推出 AI 交錯推理方法，Qwen2.5 模型響應速度快 80%、準確率提高 19.3%

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

智能人機交互技術的春晚大考

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

Snoop Dogg 計劃推出致力于數字媒體NFT的專業公司

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

初探元宇宙

全球十大元宇宙概念游戲

最新推薦

B端難做：留給魔琺科技的時間不多了

元宇宙里賣酸奶，好炸裂的操作！

元宇宙需要的5個重要安全功能

美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

從概念到落地 Web3.0初具雛形

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

猜你喜歡

熱門推薦

相關資訊