當前位置：首頁 > 元宇宙 > AI

谷歌研究：合成數據使大模型數學推理能力提升八倍

來源：責編：時間：2025-04-09 07:26:12 63觀看

導讀 4 月 7 日消息，最近，來自谷歌、卡內基梅隆大學和 MultiOn 的聯合研究團隊發表了一項關于合成數據在大型模型訓練中應用的新研究。據專注于人工智能發展的研究機構 Epoch AI 報告顯示，目前全球約有 300 萬億個公

4 月 7 日消息，最近，來自谷歌、卡內基梅隆大學和 MultiOn 的聯合研究團隊發表了一項關于合成數據在大型模型訓練中應用的新研究。

據專注于人工智能發展的研究機構 Epoch AI 報告顯示，目前全球約有 300 萬億個公開可用的高質量文本訓練標記。然而，隨著類似 ChatGPT 這樣的大模型的迅猛發展，對訓練數據的需求呈指數級增長，預計到 2026 年之前，這些數據將被耗盡。因此，合成數據成為了至關重要的替代方案。

據了解，研究人員主要探索了兩種合成數據類型：正向數據和負向數據。正向數據是指由高性能大模型（如 GPT-4 和 Gemini 1.5 Pro）生成的正確問題解決方案，為模型提供解決數學問題的示例。但僅依靠正向數據進行訓練存在局限性。一方面，這種方法可能無法完全揭示問題解決過程背后的邏輯，模型可能會通過模式匹配來學習，而缺乏真正的理解；另一方面，隨著訓練數據量的增加，模型可能會學到虛假的相關性，導致在處理新問題時泛化能力下降。

鑒于此，研究人員引入了負向數據，即經過驗證為錯誤的問題解決步驟。這有助于模型識別并避免錯誤，從而增強其邏輯推理能力。盡管使用負向數據存在挑戰，因為錯誤的步驟可能包含誤導性信息，但研究人員通過直接偏好優化（DPO）方法成功地使模型能夠從錯誤中學習，強調了每個問題解決步驟的重要性。

DPO 方法為每個問題解決步驟分配一個優勢值，反映其相對于理想解決方案的價值。研究表明，高優勢步驟是正確解決方案的關鍵，而低優勢步驟可能表明模型推理中存在問題。利用這些優勢值，模型可以在強化學習框架內動態調整其策略，從而更高效地從合成數據中學習和改進。

為了驗證合成數據的有效性，研究團隊使用 DeepSeek-Math-7B 和 LLaMa2-7B 等模型，在 GSM8K 和 MATH 數據集上進行了全面測試。結果顯示，經過正向和負向合成數據預訓練的大模型在數學推理任務上的性能實現了八倍的提升。這一研究充分展示了合成數據在增強大模型邏輯推理能力方面的巨大潛力。

本文鏈接：http://www.tebozhan.com/showinfo-45-12052-0.html谷歌研究：合成數據使大模型數學推理能力提升八倍

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：非法獲取學生信息并用 AI 技術發送騷擾短信，在校大學生被抓

下一篇：中國自主量子計算機“本源悟空”全球首次運行十億級 AI 微調大模型

標簽：

熱門焦點

雷克薩斯高管，“受賄”5000萬？

來源：毒舌科技作者：潘磊雷克薩斯的高管，好像出事了。五六家日本小媒體，突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元（約合人民幣5000
字節跳動，剛剛投了一位虛擬女生

今年第一筆虛擬人融資出爐了。投資界獲悉，杭州李未可科技有限公司顯示發生股東變更，新增字節跳動關聯公司北京量子躍動科技有限公司。今天公司方面正式確認，本輪
韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

今日熱點：《刀劍神域：Ex-Chronicle Online Edition》VR展開幕；虛擬活動平臺EventX再獲800萬美元B輪融資；VR射擊游戲《Outlier》確認將于3月17日登陸Steam平臺等。
2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

UGC作為元宇宙的主要內容創作模式，已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面，UGC模式勾勒了元宇宙的邊界，現今元宇宙UGC模式的主要呈現方式以元宇宙概念
從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

作者：魯拍賣是一種從古至今的商業活動。從古代的典當到現代的拍賣市場、我們熟知的拍賣行，以及知名街頭藝術家Bansky名畫拍賣成功后，竟自毀粉碎，現價值又翻倍的拍
與元宇宙美少女藝術家的對話

我最近宣布了我自己的NFT項目，這是我已經工作了幾個月的事情。由于我之前只是一個收藏家，擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
從NFT數字收藏，洞察數字音樂版權市場發展趨勢

去年8月9日，騰訊音樂布局NFT數字收藏，在騰訊應用寶發布幻核app，騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

元宇宙聽起來像不像是科幻小說中出現的術語？事實確實如此。小說家尼爾·斯蒂芬森在1992年的小說《雪崩》中首次用這個詞來定義了一個多連接的虛擬宇宙，它能夠模

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

谷歌研究：合成數據使大模型數學推理能力提升八倍

雷克薩斯高管，“受賄”5000萬？

字節跳動，剛剛投了一位虛擬女生

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

與元宇宙美少女藝術家的對話

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

電影工業巨頭好萊塢計劃進軍元宇宙，將會對行業帶來什么影響？

最新推薦

AI界地震！美國對OpenAI展開調查！監管風暴來襲！

風口已至，多領域平臺融入社交元素！

避坑指南：遠離具有這些特性的NFT

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

獨立故事片“Calladita”將使用 NFT 籌集資金

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

猜你喜歡

熱門推薦

相關資訊