當(dāng)前位置：首頁 > 元宇宙 > AI

合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

來源：責(zé)編：時間：2025-04-07 10:34:46 125觀看

導(dǎo)讀近期，一項關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究成果引起了業(yè)界的廣泛關(guān)注。這項研究由谷歌、卡內(nèi)基梅隆大學(xué)和MultiOn的聯(lián)合研究團(tuán)隊共同完成。據(jù)Epoch AI的研究報告顯示，盡管全球范圍內(nèi)已有約300萬億個高質(zhì)量的文

近期，一項關(guān)于合成數(shù)據(jù)在大型模型訓(xùn)練中應(yīng)用的新研究成果引起了業(yè)界的廣泛關(guān)注。這項研究由谷歌、卡內(nèi)基梅隆大學(xué)和MultiOn的聯(lián)合研究團(tuán)隊共同完成。

據(jù)Epoch AI的研究報告顯示，盡管全球范圍內(nèi)已有約300萬億個高質(zhì)量的文本訓(xùn)練標(biāo)記可供使用，但隨著ChatGPT等大模型的快速發(fā)展，對訓(xùn)練數(shù)據(jù)的需求正呈爆炸式增長。預(yù)測顯示，到2026年，現(xiàn)有的高質(zhì)量訓(xùn)練數(shù)據(jù)或?qū)o法滿足需求。因此，探索合成數(shù)據(jù)作為替代方案顯得尤為重要。

在此次研究中，研究人員主要聚焦于兩種類型的合成數(shù)據(jù)：正向數(shù)據(jù)和負(fù)向數(shù)據(jù)。正向數(shù)據(jù)由高性能大模型（例如GPT-4和Gemini 1.5 Pro）生成，提供正確的數(shù)學(xué)問題解決方案，為模型提供學(xué)習(xí)范例。然而，單純依賴正向數(shù)據(jù)存在局限性，可能導(dǎo)致模型僅通過模式匹配學(xué)習(xí)，缺乏真正的理解能力，且在處理新問題時泛化能力下降。

為了克服這些挑戰(zhàn)，研究人員引入了負(fù)向數(shù)據(jù)，即經(jīng)過驗證的錯誤問題解決步驟。負(fù)向數(shù)據(jù)的加入有助于模型識別并避免錯誤，從而提升其邏輯推理能力。盡管使用負(fù)向數(shù)據(jù)面臨諸多困難，如錯誤步驟可能包含誤導(dǎo)性信息，但研究團(tuán)隊通過直接偏好優(yōu)化（DPO）方法成功使模型能夠從錯誤中學(xué)習(xí)。

DPO方法為每個問題解決步驟分配一個優(yōu)勢值，反映其相對于理想解決方案的價值。研究表明，高優(yōu)勢步驟是正確解決方案的關(guān)鍵，而低優(yōu)勢步驟則可能揭示模型推理中的問題。借助這些優(yōu)勢值，模型能夠在強(qiáng)化學(xué)習(xí)框架內(nèi)動態(tài)調(diào)整策略，更高效地從合成數(shù)據(jù)中學(xué)習(xí)和改進(jìn)。

為了驗證合成數(shù)據(jù)的有效性，研究團(tuán)隊選擇了DeepSeek-Math-7B和LLaMa2-7B等模型，在GSM8K和MATH數(shù)據(jù)集上進(jìn)行了全面測試。測試結(jié)果顯示，經(jīng)過正向和負(fù)向合成數(shù)據(jù)預(yù)訓(xùn)練的大模型在數(shù)學(xué)推理任務(wù)上的性能實現(xiàn)了顯著提升，甚至達(dá)到了八倍的增長。這一研究成果充分展示了合成數(shù)據(jù)在增強(qiáng)大模型邏輯推理能力方面的巨大潛力和實際應(yīng)用價值。

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

中國“本源悟空”量子計算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實戰(zhàn)

04-07

數(shù)智人力新基建：實時人才市場薪酬數(shù)據(jù)重構(gòu)企業(yè)用人戰(zhàn)略

在數(shù)字化轉(zhuǎn)型浪潮中，人力資源部門正從傳統(tǒng)的事務(wù)處理中心向戰(zhàn)略決策中心進(jìn)化。市場人才數(shù)據(jù)、薪酬數(shù)據(jù)和招聘數(shù)據(jù)構(gòu)成的黃金三角，正在重構(gòu)企業(yè)人才管理的底層邏輯。本文將從人力成本控制、定崗定薪優(yōu)化、競品趨勢監(jiān)測三大維度，揭示數(shù)據(jù)驅(qū)動型HR管理的戰(zhàn)略價值。一、市

04-07

深圳海關(guān)智能機(jī)器人大升級！DeepSeek-R1助力通關(guān)效率飆升

04-07

Meta新推Llama 4 AI模型，首秀“混合專家”架構(gòu)引領(lǐng)技術(shù)潮流

當(dāng)?shù)貢r間4月5日，Meta公司推出其AI模型Llama 4。Meta表示，Llama 4是一個多模態(tài)大模型，它能夠處理和整合各種類型的數(shù)據(jù)，包括文本、視頻、圖像和音頻，并且可以在這些格式之間轉(zhuǎn)換內(nèi)容。 Ll…

04-07

OpenAI與蘋果前設(shè)計總監(jiān)聯(lián)手打造AI新設(shè)備，或開啟智能穿戴新篇章？

04-07

創(chuàng)投秘籍：投資人眼中決定成敗的九大要素

一家共享出行企業(yè)在發(fā)展過程中，通過研究對標(biāo)公司的市場拓展策略，發(fā)現(xiàn)其在進(jìn)入新城市時，采用了與當(dāng)?shù)卣献鳌⑻峁﹥?yōu)惠政策吸引用戶等方式，快速打開了市場。在BP中，創(chuàng)業(yè)者要清晰闡述自身與對標(biāo)公司的差距及優(yōu)勢，展示…

04-07

廣西“路網(wǎng)先知”大顯身手，清明假期交通保障智慧升級！

04-06

《創(chuàng)：戰(zhàn)神》預(yù)告震撼來襲，AI覺醒未來都市，10月10日北美震撼上映！

04-06

《創(chuàng)：戰(zhàn)神》預(yù)告燃爆！10月10日，AI覺醒震撼來襲

04-06

全球風(fēng)投涌向AI，OpenAI與Meta競賽，亞洲市場緣何低迷？

4月6日，Meta發(fā)布了Llama 4系列模型，是其首個原生多模態(tài)模型，最高1000萬上下文長度，訓(xùn)練數(shù)據(jù)高達(dá)30萬億個Tokens，支持文本、圖像和視頻統(tǒng)一，可同時理解文本和圖片，進(jìn)行圖文推理、問答、識別…

04-06

AMD Z2系列掌機(jī)CPU再添新成員：AI Z2 Extreme與Z2 A即將來襲！

04-06

微軟Copilot安卓版新動向：MSN資訊整合，盈利與功能雙升級！

04-06

Meta重磅發(fā)布Llama 4，開源AI大模型再升級，能否引領(lǐng)新潮流？

04-06

廣西高速“路網(wǎng)先知”上線，清明出行擁堵提前半小時預(yù)知

04-06

廣西清明假期高速新招！AI+無人機(jī)聯(lián)動治堵，出行更順暢

04-06

點擊查看更多 +

全站最新

小米15周年慶典，眾高管齊發(fā)聲：新起點，新征程，繼續(xù)努力！

小米Su7事件引熱議：新能源車安全底線何在？

余承東卸任車BU董事長后首發(fā)聲：問界M8小訂破10萬，聚焦新方向？

本田Prelude雙門轎跑復(fù)活，2.0L混動系統(tǒng)對決豐田86，2025年上市！

長江產(chǎn)投建信投資等在湖北成立股權(quán)基金出資額6億

打工人必看！6萬買插混車，五菱星光還是吉利？一算油費差距大！

熱門內(nèi)容

某大廠大模型高管涉婚變，公司賬號停用引熱議
美團(tuán)等巨頭聯(lián)手投資硅基流動，共筑生成式AI設(shè)施新藍(lán)圖
00后主播借AI工具DeepSeek，直播單日狂攬3.3億銷售額！
華為Pura X震撼發(fā)布：獨特“闊折疊”形態(tài)，售價7499元起引領(lǐng)新潮流！
立陶宛高校：學(xué)生不當(dāng)使用AI，學(xué)術(shù)不端遭開除
AI大模型時代，文科生將何去何從？
夸克全新升級：AI超級框，你的全能助手來了！
Ollama部署DeepSeek隱患多？騰云悅智安全實驗室教你如何加固防護(hù)！
阿里新夸克AI超級框上線，能否撼動騰訊元寶的AI入口地位？
英偉達(dá)推出DGX Spark與Station個人AI超算，Spark版售3000美元起
百度文心大模型4.5及X1正式發(fā)布，全面免費開放，性能對標(biāo)國際前沿
315曝光信息黑洞后，遼寧云企智能科技經(jīng)營異常被列入名錄
谷歌開源Gemma-3多模態(tài)大模型，性能強(qiáng)勁媲美業(yè)界頂尖
阿里新夸克：AI超級框能否引領(lǐng)移動互聯(lián)網(wǎng)新入口？
比爾·蓋茨展望：AI將深度改造行業(yè)，人類生來不為工作？

本欄最新

中國“本源悟空”量子計算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實戰(zhàn)

深圳海關(guān)智能機(jī)器人大升級！DeepSeek-R1助力通關(guān)效率飆升

廣西“路網(wǎng)先知”大顯身手，清明假期交通保障智慧升級！

《創(chuàng)：戰(zhàn)神》預(yù)告震撼來襲，AI覺醒未來都市，10月10日北美震撼上映！

《創(chuàng)：戰(zhàn)神》預(yù)告燃爆！10月10日，AI覺醒震撼來襲

全球風(fēng)投涌向AI，OpenAI與Meta競賽，亞洲市場緣何低迷？

本文鏈接：http://www.tebozhan.com/showinfo-45-11994-0.html合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 2025家電新風(fēng)向：抖音引領(lǐng)行業(yè)變革，六大趨勢賽道預(yù)示生活新變革！

下一篇：中國“本源悟空”量子計算機(jī)，全球領(lǐng)跑十億參數(shù)AI大模型微調(diào)實戰(zhàn)

標(biāo)簽：

熱門焦點

B端難做：留給魔琺科技的時間不多了

來源：零態(tài)LT元宇宙泡沫正在碎裂，進(jìn)入2023年后這一賽道熱度一直在遞減。今年2月，微軟解散了成立僅四個月的工業(yè)元宇宙部門；今年3月，該公司2017年收購的虛擬現(xiàn)實社交平臺AltspaceVR
元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

來源：首席品牌官從被稱為“元宇宙元年”的2021年開始，幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法，相信多數(shù)人腦海里首先浮現(xiàn)
時尚領(lǐng)域進(jìn)軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

想象一個你的數(shù)字身份與現(xiàn)實身份同樣重要的世界。想象一個你需要為虛擬自我準(zhǔn)備資產(chǎn)和物資的地方——你需要金錢（Crypto）、房屋（可能建在Minecraft上）和衣物。隨著
“任何國產(chǎn)元宇宙都是假元宇宙”

上個月，華語樂壇的優(yōu)質(zhì)偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產(chǎn)品分布式大陸(Decentraland)上買了三塊虛擬地產(chǎn)，花了12.3萬美元（也就是人民幣接近80萬）。截至目
搭上“谷愛凌”，“柳夜熙們”站上風(fēng)口？

作者：張琳曹楊從“永不塌房”的藝人到頻頻亮相北京冬奧會，作為元宇宙細(xì)分賽道之一的虛擬數(shù)字人又火了一把。2月7日，即谷愛凌摘得冬奧會自由式滑雪大跳臺金牌的
超級碗的加密時刻：是主流信號還是“網(wǎng)絡(luò)超級碗2.0”？

2 月 13 日，美東時間 18:30，有著“美國春晚”之譽(yù)的超級碗（Super Bowl）落下帷幕。超級碗是美國國家美式足球聯(lián)盟（也稱為國家橄欖球聯(lián)盟）的年度冠軍賽，勝者將成為“世
數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素與數(shù)字治理

深入理解數(shù)字經(jīng)濟(jì)與數(shù)據(jù)要素，有利于更準(zhǔn)確理解和把握數(shù)字治理的基本規(guī)律，構(gòu)建面向未來的健康的數(shù)字治理體系，也才能更好地理解元宇宙的治理框架。一、數(shù)字經(jīng)濟(jì)
NFT也有黃牛？這家公司專門對付外掛作弊機(jī)器人

澳大利亞前總理馬爾科姆·特恩布爾 (Malcolm Turnbull) 是支持薩姆·Crowther (Sam Crowther) 的人之一，Sam是一名出生于紐卡斯?fàn)柕暮诳停穆殬I(yè)生涯始于為國防
淺聊DAO圖景和未來

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治組織，是基于區(qū)塊鏈技術(shù)，由社區(qū)通過透明的決策過程運行和管理的組織形態(tài)。DAO使得社區(qū)成為

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

合成數(shù)據(jù)助力，谷歌等大模型數(shù)學(xué)推理能力突飛猛進(jìn)！

B端難做：留給魔琺科技的時間不多了

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

時尚領(lǐng)域進(jìn)軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

“任何國產(chǎn)元宇宙都是假元宇宙”

搭上“谷愛凌”，“柳夜熙們”站上風(fēng)口？

超級碗的加密時刻：是主流信號還是“網(wǎng)絡(luò)超級碗2.0”？

數(shù)字經(jīng)濟(jì)、數(shù)據(jù)要素與數(shù)字治理

NFT也有黃牛？這家公司專門對付外掛作弊機(jī)器人

淺聊DAO圖景和未來

最新推薦

一份全面清單：Web3行業(yè)高薪酬的13種工作

中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告（2021）

吸金31億美元，誰在催火2021年的鏈游？

以用戶為中心，Web3和區(qū)塊鏈如何將用戶放在首位

元宇宙畫廊體驗報告：有點頭疼。

想進(jìn)入web3.0？來看看哪些工作適合你

猜你喜歡

熱門推薦

相關(guān)資訊