當前位置：首頁 > 科技 > 數(shù)碼

英偉達OpenReasoning-Nemotron模型：數(shù)學推理超o3，開源LLM新巔峰

來源：責編：時間：2025-07-21 08:06:32 55觀看

導讀英偉達近日宣布推出OpenReasoning-Nemotron模型，這一創(chuàng)新成果基于Qwen2.5架構，并利用DeepSeek-R1-0528生成的數(shù)據(jù)進行訓練，展示了在數(shù)學、科學和代碼任務上的卓越推理能力。據(jù)悉，OpenReasoning-Nemotron在多個基準測試中

英偉達近日宣布推出OpenReasoning-Nemotron模型，這一創(chuàng)新成果基于Qwen2.5架構，并利用DeepSeek-R1-0528生成的數(shù)據(jù)進行訓練，展示了在數(shù)學、科學和代碼任務上的卓越推理能力。

據(jù)悉，OpenReasoning-Nemotron在多個基準測試中刷新了記錄，特別是在數(shù)學領域，其表現(xiàn)超越了先前的標桿模型o3。這一突破引發(fā)了業(yè)界的廣泛關注，人們紛紛猜測，開源模型領域的王座或將再次更迭。

英偉達此次推出的模型提供了四種參數(shù)規(guī)模，分別是1.5B、7B、14B和32B，用戶可以在本地實現(xiàn)100%運行。盡管這些模型帶有“國產(chǎn)血統(tǒng)”——其架構基于Qwen2.5，SFT訓練數(shù)據(jù)由DeepSeek-R1-0528生成，但它們在推理能力上的表現(xiàn)卻毫不遜色。

OpenReasoning-Nemotron被公認為當前最強的蒸餾推理模型。英偉達研究科學家Igor Gitman介紹了該模型的亮點，指出它不僅僅進行token預測，而是實現(xiàn)了真正的推理能力。這一突破得益于DeepSeek-R1-0528的蒸餾，該模型在5M的數(shù)學、代碼和科學推理軌跡上進行了訓練。

值得注意的是，OpenReasoning-Nemotron在沒有進行任何在線強化學習的情況下，僅通過有監(jiān)督微調（SFT）就取得了如此顯著的成果。未來，隨著進一步優(yōu)化或使用更少的token，這些模型有望實現(xiàn)相似甚至更好的性能。

除了在數(shù)學基準測試中超越OpenAI o3（高算力版）外，OpenReasoning-Nemotron還展現(xiàn)出了從數(shù)學到代碼的泛化能力。盡管這些模型僅針對數(shù)學問題訓練了GenSelect算法，但它們在代碼任務上也取得了令人驚訝的結果。

然而，英偉達也澄清，這是一次“研究性質”的模型發(fā)布，主要目標是驗證新生成數(shù)據(jù)的價值，并探索僅通過監(jiān)督微調能將性能推到何種程度。因此，這些模型目前可能無法勝任多輪對話或作為通用助手。

盡管如此，OpenReasoning-Nemotron在多個具有挑戰(zhàn)性的推理基準測試中仍表現(xiàn)出色，7B、14B和32B模型在各自規(guī)模類別下均創(chuàng)下了多項最先進紀錄。這一成果不僅展示了英偉達在AI領域的深厚積累，也為未來的推理模型研究提供了新的基線。

英偉達還發(fā)現(xiàn)了一些有趣的現(xiàn)象。例如，參數(shù)規(guī)模對模型性能的影響巨大，1.5B模型在處理較長上下文生成時可能不太一致，而7B或更大的模型則表現(xiàn)出了顯著的進步。模型還學會了兩種不同的行為：一種是使用工具但推理較差，另一種是不使用工具但推理很強。

為了讓更多用戶能夠體驗OpenReasoning-Nemotron模型的強大功能，英偉達提供了詳細的本地運行指南和模型鏈接。用戶只需下載適用于macOS、Windows或Linux的LM Studio，在搜索標簽頁輸入“openreasoning”，即可安裝所需版本的模型。

英偉達的這一創(chuàng)新成果無疑為AI領域帶來了新的活力，也為未來的推理模型研究指明了方向。隨著技術的不斷進步和應用場景的不斷拓展，我們有理由相信，AI將在更多領域展現(xiàn)出其獨特的價值和潛力。

本文鏈接：http://www.tebozhan.com/showinfo-24-171571-0.html英偉達OpenReasoning-Nemotron模型：數(shù)學推理超o3，開源LLM新巔峰

聲明：本網(wǎng)頁內容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：慢的DX12顯卡GT 1030實測FSR：幀數(shù)翻倍仍難以暢玩

下一篇： OPPO K13 Turbo系列性能新機：7月21日震撼發(fā)布，主打手游體驗

標簽：

熱門焦點

一加Ace2 Pro真機揭曉鈦空灰配色質感拉滿

終于，在經(jīng)過了幾波預熱之后，一加Ace2 Pro的外觀真機圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的，這次的外觀設計還是延續(xù)了一加11的方案，只是細節(jié)上有了調整，例如新加入了鈦空灰
Redmi Pad評測：紅米充滿野心的一次嘗試

從Note系列到K系列，從藍牙耳機到筆記本電腦，紅米不知不覺之間也已經(jīng)形成了自己頗有競爭力的產(chǎn)品體系，在中端和次旗艦市場上甚至要比小米新機的表現(xiàn)來得更好，正所謂“大丈夫生居
6月iOS設備性能榜：M2穩(wěn)居榜首 A系列只能等一手3nm來救

沒有新品發(fā)布，自然iOS設備性能榜的上榜設備就沒有什么更替，僅僅只有跑分變化而產(chǎn)生的排名變動，畢竟蘋果新品的發(fā)布節(jié)奏就是這樣的，一年下來也就幾個移動端新品，不會像安卓廠商，一
2天漲粉255萬，又一賽道在抖音爆火

來源：運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期，旅游賽道徹底火了：有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億；有的「博主」火了&m
小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

這段時間以來，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都有新的進展，其中榮耀、三星都已陸續(xù)發(fā)布了最新的折疊屏旗艦，尤其號榮耀Magi
華為Mate 60保護殼曝光：碩大后置相機模組凸起程度有驚喜

這段時間以來，關于華為新旗艦的爆料日漸密集。據(jù)此前多方爆料，今年華為將開始恢復一年雙旗艦戰(zhàn)略，除上半年推出的P60系列外，往年下半年的Mate系列也將
超級標準版旗艦！iQOO 11S全球首發(fā)iQOO超算獨顯芯片

上半年已接近尾聲，截至目前各大品牌旗下的頂級旗艦都已悉數(shù)亮相，而下半年即將推出的頂級旗艦已經(jīng)成為了數(shù)碼圈爆料的主流，其中就包括全新的iQOO 11S系
OPPO K11評測：旗艦級IMX890加持 2000元檔最強影像手機

【Techweb評測】中端機型用戶群體巨大，占了中國目前手機市場的大頭，一直以來都是各手機品牌的“必爭之地”，其中OPPO K系列機型一直以來都以高品質、
外交部：美方應停止在網(wǎng)絡安全問題上不負責任地指責他國

　中國外交部今天（16日）舉行例行記者會。會上，有記者問，美國情報官員稱，他們正在阻攔來自中國以及其他國家的黑客獲取相關科研成果。中方對此有何評論？對此

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

英偉達OpenReasoning-Nemotron模型：數(shù)學推理超o3，開源LLM新巔峰

一加Ace2 Pro真機揭曉鈦空灰配色質感拉滿

Redmi Pad評測：紅米充滿野心的一次嘗試

6月iOS設備性能榜：M2穩(wěn)居榜首 A系列只能等一手3nm來救

2天漲粉255萬，又一賽道在抖音爆火

小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

華為Mate 60保護殼曝光：碩大后置相機模組凸起程度有驚喜

超級標準版旗艦！iQOO 11S全球首發(fā)iQOO超算獨顯芯片

OPPO K11評測：旗艦級IMX890加持 2000元檔最強影像手機

外交部：美方應停止在網(wǎng)絡安全問題上不負責任地指責他國

最新推薦

猜你喜歡

熱門推薦

相關資訊