當(dāng)前位置：首頁 > 元宇宙 > AI

昆侖萬維發(fā)布并開源 Skywork-R1V 3.0，多模態(tài)推理能力逼近人類專家水平

來源：責(zé)編：時間：2025-07-11 10:12:38 57觀看

導(dǎo)讀 7 月 9 日消息，昆侖萬維剛剛發(fā)布公告，宣布推出最新的Skywork-R1V 3.0 版本并開源。據(jù)昆侖萬維介紹，Skywork-R1V 3.0 在后訓(xùn)練階段通過強(qiáng)化學(xué)習(xí)策略深度激發(fā)模型的跨模態(tài)推理能力，在復(fù)雜邏輯建模與跨學(xué)科泛化方面

7 月 9 日消息，昆侖萬維剛剛發(fā)布公告，宣布推出最新的Skywork-R1V 3.0 版本并開源。

據(jù)昆侖萬維介紹，Skywork-R1V 3.0 在后訓(xùn)練階段通過強(qiáng)化學(xué)習(xí)策略深度激發(fā)模型的跨模態(tài)推理能力，在復(fù)雜邏輯建模與跨學(xué)科泛化方面實現(xiàn)雙重飛躍。

Skywork-R1V 3.0 基于上一代推理模型 Skywork-R1V 2.0 蒸餾數(shù)據(jù)進(jìn)行“冷啟動”，通過拒絕采樣構(gòu)建高質(zhì)量多模態(tài)推理訓(xùn)練集，指導(dǎo)開源視覺大模型 InternVL-38B（38B 參數(shù)）學(xué)會多模態(tài)推理的基本格式和方法。

隨后引入強(qiáng)化學(xué)習(xí)算法 GRPO（Group Relative Policy Optimization）深度激發(fā)模型的推理潛能，成功實現(xiàn)推理能力在圖像和文本模態(tài)之間的遷移，顯著提升其跨模態(tài)、多學(xué)科場景下的理解與分析表現(xiàn)。

據(jù)介紹，Skywork R1V 3.0 僅依賴約 1.2 萬條監(jiān)督微調(diào)樣本和 1.3 萬條強(qiáng)化學(xué)習(xí)樣本，便實現(xiàn)高效訓(xùn)練，充分體現(xiàn)了“小數(shù)據(jù)激發(fā)大能力”的優(yōu)勢。

性能方面，該模型在權(quán)威的綜合性多模態(tài)評測 MMMU 中取得了 76.0 的開源模型最高成績，超越了 Claude-3.7-Sonnet（75.0）和 GPT-4.5（74.4）等閉源模型，逼近人類初級專家水平（76.2）。

昆侖萬維表示，R1V 3.0 的高考數(shù)學(xué)突出成績，接近多款頂尖閉源模型，達(dá)到了開源多模態(tài)推理模型的最優(yōu)結(jié)果，證明了其卓越的實戰(zhàn)解題表現(xiàn)和跨場景泛化的穩(wěn)定性。

在更考驗視覺推理的EMMA-Mini(CoT)上，以開源領(lǐng)先的40.3分超過更大尺寸的 Qwen2.5-VL-72B-Instruct 和 InternVL3-78B 等模型，并縮小了與閉源模型 Claude-3.7-Sonnet 的差距。

在覆蓋中小學(xué)知識點的MMK12上，R1V 3.0 以78.5分再度領(lǐng)跑開源陣營，超越 Qwen2.5-VL-72B-Instruct、InternVL3-78B 等開源模型以及 GPT-4.5 和 GPT-4o 等閉源模型。

較上一代模型而言，Skywork-R1V 3.0 在物理、邏輯等多個關(guān)鍵領(lǐng)域取得了顯著性能提升，成為當(dāng)前開源領(lǐng)域最強(qiáng)勁的多模態(tài)推理模型之一：

物理推理：在物理領(lǐng)域的權(quán)威評測PhyX-MC-Text-Minimal和SeePhys中，Skywork-R1V 3.0 分別取得52.8分和31.5分的開源最優(yōu)成績，充分展現(xiàn)了其在多模態(tài)物理推理方面的卓越能力。模型不僅能夠精準(zhǔn)理解力學(xué)、電磁學(xué)等基礎(chǔ)物理概念，還擅長處理圖文結(jié)合的復(fù)雜物理問題（例如解析受力分析圖、電路示意圖等專業(yè)圖表），其物理推理水平已顯著超過當(dāng)前主流開源模型以及 GPT-4.5 和 Gemini 2 Flash 等部分閉源模型。

邏輯推理：Skywork-R1V 3.0 在多項權(quán)威邏輯推理評測中同樣表現(xiàn)卓越：在LogicVista測試中取得59.7分，在VisuLogic測試中取得28.5分。在MME-Reasoning中，Skywork-R1V 3.0 更是獲得42.8分的佳績，超越了閉源模型 Claude-4-Sonnet。這充分體現(xiàn)了 Skywork-R1V 3.0 在多模態(tài)邏輯一致性、條件推理和跨模態(tài)因果建模方面的領(lǐng)先能力。

數(shù)學(xué)推理：在數(shù)學(xué)類問題上，R1V 3.0 展現(xiàn)出卓越的解題能力。在權(quán)威數(shù)學(xué)評測基準(zhǔn) MathVista、MathVerse 和 MathVision 上，R1V 3.0 分別取得了 77.1 分、59.6 分和 52.6 分的優(yōu)異成績，領(lǐng)先于 Qwen2.5-VL-72B-Instruct、InternVL3-78B、QVQ-72B-Preview 等開源模型。

Skywork-R1V 3.0 下載：

HuggingFace 地址：https://huggingface.co/ Skywork / Skywork-R1V3-38B

GitHub 地址：https://github.com/SkyworkAI/Skywork-R1V

技術(shù)報告：https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V3.pdf

本文鏈接：http://www.tebozhan.com/showinfo-45-14480-0.html昆侖萬維發(fā)布并開源 Skywork-R1V 3.0，多模態(tài)推理能力逼近人類專家水平

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：美的副總裁王建國：未來三年計劃投入 500 億元以上布局 AI 大模型

下一篇：具身智能機(jī)器人公司星海圖再獲超 1 億美元融資，美團(tuán)龍珠、今日資本領(lǐng)投

標(biāo)簽：

熱門焦點

文心一言排名墊底，卻成為百度業(yè)績增長杠桿

文/侯煜編輯/羅卿知識增強(qiáng)大預(yù)言模式文心一言發(fā)布后，百度公司熱度大幅提升，文心一言到底能為百度的業(yè)績帶來多大的增益成為業(yè)內(nèi)關(guān)注焦點。近日，百度（NASDAQ：BIDU/09888.HK）公布了
聚焦虛擬數(shù)字人技術(shù)，這三大商機(jī)要抓住！

關(guān)于虛擬數(shù)字人，企業(yè)可以從三個方面入局，分別是ToG（To Government，面向政府），即為數(shù)字政府和數(shù)字城市提供支持服務(wù)；ToB（To Business，面向企業(yè)），即為企業(yè)提供虛擬員工解決方案；ToC（To Cons
從虛擬餐廳到虛擬時裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

自從 Facebook 更名為 Meta 后，關(guān)于元宇宙的討論愈發(fā)激烈，這一詞匯也越來越多的出現(xiàn)在我們的視野里。這是一個非常有趣的話題。伴隨著爭論，有些人認(rèn)為是馬克·扎
本周NFT領(lǐng)域重要資訊回顧

NFT在蘇富比拍賣是一波三折的嗎？其實不完全如此，但本周在蘇富比拍賣行發(fā)生了一系列有趣的事。與此同時，美聯(lián)社因其最新的NFT銷售被推到了風(fēng)口浪尖，而Opensea正面臨
量子計算在未來能否提高區(qū)塊鏈技術(shù)的效率

區(qū)塊鏈技術(shù)的主要成功之處在于對不透明的金融流程進(jìn)行了去中心化的訪問量子計算機(jī)的內(nèi)在目標(biāo)是解決傳統(tǒng)計算機(jī)不可能解決的問題隨著區(qū)塊鏈技術(shù)的使用案例逐漸
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產(chǎn)。除了我們在屏幕上看到的二維世界--手機(jī)、筆記本電腦、臺式機(jī)或iPad--他們決
頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

特別聲明，我們的文章不作為投資建議，請各位讀者獨立思考，還是那句話：投資要慎之又慎，誰也不要相信。Gary Verneychuk 和百威 NFT 之一。由 VeynerNFT 提供百威推出
知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

根據(jù)市場追蹤網(wǎng)站 DappRadar 的數(shù)據(jù)，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達(dá)到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2
淺聊DAO圖景和未來

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治組織，是基于區(qū)塊鏈技術(shù)，由社區(qū)通過透明的決策過程運行和管理的組織形態(tài)。DAO使得社區(qū)成為

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

昆侖萬維發(fā)布并開源 Skywork-R1V 3.0，多模態(tài)推理能力逼近人類專家水平

文心一言排名墊底，卻成為百度業(yè)績增長杠桿

聚焦虛擬數(shù)字人技術(shù)，這三大商機(jī)要抓住！

從虛擬餐廳到虛擬時裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

本周NFT領(lǐng)域重要資訊回顧

量子計算在未來能否提高區(qū)塊鏈技術(shù)的效率

如何在元宇宙中建立品牌忠誠度

頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個DAO

淺聊DAO圖景和未來

最新推薦

拯救XR，蘋果力不從心

2022年最具關(guān)注的9個頭像NFT項目

Meta正在研發(fā)元宇宙語音助手；廣東省462家企業(yè)申請元宇宙商標(biāo)

NFT世界的藝術(shù)家名單

想進(jìn)入web3.0？來看看哪些工作適合你

王老吉啟動元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

猜你喜歡

熱門推薦

相關(guān)資訊