<ul id="aqqe0"></ul>

<fieldset id="aqqe0"></fieldset>

當前位置：首頁 > 元宇宙 > AI

小米多模態大模型 MiMo-VL 開源，官方稱多方面領先 Qwen2.5-VL-7B

來源：責編：時間：2025-06-02 11:04:47 40觀看

導讀 5 月 30 日消息，Xiaomi MiMo 官方公眾號今日發文宣布，小米多模態大模型 Xiaomi MiMo-VL 現已正式開源。官方表示，其在圖片、視頻、語言的通用問答和理解推理等多個任務上，大幅領先同尺寸標桿多模態模型 Qwen2.5-V

5 月 30 日消息，Xiaomi MiMo 官方公眾號今日發文宣布，小米多模態大模型 Xiaomi MiMo-VL 現已正式開源。官方表示，其在圖片、視頻、語言的通用問答和理解推理等多個任務上，大幅領先同尺寸標桿多模態模型 Qwen2.5-VL-7B，并且在 GUI Grounding 任務上比肩專用模型，為 Agent 時代而來。

MiMo-VL-7B 在保持 MiMo-7B 純文本推理能力的同時，在多模態推理任務上，僅用 7B 參數規模，在奧林匹克競賽（OlympiadBench）和多個數學競賽（MathVision、MathVerse）大幅領先 10 倍參數大的阿里 Qwen-2.5-VL-72B 和 QVQ-72B-Preview，也超越閉源模型 GPT-4o。

在評估真實用戶體驗的內部大模型競技場中，MiMo-VL-7B 超越 GPT-4o，成為開源模型第一。

其能夠完成復雜圖片推理和問答等任務，在長達 10 多步的 GUI 操作上，MiMo-VL-7B 也展示了不錯的潛力，甚至能幫你加購小米 SU7 至心愿單。

其采用了高質量的預訓練數據以及創新的混合在線強化學習算法（Mixed On-policy Reinforcement Learning, MORL）：

多階段預訓練：

收集、清洗、合成了高質量的預訓練多模態數據，涵蓋圖片-文本對、視頻-文本對、GUI 操作序列等數據類型，總計 2.4T tokens。通過分階段調整不同類型數據的比例，強化長程多模態推理的能力。

混合在線強化學習：

混合文本推理、多模態感知 + 推理、RLHF 等反饋信號，并通過在線強化學習算法穩定加速訓練，全方位提升模型推理、感知性能和用戶體驗。

MiMo-VL-7B 已開源 RL 前后兩個模型，附開源鏈接：https://huggingface.co/XiaomiMiMo及相關技術報告：https://github.com/XiaomiMiMo/MiMo-VL/blob/main/MiMo-VL-Technical-Report.pdf

MiMo-VL-7B 支持 50 + 測評任務的框架也已經開源至 GitHub：https://github.com/XiaomiMiMo/lmms-eval

本文鏈接：http://www.tebozhan.com/showinfo-45-13292-0.html小米多模態大模型 MiMo-VL 開源，官方稱多方面領先 Qwen2.5-VL-7B

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI編程時代，程序員將何去何從？

下一篇：蘋果聯合推出 AI 交錯推理方法，Qwen2.5 模型響應速度快 80%、準確率提高 19.3%

標簽：

熱門焦點

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

保時捷又出超跑了，不過這次不是在現實世界，而是在虛擬世界。這款Vision Gran Turismo概念車，由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造，將于202
超跑與NFT的首次結合，蘭博基尼能否破局？

蘭博基尼公司近日稱即將推出它的首款NFT，并且將加速進軍區塊鏈領域。這家聞名遐邇的意大利汽車廠商野心勃勃地將目光投向混合動力和電動跑車，并宣布將拍賣與瑞士
2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

傳感器是由敏感元件和轉換元件構成，能夠感受規定的檢測量(物理量、化學量、生物量等)，并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置，進而滿足信息的
中國銀保監管委提示：謹慎投資，勿做接盤俠

中國銀保監管委，發布一則風險提示，內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

對于大部分年輕人來說，剛剛過去的春節有一個詞語突然成為了品牌宣傳的流行語，作為從NFT中衍生出來的“數字藏品”一時間獲得了不少品牌青睞，他們紛紛推出自己的數
頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感覺可能與我一樣，這是一個讓人十分糾結的項目。之所以糾結，一方面他的團隊陣容強大，各種來自前英特爾、IBM、coinbase、fa
76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

“元宇宙的開拓者”是我們針對元宇宙的發展而設立的專欄，主要面向那些深挖元宇宙產業或者在元宇宙進行“淘金”的從業者，分享這些企業或者創業者們的故事，以獨特
售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

Everydays: the First 5000 Days/Beeple去年三月，一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是，這個拍賣作品不是出自哪位藝術大
TX加入的NFT數字收藏品，元宇宙的破圈之路?

3月7日，澳大利亞 NFT 初創公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資，騰訊參投。想必國人最熟知的應該就是TX，作為國內四大互聯網

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

小米多模態大模型 MiMo-VL 開源，官方稱多方面領先 Qwen2.5-VL-7B

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

超跑與NFT的首次結合，蘭博基尼能否破局？

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

中國銀保監管委提示：謹慎投資，勿做接盤俠

從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

TX加入的NFT數字收藏品，元宇宙的破圈之路?

最新推薦

聚焦虛擬數字人技術，這三大商機要抓住！

汽車元宇宙，是概念還是未來？

餐桌上怎么變出元宇宙？

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

費城藝術家使用區塊鏈，在數字藝術中狠狠撈一筆

HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態鏈AR眼鏡廠商

猜你喜歡

熱門推薦

相關資訊