當前位置：首頁 > 元宇宙 > AI

小紅書首個多模態 AI 大模型 dots.vlm1 發布并開源，基于 DeepSeek V3 LLM

來源：責編：時間：2025-08-08 11:38:39 65觀看

導讀 8 月 6 日消息，小紅書 hi lab 研發并開源的首個多模態大模型 dots.vlm1 今日正式發布，借助一個從零訓練的 12 億參數視覺編碼器以及基于 DeepSeek V3 LLM 構建。小紅書 hi lab 表示，dots.vlm1 在大部分多模態評

8 月 6 日消息，小紅書 hi lab 研發并開源的首個多模態大模型 dots.vlm1 今日正式發布，借助一個從零訓練的 12 億參數視覺編碼器以及基于 DeepSeek V3 LLM 構建。

小紅書 hi lab 表示，dots.vlm1 在大部分多模態評測集上接近閉源 SoTA 模型的水平，并在文本能力和主流文本模型相當。

NaViT 視覺編碼器：沒有基于成熟視覺編碼器進行微調，完全從零開始訓練，原生支持動態分辨率。同時在文本監督上增加純視覺監督，提升感知能力上限。此外，訓練數據上在傳統的 Image Caption 數據上還引入大量結構化圖片進行原生訓練，提升 VLM 模型的感知能力（例如各類 OCR 能力）。

多模態訓練數據：在傳統思路上，額外引入多種合成數據思路，覆蓋多樣的圖片類型（例如表格 / Chart / 文檔 / Graphics 等）及其描述（例如 Alt Text / Dense Caption / Grounding 等）；同時，利用多模態大模型來重寫圖文交錯網頁數據，顯著提升訓練數據質量；

通過大規模預訓練與精細化后訓練調優，dots.vlm1 在視覺感知與推理方面達到了接近 SOTA 的表現，為開源視覺語言模型樹立了新的性能上限，同時在純文本任務中仍保持一定競爭力。

在主要的視覺評測集上，dots.vlm1 的整體表現已接近當前領先模型 Gemini 2.5 Pro 與 Seed-VL1.5 thinking，尤其在 MMMU / MathVision / OCR Reasoning 等多個基準測試中取得了相當競爭力的結果，顯示出較強的圖文理解與推理能力。

在典型的文本推理任務（如 AIME、GPQA、LiveCodeBench）上，dots.vlm1 的表現大致相當于 DeepSeek-R1-0528，在數學和代碼能力上已具備一定的通用性，但在 GPQA 等更多樣的推理任務上仍存在差距。

總體來看，dots.vlm1 在視覺多模態能力方面已接近 SOTA 水平，在文本推理方面達到了主流模型的性能。然而，在部分細分任務上仍與最優結果存在一定距離，需要在架構設計與訓練數據上進一步優化。

復雜圖表推理樣例：

STEM 解題樣例：

長尾識別解題樣例：

視覺推理樣例：

附 dots.vlm1 開源地址：

https://github.com/rednote-hilab/dots.vlm1

本文鏈接：http://www.tebozhan.com/showinfo-45-25984-0.html小紅書首個多模態 AI 大模型 dots.vlm1 發布并開源，基于 DeepSeek V3 LLM

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：摩爾線程：MUSA 成功適配 llama.cpp，直通全球 AI 生態圈

下一篇：谷歌為全美大學生送福利：未來三年投入 10 億美元提供 AI 培訓及訂閱服務

標簽：

熱門焦點

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

【《原神》開發商米哈游宣布創立元宇宙品牌】《原神》開發商米哈游宣布推出元宇宙品牌 HoYoverse，旨在通過各種娛樂服務為全球玩家創造并提供沉浸式虛擬世界體
Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

今日熱點：迪士尼任命新高管負責元宇宙業務；iFixit成為Valve Index VR頭顯和Steam Deck首家零件銷售商；Niantic與索尼達成合作，將為AR游戲《Ingress》帶來音頻體驗；V
“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報未達預期致盤后股價暴跌15.28%；YouTube宣布進軍區塊鏈和元宇宙；摩根大通成為首家進入元宇宙的銀行。【中
以太坊升級將會帶來的5個改變

以太坊自2015年誕生以來就廣受歡迎，但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用，用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

在Moviecoin.com平臺上，有一部電影設定了一個前所未有的目標，即通過預售NFT獲得100%的全額融資，這部電影就是馬克·奧康納(Mark O’connor)執導的《Oui Cannes》，
Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

概述自從Meta在2月初公布財報后，其負責元宇宙的核心部門Reality Labs表現不佳，凈虧損超100億美元，隨后股價斷崖式下跌。如今，Meta開始繼續發力元宇宙，想要挽回頹勢，
NFT：新騙局的狩獵場

騙局的自動化需要更好的防御，從數字身份開始。前幾天我在OpenSea上購買了一個NFT，是才華橫溢的藝術家海倫·福爾摩斯 (Helen Holmes) 的漫畫，來自她的 "原作 "收
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯網的門票，畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里，先是號稱元宇宙第一股的沙盒游戲Roblox盛裝

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

小紅書首個多模態 AI 大模型 dots.vlm1 發布并開源，基于 DeepSeek V3 LLM

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

以太坊升級將會帶來的5個改變

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

NFT：新騙局的狩獵場

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

元宇宙收割了誰

最新推薦

AI界地震！美國對OpenAI展開調查！監管風暴來襲！

汽車元宇宙，是概念還是未來？

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

餐桌上怎么變出元宇宙？

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

百度虛擬人——AI手語主播首次亮相冬奧會！

猜你喜歡

熱門推薦

相關資訊