AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

小紅書開源多模態大模型dots.vlm1,視覺理解與推理能力接近頂尖水平

來源: 責編: 時間:2025-08-08 15:09:10 34觀看
導讀小紅書,這家以“種草”文化著稱的社交平臺,近期在AI技術自研領域邁出了重要步伐,連續兩個月內發布了三款開源模型,引起了業界的廣泛關注。最新亮相的多模態大模型dots.vlm1,憑借其強大的視覺理解和推理能力,展現了接近Gemin

小紅書,這家以“種草”文化著稱的社交平臺,近期在AI技術自研領域邁出了重要步伐,連續兩個月內發布了三款開源模型,引起了業界的廣泛關注。最新亮相的多模態大模型dots.vlm1,憑借其強大的視覺理解和推理能力,展現了接近Gemini 2.5 Pro閉源模型的實力。qAH28資訊網——每日最新資訊28at.com

在競爭激烈的AI領域,各大科技公司紛紛推出自家模型,OpenAI的Claude升級至4.1版本,谷歌則推出了用于生成游戲世界的Genie 3,引發社區熱議。國產模型也不甘示弱,HuggingFace平臺上的前十名開源模型中,已有多個來自國內團隊。然而,仔細觀察這些排名靠前的模型,不難發現,大多數仍為文本模型,缺乏多模態能力。qAH28資訊網——每日最新資訊28at.com

qAH28資訊網——每日最新資訊28at.com

小紅書的人文智能實驗室(Humane Intelligence Lab,簡稱hi lab)近日低調開源了其首個多模態大模型dots.vlm1,為視覺語言模型(VLM)領域帶來了新氣象。這款模型基于小紅書自研的12億參數NaViT視覺編碼器和DeepSeek V3大語言模型構建,不僅在視覺理解和推理任務上表現出色,還保持了純文本任務中的競爭力。qAH28資訊網——每日最新資訊28at.com

hi lab此前開源的dots.ocr文檔解析模型已在Huggingface平臺上獲得熱榜第七的好成績,盡管其基礎模型參數僅為17億,但性能卻達到了業界領先水平。這一成就顯示了hi lab團隊在AI技術自研方面的認真態度和強大實力。qAH28資訊網——每日最新資訊28at.com

dots.vlm1在多個視覺評測集上的表現接近當前領先的Gemini 2.5 Pro與Seed-VL1.5 Thinking模型,顯示出強大的圖文理解與推理能力。在文本推理任務上,dots.vlm1的表現與DeepSeek-R1-0528相當,盡管在數學和代碼能力上已具備一定的通用性,但在更多樣化的推理任務上仍有提升空間。qAH28資訊網——每日最新資訊28at.com

在實際測試中,dots.vlm1展現了令人驚艷的能力。面對復雜圖表和數獨問題,模型能夠逐步分析并給出正確答案,甚至在長時間思考過程中出現了類似DeepSeek的“啊哈時刻”,體現了其真正的思考和推理能力。dots.vlm1還能解決紅綠色盲數字問題,進行數學計算,甚至模仿李白詩風創作詩詞,展現了其全面的多模態能力。qAH28資訊網——每日最新資訊28at.com

dots.vlm1的技術架構由三個核心組件構成:全自研的NaViT視覺編碼器、輕量級的MLP適配器以及DeepSeek V3 MoE大語言模型。這一架構通過三階段流程進行訓練,包括視覺編碼器預訓練、VLM預訓練和VLM后訓練,旨在提升模型對多樣視覺數據的感知能力和泛化能力。qAH28資訊網——每日最新資訊28at.com

NaViT視覺編碼器是dots.vlm1的核心之一,它完全從零開始訓練,原生支持動態分辨率,專為視覺語言模型設計。通過兩階段的訓練策略,NaViT編碼器在基礎視覺和語義感知以及高分辨率輸入處理方面均表現出色。qAH28資訊網——每日最新資訊28at.com

在預訓練數據方面,hi lab為dots.vlm1準備了跨模態互譯數據和跨模態融合數據兩大類別,旨在構建一個全譜系的數據分布,覆蓋所有可被人類理解且可轉化為離散token序列的視覺信息。這些數據包括普通圖像、復雜圖表、OCR場景圖像、視頻幀以及Grounding監督數據等,為模型的多模態能力提供了有力支持。qAH28資訊網——每日最新資訊28at.com

小紅書之所以在AI大模型領域加大自研力度,是因為多模態能力已成為通向通用人工智能(AGI)的必經之路。通過模擬人類利用多種感官綜合感知世界的方式,多模態AI能夠形成更全面、細致的理解,對復雜場景作出更整體化的判斷。在自動駕駛、具身智能等領域,VLM正成為機器人理解和融入人類社會的重要工具。qAH28資訊網——每日最新資訊28at.com

qAH28資訊網——每日最新資訊28at.com

小紅書hi lab在AI技術自研上的決心和投入不僅體現在dots.vlm1上,還體現在其不斷壯大的dots模型家族中。從dots.llm1到dots.ocr再到dots.vlm1,小紅書正逐步構建起自己的AI技術生態。未來,隨著AI技術的不斷發展,小紅書有望在內容理解、個性化推薦以及社區交互等方面實現更多創新應用。qAH28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-176295-0.html小紅書開源多模態大模型dots.vlm1,視覺理解與推理能力接近頂尖水平

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果“美國制造計劃”啟動,未來四年將在美新增2萬個就業崗位

下一篇: 博通Jericho4芯片:破解大型AI運算功耗難題,實現多數據中心高效協同

標簽:
  • 熱門焦點
  • 7月安卓手機性能榜:紅魔8S Pro再奪榜首

    7月份的手機市場風平浪靜,除了紅魔和努比亞帶來了兩款搭載驍龍8Gen2領先版處理器的新機之外,別的也想不到有什么新品了,這也正常,通常6月7月都是手機廠商修整的時間,進入8月份之
  • 在線圖片編輯器,支持PSD解析、AI摳圖等

    自從我上次分享一個人開發仿造稿定設計的圖片編輯器到現在,不知不覺已過去一年時間了,期間我經歷了裁員失業、面試找工作碰壁,寒冬下一直沒有很好地履行計劃.....這些就放在日
  • 共享單車的故事講到哪了?

    來源丨海克財經與共享充電寶相差不多,共享單車已很久沒有被國內熱點新聞關照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發報道稱,成都、天津、鄭州等地多個共享單
  • 2天漲粉255萬,又一賽道在抖音爆火

    來源:運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔這個暑期,旅游賽道徹底火了:有的「地方」火了——貴州村超旅游收入 1 個月超過 12 億;有的「博主」火了&m
  • 中國家電海外掘金正當時|出海專題

    作者|吳南南編輯|胡展嘉運營|陳佳慧出品|零態LT(ID:LingTai_LT)2023年,出海市場戰況空前,中國創業者在海外紛紛摩拳擦掌,以期能夠把中國的商業模式、創業理念、戰略打法輸出海外,他們依
  • 當家的盒馬,加速謀生

    來源 | 價值星球Planet作者 | 歸去來自己“當家”的盒馬,開始加速謀生了。據盒馬官微消息,盒馬計劃今年開放生鮮供應鏈,將其生鮮商品送往食堂。目前,盒馬在上海已經與
  • 自研Exynos回歸!三星Galaxy S24系列將提供Exynos和驍龍雙版本

    年初,全新的三星Galaxy S23系列發布,包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三個版本,全系搭載超頻版驍龍8 Gen 2,雖同樣采用臺積電4nm工藝制
  • 與兆芯合作 聯想推出全新旗艦版筆記本電腦開天N7系列

    聯想與兆芯合作推出全新聯想旗艦版筆記本電腦開天 N7系列。這個系列采用兆芯KX-6640MA處理器平臺,KX-6640MA 處理器是采用了陸家嘴架構,16nm 工藝,4 核 4 線
  • 榮耀Magic4 至臻版 首創智慧隱私通話 強勁影音系統

    2022年第一季度臨近尾聲,在該季度內,許多品牌陸續發布自己的最新產品,讓大家從全新的角度來了解當今的手機技術。手機是電子設備中,更新迭代十分迅速的一款產品,基
Top