當前位置：首頁 > 元宇宙 > AI

DeepSeek 深夜再放大招：7B 參數人人可用的視覺多模態模型 Janus-Pro-7B 開源

來源：責編：時間：2025-01-31 10:29:56 62觀看

導讀 1 月 28 日消息，就在北京時間今日凌晨，DeepSeek 宣布開源全新的視覺多模態模型 Janus-Pro-7B，其在 GenEval 和 DPG-Bench 基準測試中擊敗了 Stable Diffusion 和 OpenAI 的 DALL-E 3。附地址：GitHub：點此前往Huggi

1 月 28 日消息，就在北京時間今日凌晨，DeepSeek 宣布開源全新的視覺多模態模型 Janus-Pro-7B，其在 GenEval 和 DPG-Bench 基準測試中擊敗了 Stable Diffusion 和 OpenAI 的 DALL-E 3。

附地址：

GitHub：點此前往

HuggingFace：點此前往

官方對該模型的介紹大意如下：

Janus-Pro 是一種創新的自回歸框架，實現多模態信息的統一理解與生成。與以往的方法不同，Janus-Pro 通過將視覺編碼過程拆分為多個獨立的路徑，解決了以往框架中的一些局限性，同時仍采用單一的統一變換器架構進行處理。

這一解耦方式不僅有效緩解了視覺編碼器在理解和生成過程中可能出現的沖突，還提升了框架的靈活性。

Janus 的表現超越了傳統的統一模型，并且在與任務特定模型的比較中也同樣表現出色。憑借其簡潔、高靈活性和高效性的特點，Janus-Pro 成為下一代統一多模態模型的有力競爭者。

摘要的大意如下：

Janus-Pro 是一個統一的多模態大語言模型（MLLM），通過將視覺編碼過程從多模態理解和生成中解耦來實現更高效的處理。Janus-Pro 是基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 模型構建的。

在多模態理解任務中，Janus-Pro 采用 SigLIP-L 作為視覺編碼器，支持 384 x 384 像素的圖像輸入。而在圖像生成任務中，Janus-Pro 使用一個來自特定來源的分詞器，降采樣率為 16。

Janus-Pro 是先前工作 Janus 的進階版本。具體來說，Janus-Pro 整合了優化的訓練策略、擴展的訓練數據，以及更大模型規模的擴展。通過這些改進，Janus-Pro 在多模態理解和文本到圖像指令遵循能力方面取得了顯著進展，同時還增強了文本到圖像生成的穩定性。

據官方介紹，JanusFlow 引入了一種極簡架構，它將自回歸語言模型與校正流（一種最先進的生成模型方法）相集成。研究發現，校正流可以直接在大型語言模型框架內進行訓練，無需復雜的架構調整。大量實驗表明，JanusFlow 在各自領域內取得了與專用模型相當甚至更好的性能，同時在標準基準測試中顯著優于現有的統一方法。這項工作代表著朝著更高效、更通用的視覺語言模型邁進了一步。

本文鏈接：http://www.tebozhan.com/showinfo-45-10326-0.htmlDeepSeek 深夜再放大招：7B 參數人人可用的視覺多模態模型 Janus-Pro-7B 開源

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 阿爾特曼：DeepSeek-R1 令人印象深刻，將推出更好的模型

下一篇：阿里通義千問全新視覺理解模型 Qwen2.5-VL 開源：三尺寸版本、支持理解長視頻和捕捉事件等能力

標簽：

熱門焦點

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

保時捷又出超跑了，不過這次不是在現實世界，而是在虛擬世界。這款Vision Gran Turismo概念車，由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造，將于202
中國區塊鏈產業生態地圖報告（2021）

區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新，以服務實體經濟、政務民生以及公共服務等領域為落腳點，以期實現整個地區和產業的資
中國銀保監管委提示：謹慎投資，勿做接盤俠

中國銀保監管委，發布一則風險提示，內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
Web 3如何改變傳統HR

互聯網自誕生以來，經歷了三次迭代。Web1是第一階段，包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了，它引入了動態的用戶生成內容、互操作性、增
Meta 在衰落嗎？

扎克伯格已經很久沒有出現在公眾視野里了，近日，他罕見的接受播客采訪，在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點：是的阿倫·達
獨立故事片“Calladita”將使用 NFT 籌集資金

導演 Miguel Faus 正在轉向加密來資助他的處女作，由 Paula Grimaldo 和 Emily Mortimer 主演?！癈alladita”（導演 Miguel Faus）。圖片：米格爾·福斯在過去的一年
我們為什么需要Web3，距離Web3的實現還有多遠？

當今技術正在經歷著重要的變革，許多公司正在改變他們的經營模式以求變得更加的靈活，其中有很大一部分公司采用了不同的方式來發展自己的業務。其中之一就是Web3，
虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

六月的第一個周六，一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數43.6萬
售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

Everydays: the First 5000 Days/Beeple去年三月，一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是，這個拍賣作品不是出自哪位藝術大

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek 深夜再放大招：7B 參數人人可用的視覺多模態模型 Janus-Pro-7B 開源

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

中國區塊鏈產業生態地圖報告（2021）

中國銀保監管委提示：謹慎投資，勿做接盤俠

Web 3如何改變傳統HR

Meta 在衰落嗎？

獨立故事片“Calladita”將使用 NFT 籌集資金

我們為什么需要Web3，距離Web3的實現還有多遠？

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

最新推薦

一份全面清單：Web3行業高薪酬的13種工作

新周期，誰在堅守窄門？

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

聚焦虛擬數字人技術，這三大商機要抓??！

字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

猜你喜歡

熱門推薦

相關資訊