當前位置：首頁 > 元宇宙 > AI

阿里通義千問全新視覺理解模型 Qwen2.5-VL 開源：三尺寸版本、支持理解長視頻和捕捉事件等能力

來源：責編：時間：2025-01-31 10:30:12 95觀看

導讀 1 月 28 日消息，阿里通義千問官方今日發文宣布，開源全新的視覺理解模型 Qwen2.5-VL——Qwen 模型家族的旗艦視覺語言模型，推出了 3B、7B 和 72B 三個尺寸版本。附 Qwen2.5-VL 的主要特點如下：視覺理解：Qwen2.5-VL

1 月 28 日消息，阿里通義千問官方今日發文宣布，開源全新的視覺理解模型 Qwen2.5-VL——Qwen 模型家族的旗艦視覺語言模型，推出了 3B、7B 和 72B 三個尺寸版本。

附 Qwen2.5-VL 的主要特點如下：

視覺理解：Qwen2.5-VL 不僅擅長識別常見物體，如花、鳥、魚和昆蟲，還能夠分析圖像中的文本、圖表、圖標、圖形和布局。

代理：Qwen2.5-VL 直接作為一個視覺 Agent，可以推理并動態地使用工具，初步具備了使用電腦和使用手機的能力。

理解長視頻和捕捉事件：Qwen2.5-VL 能夠理解超過 1 小時的視頻，并且這次它具備了通過精準定位相關視頻片段來捕捉事件的新能力。

視覺定位：Qwen2.5-VL 可以通過生成 bounding boxes 或者 points 來準確定位圖像中的物體，并能夠為坐標和屬性提供穩定的 JSON 輸出。

結構化輸出：對于發票、表單、表格等數據，Qwen2.5-VL 支持其內容的結構化輸出，惠及金融、商業等領域的應用。

據官方介紹，在旗艦模型 Qwen2.5-VL-72B-Instruct 的測試中，它在一系列涵蓋多個領域和任務的基準測試中表現出色，包括大學水平的問題、數學、文檔理解、視覺問答、視頻理解和視覺 Agent。Qwen2.5-VL 在理解文檔和圖表方面具有優勢，并且能夠作為視覺 Agent 進行操作，而無需特定任務的微調。

另外，在較小的模型方面，Qwen2.5-VL-7B-Instruct 在多個任務中超越了 GPT-4o-mini，而 Qwen2.5-VL-3B 作為端側 AI 的潛力股，超越了之前版本 Qwen2-VL 的 7B 模型。

阿里通義千問官方表示，與 Qwen2-VL 相比，Qwen2.5-VL 增強了模型對時間和空間尺度的感知能力，并進一步簡化了網絡結構以提高模型效率。后續將進一步提升模型的問題解決和推理能力，同時整合更多模態，使模型變得更加智能，并向能夠處理多種輸入類型和任務的綜合全能模型邁進。

本文鏈接：http://www.tebozhan.com/showinfo-45-10327-0.html阿里通義千問全新視覺理解模型 Qwen2.5-VL 開源：三尺寸版本、支持理解長視頻和捕捉事件等能力

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： DeepSeek 深夜再放大招：7B 參數人人可用的視覺多模態模型 Janus-Pro-7B 開源

下一篇： DeepSeek 應用在意大利應用商店下架，此前曾被該國隱私監管機構盯上

標簽：

熱門焦點

搭上“谷愛凌”，“柳夜熙們”站上風口？

作者：張琳曹楊從“永不塌房”的藝人到頻頻亮相北京冬奧會，作為元宇宙細分賽道之一的虛擬數字人又火了一把。2月7日，即谷愛凌摘得冬奧會自由式滑雪大跳臺金牌的
比特幣的價格越高，使用價值越大

隔夜比特幣還是在精準地橫盤在42k上方。空頭昨日試圖發起一波小的攻勢，但是晚上就被多頭掰了回來。以太坊的鏈上gas price降到了60 gwei以下，彰顯著市場活躍度的
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙。【
Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

概述自從Meta在2月初公布財報后，其負責元宇宙的核心部門Reality Labs表現不佳，凈虧損超100億美元，隨后股價斷崖式下跌。如今，Meta開始繼續發力元宇宙，想要挽回頹勢，
Shiba Inu布局元宇宙走出Meme局限

以「狗狗幣殺手」成名的Shiba Inu（SHIB）在人們的印象中始終有著濃厚的Meme（模因惡搞）烙印，但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區后，Shiba Inu
NFT：新騙局的狩獵場

騙局的自動化需要更好的防御，從數字身份開始。前幾天我在OpenSea上購買了一個NFT，是才華橫溢的藝術家海倫·福爾摩斯 (Helen Holmes) 的漫畫，來自她的 "原作 "收
NFT領域，我們是否應該遵守版權法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外，圍繞著NFT行業內的版權和知識產權盜竊的問題也同樣重要，因為人們很容易誤解這些事情
知名藝術家打造去中心化“好萊塢”：一部電影一個DAO

根據市場追蹤網站 DappRadar 的數據，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2
從NFT數字收藏，洞察數字音樂版權市場發展趨勢

去年8月9日，騰訊音樂布局NFT數字收藏，在騰訊應用寶發布幻核app，騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

阿里通義千問全新視覺理解模型 Qwen2.5-VL 開源：三尺寸版本、支持理解長視頻和捕捉事件等能力

搭上“谷愛凌”，“柳夜熙們”站上風口？

比特幣的價格越高，使用價值越大

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

Shiba Inu布局元宇宙走出Meme局限

NFT：新騙局的狩獵場

NFT領域，我們是否應該遵守版權法

知名藝術家打造去中心化“好萊塢”：一部電影一個DAO

從NFT數字收藏，洞察數字音樂版權市場發展趨勢

最新推薦

聚焦虛擬數字人技術，這三大商機要抓住！

亞馬遜AIGC全家桶來襲，巨頭AI大亂戰都有什么殺手锏

現在的元宇宙：一款低配版的科幻游戲

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

從4個方面解析2022年加密行業趨勢

元宇宙收割了誰

猜你喜歡

熱門推薦

相關資訊