AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

阿里云通義千問 Qwen2-VL 第二代視覺語言模型開源

來源: 責編: 時間:2024-09-05 08:57:24 63觀看
導讀 9 月 2 日消息,阿里云通義千問今日宣布開源第二代視覺語言模型 Qwen2-VL,并推出 2B、7B 兩個尺寸及其量化版本模型。同時,旗艦模型 Qwen2-VL-72B 的 API 已上線阿里云百煉平臺,用戶可直接調用。據阿里云官方介紹,

9 月 2 日消息,阿里云通義千問今日宣布開源第二代視覺語言模型 Qwen2-VL,并推出 2B、7B 兩個尺寸及其量化版本模型。同時,旗艦模型 Qwen2-VL-72B 的 API 已上線阿里云百煉平臺,用戶可直接調用。jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

據阿里云官方介紹,相比上代模型,Qwen2-VL 的基礎性能全面提升:jSN28資訊網——每日最新資訊28at.com

讀懂不同分辨率和不同長寬比的圖片,在 DocVQA、RealWorldQA、MTVQA 等基準測試創下全球領先的表現;jSN28資訊網——每日最新資訊28at.com

理解 20 分鐘以上長視頻,支持基于視頻的問答、對話和內容創作等應用;jSN28資訊網——每日最新資訊28at.com

具備強大的視覺智能體能力,可自主操作手機和機器人,借助復雜推理和決策的能力,Qwen2-VL 可以集成到手機、機器人等設備,根據視覺環境和文字指令進行自動操作;jSN28資訊網——每日最新資訊28at.com

理解圖像視頻中的多語言文本,包括中文、英文,大多數歐洲語言,日語、韓語、阿拉伯語、越南語等。jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

Qwen2-VL 延續了 ViT 加 Qwen2 的串聯結構,三個尺寸的模型都采用了 600M 規模大小的 ViT,支持圖像和視頻統一輸入。jSN28資訊網——每日最新資訊28at.com

但為了讓模型能夠更清楚地感知視覺信息和理解視頻,團隊在架構上進行了一些升級:jSN28資訊網——每日最新資訊28at.com

一是實現了對原生動態分辨率的全面支持。不同于上代模型,Qwen2-VL 能夠處理任意分辨率的圖像輸入,不同大小圖片將被轉換為動態數量的 tokens,最小只占 4 個 tokens。這一設計模擬了人類視覺感知的自然方式,確保了模型輸入與圖像原始信息之間的高度一致性,賦予模型處理任意尺寸圖像的強大能力,使得其可以更靈活高效地進行圖像處理。jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

二是使用了多模態旋轉位置嵌入(M-ROPE)方法。傳統的旋轉位置嵌入只能捕捉一維序列的位置信息,M-ROPE 使得大規模語言模型能夠同時捕捉和整合一維文本序列、二維視覺圖像以及三維視頻的位置信息,賦予了語言模型強大的多模態處理和推理能力,能讓模型更好地理解和建模復雜的多模態數據。jSN28資訊網——每日最新資訊28at.com

jSN28資訊網——每日最新資訊28at.com

此次 Qwen2-VL 開源的多款模型中的旗艦模型Qwen2-VL-72B 的 API 已上線阿里云百煉平臺,用戶可通過阿里云百煉平臺直接調用 API。jSN28資訊網——每日最新資訊28at.com

同時,通義千問團隊以 Apache 2.0 協議開源了 Qwen2-VL-2B 和 Qwen2-VL-7B,開源代碼已集成到 Hugging Face Transformers、vLLM 和其他第三方框架中。開發者可以通過 Hugging Face 和魔搭 ModelScope 下載使用模型,也可通過通義官網、通義 App 的主對話頁面使用模型,附地址如下:jSN28資訊網——每日最新資訊28at.com

阿里云百煉平臺:https://help.aliyun.com/zh/model-studio/developer-reference/qwen-vl-apijSN28資訊網——每日最新資訊28at.com

GitHub:https://github.com/QwenLM/Qwen2-VLjSN28資訊網——每日最新資訊28at.com

HuggingFace:https://huggingface.co/collections/Qwen/qwen2-vl-66cee7455501d7126940800djSN28資訊網——每日最新資訊28at.com

魔搭 ModelScope:https://modelscope.cn/organization/qwen?tab=modeljSN28資訊網——每日最新資訊28at.com

模型體驗:https://huggingface.co/spaces/Qwen/Qwen2-VLjSN28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-6703-0.html阿里云通義千問 Qwen2-VL 第二代視覺語言模型開源

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 清華系 AI 公司無問芯穹完成近 5 億元 A 輪融資,投資方含聯想創投、小米等

下一篇: 谷歌 AI 推出 CardBench 評估框架:含 20 個真實數據庫,更全面評估基數估計模型

標簽:
  • 熱門焦點
  • AI網紅能年賺百萬,普通人的新機會來了?

    來源|運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年 ,數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡,還是 AI 數字
  • 如何對一款 NFT 項目進行價值評估?

    原文作者 | Othmane Senhaji Rhazi,Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家,因為我相信我們正在見證社會
  • 本周NFT領域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時,美聯社因其最新的NFT銷售被推到了風口浪尖,而Opensea正面臨
  • 從英式拍到荷蘭拍,看傳統金融拍賣玩法如何玩轉NFT市場交易

    作者:魯拍賣是一種從古至今的商業活動。從古代的典當到現代的拍賣市場、我們熟知的拍賣行,以及知名街頭藝術家Bansky名畫拍賣成功后,竟自毀粉碎,現價值又翻倍的拍
  • 解決NFT流動性問題:一文了解Floor DAO

    流動性是證券市場上的一個術語,流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率,流動性最強的資產是現金本身。現在讓我們試著從流動性的角
  • PayPal CEO 的加密語錄:加密貨幣將重新定義金融世界

    PayPal 近年來一直是加密行業的倡導者。這個本身擁有超過 3.5 億名活躍用戶的支付巨頭,已經允許美國和英國的用戶交易或持有比特幣(BTC)、以太坊(ETH)、比特現金(BCH
  • 淺聊DAO圖景和未來

    DAO是什么?DAO (Decentralized Autonomous Organizations),去中心化自治組織,是基于區塊鏈技術,由社區通過透明的決策過程運行和管理的組織形態。DAO使得社區成為
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲,盡管游戲尚在研發中,這一消息已經讓中青寶的股價在51個交易
  • 售出6930萬美元的NFT已經過去一年,NFT如今是否已成為主流?

    Everydays: the First 5000 Days/Beeple去年三月,一件藝術品被著名拍賣行佳士得以6930萬美元的高價售出。而讓人們感到震驚的是,這個拍賣作品不是出自哪位藝術大
Top