清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

來源：責編：時間：2024-01-02 09:26:41 232觀看

導讀 12 月 27 日消息，清華 KEG 實驗室近日和智譜 AI 合作，聯合推出了新一代圖像理解大模型 CogAgent。該模型基于此前推出的 CogVLM，通過視覺 GUI Agent，使用視覺模態（而非文本）對 GUI 界面進行更全面直接的感知，從而作

12 月 27 日消息，清華 KEG 實驗室近日和智譜 AI 合作，聯合推出了新一代圖像理解大模型 CogAgent。

該模型基于此前推出的 CogVLM，通過視覺 GUI Agent，使用視覺模態（而非文本）對 GUI 界面進行更全面直接的感知，從而作出規劃和決策。

CogAgent 可以接受 1120×1120 的高分辨率圖像輸入，具備視覺問答、視覺定位（Grounding）、GUI Agent 等多種能力，在 9 個經典的圖像理解榜單上（含 VQAv2，STVQA, DocVQA，TextVQA，MM-VET，POPE 等）取得了通用能力第一的成績。

例如，用戶輸入一張關于 CogVLM 項目的 GitHub 的圖片，然后詢問如何給這個項目點“Star”，然后 CogAgent 就會反饋出結果。

圖源：中國網科學

例如用戶輸入一張原神游戲的截圖，可以詢問“當前任務中的隊友是誰？”，CogAgent 會給出相關的回答。

附上相關信息地址如下：

論文：https://arxiv.org/abs/2312.08914

Demo：Streamlit

代碼：https://github.com/THUDM/CogVLM

本文鏈接：http://www.tebozhan.com/showinfo-45-3084-0.html清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：韓國首爾明年將啟用無人機及人工智能監控交通狀況

下一篇：算力巨獸能耗驚人：英偉達 H100 AI 芯片總耗電量將超歐洲小國

標簽：

熱門焦點

茅臺的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡單的事情。技術、世界觀、填充內容、載體形式，每一個環節都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
搶先推出“元宇宙”飲料，可口可樂贏麻了

試圖傍上元宇宙的品牌千千萬，但像可口可樂玩得這么花的，屬實不多。01 可口可樂盯上元宇宙1886年，可口可樂誕生于美國喬治亞州亞特蘭大市，至今已擁有136年的悠久歷
一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當數字人成為一種生意，我們更關心的是，他們如何賺到錢，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節，有一位虛擬美妝
【申萬宏源】必然的碎片化AI落地，哪種路徑可能勝出？ | 元宇宙Meta洞見

大規模預訓GPT(Generative PreTraining)是OpenAI在2018年提出的模型，大規模預訓練模型（大模型）漸漸成為了AI算法領域的熱點。AI產業鏈：從算力到應用工作流程視角?
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個脫胎于現實世界，又與現實世界平行、相互影響，并且始終在線的虛擬世
“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

2021年是游戲行業不確定性急劇上升的一年。一方面游戲正風光無限，騰訊等大廠更加密集地投資動作，讓游戲創投市場異?；馃?，"元宇宙"概念的大放異彩，更是吸引了Netfl
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

六月的第一個周六，一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數43.6萬
TX加入的NFT數字收藏品，元宇宙的破圈之路?

3月7日，澳大利亞 NFT 初創公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資，騰訊參投。想必國人最熟知的應該就是TX，作為國內四大互聯網

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

清華大學合作推出看圖答題小能手 CogAgent：可告知《原神》游戲操作步驟等

茅臺的元宇宙App火了，也被罵慘了

搶先推出“元宇宙”飲料，可口可樂贏麻了

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

【申萬宏源】必然的碎片化AI落地，哪種路徑可能勝出？ | 元宇宙Meta洞見

游戲玩家才是最“元宇宙”的

“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

TX加入的NFT數字收藏品，元宇宙的破圈之路?

最新推薦

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

字節覓《原神》，騰訊元宇宙，游戲新王戰舊神？

從冰墩墩到無聊猿，解秘未來IP爆款的模因

Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

Meta 在衰落嗎？

冬奧會數字收藏品升溫，市場再現“一墩難求”

猜你喜歡

熱門推薦

相關資訊