AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 網絡

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類

來源: 責編: 時間:2024-09-23 08:54:37 90觀看
導讀 AI玩黑神話,第一個精英怪牯護院輕松拿捏啊。有方向感,視角也沒有問題。躲閃劈棍很絲滑。甚至在打鴉香客和牯護院時,AI的勝率已經超過人類。而且是完全使用大模型玩,沒有使用強化學習。阿里巴巴的研究人員們提出

AI玩黑神話,第一個精英怪牯護院輕松拿捏啊。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

有方向感,視角也沒有問題。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

躲閃劈棍很絲滑。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

甚至在打鴉香客和牯護院時,AI的勝率已經超過人類。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

而且是完全使用大模型玩,沒有使用強化學習。nmP28資訊網——每日最新資訊28at.com

阿里巴巴的研究人員們提出了一個新型VARP(視覺動作角色扮演)智能體框架。nmP28資訊網——每日最新資訊28at.com

它能直接將游戲截圖作為輸入,通過視覺語言模型推理,終生成Python代碼形式的動作,以此來操作游戲。nmP28資訊網——每日最新資訊28at.com

以玩《黑神話·悟空》為例,該智能體在90%簡單和中等水平戰斗場景中取勝。nmP28資訊網——每日最新資訊28at.com

GPT-4o、Claude 3.5都來迎戰研究人員以《黑神話·悟空》為研究平臺,一共定義了12個任務,75%與戰斗有關。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

他們構建了一個人類操作數據集,包含鍵鼠操作和游戲截圖,一共1000條有效數據。nmP28資訊網——每日最新資訊28at.com

每個操作都是由原子命令的各種組合組成的序列。原子命令包括輕攻、閃避、重攻擊、回血等。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

然后,他們提出了VARP智能體框架。nmP28資訊網——每日最新資訊28at.com

主要包含動作規劃系統和人類引導軌跡系統。nmP28資訊網——每日最新資訊28at.com

其中動作規劃系統由情境庫、動作庫和人類引導庫組成,利用 VLMs 進行動作推理和生成,引入分解特定任務的輔助模塊和自我優化的動作生成模塊。nmP28資訊網——每日最新資訊28at.com

人類引導軌跡系統利用人類操作數據改進智能體性能,對于困難任務,通過查詢人類引導庫獲取相似截圖和操作,生成新的人類引導動作。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

同時VARP還包含3個庫:情景庫、動作庫和人工引導庫。nmP28資訊網——每日最新資訊28at.com

這些庫中存儲了agent自我學習和人類指導的內容,可以進行檢索和更新。nmP28資訊網——每日最新資訊28at.com

動作庫中,“def new_func_a()”表示動作計劃系統生成的新動作,“def new_func_h()”表示人導軌跡系統生成的動作。”def pre_func()”代表預定義的動作。nmP28資訊網——每日最新資訊28at.com

動作案例研究和相應的游戲截圖。第一行和第二行中的操作是預定義的函數。第三行動作由人工制導軌跡系統生成。nmP28資訊網——每日最新資訊28at.com

SOAG會在玩家角色與敵人的每次戰斗互動后總結第四行和第五行中的新動作,并將其存儲在動作庫中。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

框架分別使用了GPT-4o(2024-0513版本)、Claude 3.5 Sonnet和Gemini 1.5 Pro。nmP28資訊網——每日最新資訊28at.com

對比人類和AI的表現結果,可以看到小怪部分AI們的表現達到人類玩家水平。nmP28資訊網——每日最新資訊28at.com

到了牯護院時,Claude 3.5 Sonnet敗下陣來,GPT-4o勝率高。nmP28資訊網——每日最新資訊28at.com

但是對于新手玩家普遍頭疼的幽魂,AI們也都束手無策了。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

另外研究還提到,由于VLMs推理速度受到限制,是無法實時輸入每一幀畫面的。nmP28資訊網——每日最新資訊28at.com

它只能間隔輸入關鍵幀,這也會導致AI在一些情況下錯過boss攻擊的關鍵信息。nmP28資訊網——每日最新資訊28at.com

以及由于游戲中沒有明確的道路引導且存在很多空氣墻,在沒有人類引導下,智能體也不能自己找到正確的路線。nmP28資訊網——每日最新資訊28at.com

如上研究來自阿里團隊,一共有5位作者。nmP28資訊網——每日最新資訊28at.com

GPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類nmP28資訊網——每日最新資訊28at.com

后續相關代碼和數據集有發布計劃,感興趣的童鞋可以蹲下。nmP28資訊網——每日最新資訊28at.com

One More ThingnmP28資訊網——每日最新資訊28at.com

AI打游戲并不是一個新鮮事了,比如AI基于強化學習方法打《星際爭霸II》已經可以擊敗人類職業高手。nmP28資訊網——每日最新資訊28at.com

利用強化學習方案,往往需要輸入大量對局。nmP28資訊網——每日最新資訊28at.com

商湯此前訓練的DI-star(監督學習+強化學習),就用了“16萬場錄像”和“1億局對戰”。nmP28資訊網——每日最新資訊28at.com

但是純大模型也能打游戲,還是很出乎意料的。在本項研究中,數據集中的有效數據為1000條。nmP28資訊網——每日最新資訊28at.com

論文地址:https://arxiv.org/abs/2409.12889nmP28資訊網——每日最新資訊28at.com

項目地址:https://varp-agent.github.io/nmP28資訊網——每日最新資訊28at.com


文章出處:量子位

本文鏈接:http://www.tebozhan.com/showinfo-17-115181-0.htmlGPT-4o AI不學習就能玩《黑神話:悟空》!精英怪勝率超人類

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OPPO周意保:手機黑邊技術研究三年、很多膠水每克成本超黃金

下一篇: 用AI干預老年癡呆治療!微軟聯合上海“600號”

標簽:
  • 熱門焦點
Top