當(dāng)前位置：首頁 > 元宇宙 > AI

GPT-4o 能玩《黑神話：悟空》：精英怪勝率超人類，無強(qiáng)化學(xué)習(xí)純大模型方案

來源：責(zé)編：時間：2024-09-25 16:36:07 93觀看

導(dǎo)讀 AI 玩黑神話，第一個精英怪牯護(hù)院輕松拿捏啊。有方向感，視角也沒有問題。躲閃劈棍很絲滑。甚至在打鴉香客和牯護(hù)院時，AI 的勝率已經(jīng)超過人類。而且是完全使用大模型玩，沒有使用強(qiáng)化學(xué)習(xí)。阿里巴巴的研究人員們提出

AI 玩黑神話，第一個精英怪牯護(hù)院輕松拿捏啊。

有方向感，視角也沒有問題。

躲閃劈棍很絲滑。

甚至在打鴉香客和牯護(hù)院時，AI 的勝率已經(jīng)超過人類。

而且是完全使用大模型玩，沒有使用強(qiáng)化學(xué)習(xí)。

阿里巴巴的研究人員們提出了一個新型 VARP（視覺動作角色扮演）智能體框架。它能直接將游戲截圖作為輸入，通過視覺語言模型推理，最終生成 Python 代碼形式的動作，以此來操作游戲。

以玩《黑神話?悟空》為例，該智能體在 90% 簡單和中等水平戰(zhàn)斗場景中取勝。

GPT-4o、Claude 3.5 都來迎戰(zhàn)

研究人員以《黑神話?悟空》為研究平臺，一共定義了 12 個任務(wù)，75% 與戰(zhàn)斗有關(guān)。

他們構(gòu)建了一個人類操作數(shù)據(jù)集，包含鍵鼠操作和游戲截圖，一共 1000 條有效數(shù)據(jù)。

每個操作都是由原子命令的各種組合組成的序列。原子命令包括輕攻、閃避、重攻擊、回血等。

然后，他們提出了 VARP 智能體框架。主要包含動作規(guī)劃系統(tǒng)和人類引導(dǎo)軌跡系統(tǒng)。

其中動作規(guī)劃系統(tǒng)由情境庫、動作庫和人類引導(dǎo)庫組成，利用 VLMs 進(jìn)行動作推理和生成，引入分解特定任務(wù)的輔助模塊和自我優(yōu)化的動作生成模塊。

人類引導(dǎo)軌跡系統(tǒng)利用人類操作數(shù)據(jù)改進(jìn)智能體性能，對于困難任務(wù)，通過查詢?nèi)祟愐龑?dǎo)庫獲取相似截圖和操作，生成新的人類引導(dǎo)動作。

同時 VARP 還包含 3 個庫：情景庫、動作庫和人工引導(dǎo)庫。這些庫中存儲了 agent 自我學(xué)習(xí)和人類指導(dǎo)的內(nèi)容，可以進(jìn)行檢索和更新。

動作庫中，“def new_func_a ()”表示動作計劃系統(tǒng)生成的新動作，“def new_func_h ()”表示人導(dǎo)軌跡系統(tǒng)生成的動作。“def pre_func ()”代表預(yù)定義的動作。

動作案例研究和相應(yīng)的游戲截圖。第一行和第二行中的操作是預(yù)定義的函數(shù)。第三行動作由人工制導(dǎo)軌跡系統(tǒng)生成。

SOAG 會在玩家角色與敵人的每次戰(zhàn)斗互動后總結(jié)第四行和第五行中的新動作，并將其存儲在動作庫中。

框架分別使用了 GPT-4o（2024-0513 版本）、Claude 3.5 Sonnet 和 Gemini 1.5 Pro。

對比人類和 AI 的表現(xiàn)結(jié)果，可以看到小怪部分 AI 們的表現(xiàn)達(dá)到人類玩家水平。

到了牯護(hù)院時，Claude 3.5 Sonnet 敗下陣來，GPT-4o 勝率最高。

但是對于新手玩家普遍頭疼的幽魂，AI 們也都束手無策了。

另外研究還提到，由于 VLMs 推理速度受到限制，是無法實時輸入每一幀畫面的。它只能間隔輸入關(guān)鍵幀，這也會導(dǎo)致 AI 在一些情況下錯過 boss 攻擊的關(guān)鍵信息。

以及由于游戲中沒有明確的道路引導(dǎo)且存在很多空氣墻，在沒有人類引導(dǎo)下，智能體也不能自已找到正確的路線。

如上研究來自阿里團(tuán)隊，一共有 5 位作者。

后續(xù)相關(guān)代碼和數(shù)據(jù)集有發(fā)布計劃，感興趣的童鞋可以蹲下。

One More Thing

AI 打游戲并不是一個新鮮事了，比如 AI 基于強(qiáng)化學(xué)習(xí)方法打《星際爭霸 II》已經(jīng)可以擊敗人類職業(yè)高手。

利用強(qiáng)化學(xué)習(xí)方案，往往需要輸入大量對局。商湯此前訓(xùn)練的 DI-star（監(jiān)督學(xué)習(xí) + 強(qiáng)化學(xué)習(xí)），就用了“16 萬場錄像”和“1 億局對戰(zhàn)”。

但是純大模型也能打游戲，還是很出乎意料的。在本項研究中，數(shù)據(jù)集中的有效數(shù)據(jù)為 1000 條。

論文地址：

https://arxiv.org/abs/2409.12889

項目地址：

https://varp-agent.github.io/

本文來自微信公眾號：微信公眾號（ID：QbitAI），作者：小明，原標(biāo)題《GPT-4o 能玩《黑神話》！精英怪勝率超人類，無強(qiáng)化學(xué)習(xí)純大模型方案》

本文鏈接：http://www.tebozhan.com/showinfo-45-7750-0.htmlGPT-4o 能玩《黑神話：悟空》：精英怪勝率超人類，無強(qiáng)化學(xué)習(xí)純大模型方案

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：微軟亞洲研究院與上海市精神衛(wèi)生中心展開聯(lián)合研究，借助多模態(tài)大模型為認(rèn)知障礙患者帶來全新訓(xùn)練方法

下一篇： AI“攻克”CAPTCHA 網(wǎng)站驗證系統(tǒng)

標(biāo)簽：

熱門焦點

星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數(shù)字資產(chǎn)交易服務(wù)。據(jù)悉，DBS于2021年初開設(shè)了機(jī)構(gòu)數(shù)字資產(chǎn)交易平臺，全
“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內(nèi)卷”的當(dāng)下，一眾虛擬人卻“內(nèi)卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業(yè)的虛擬人夏語冰登上央視節(jié)目《對話》，湖南
Meta、谷歌、微軟競相涌入元宇宙，小型企業(yè)該如何伺機(jī)而動？

目前來看元宇宙不會影響到小型企業(yè)的發(fā)展，但在接下來的十年內(nèi)可能會發(fā)生很多變化。很多有商業(yè)頭腦的企業(yè)家都在密切關(guān)注著元宇宙的發(fā)展。元宇宙這個詞，你一定或
好萊塢：一股新的電影制作加密浪潮將顛覆這個行業(yè)

在Moviecoin.com平臺上，有一部電影設(shè)定了一個前所未有的目標(biāo)，即通過預(yù)售NFT獲得100%的全額融資，這部電影就是馬克·奧康納(Mark O’connor)執(zhí)導(dǎo)的《Oui Cannes》，
Meta展示AI系統(tǒng)Builder Bot；《Pistol Whip》增加派對模式

今日熱點：Meta展示AI系統(tǒng)Builder Bot；招聘信息顯示Meta正在探索具有蜂窩連接功能的VR/AR頭顯；英國VR工作室Coatsink Games正在為PSVR 2開發(fā)新游戲；VR節(jié)奏射擊游戲
王老吉啟動元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

今日《元宇宙新鮮事》有：王老吉啟動元宇宙“吉空間”；HTC發(fā)布元宇宙應(yīng)用VIVERSE；Meta將在馬德里構(gòu)建一個元宇宙創(chuàng)新中心；央視網(wǎng)《新聞+》推出系列視頻《聊聊元宇宙
Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎(chǔ)設(shè)施，以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一，這在很大程度上是由 Facebo
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當(dāng)前數(shù)字景觀
這場虛擬發(fā)布會，當(dāng)面“造假”！

英偉達(dá)去年4月份那場發(fā)布會，你曾看出什么不對勁的地方嗎？你品，你細(xì)品——在計算機(jī)圖形學(xué)頂會SIGGRAPH 2021上，英偉達(dá)通過一部紀(jì)錄片自曝：那場發(fā)布會內(nèi)藏玄機(jī)~你看到

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

GPT-4o 能玩《黑神話：悟空》：精英怪勝率超人類，無強(qiáng)化學(xué)習(xí)純大模型方案

星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

Meta、谷歌、微軟競相涌入元宇宙，小型企業(yè)該如何伺機(jī)而動？

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業(yè)

Meta展示AI系統(tǒng)Builder Bot；《Pistol Whip》增加派對模式

王老吉啟動元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

元宇宙存在的意義和價值

這場虛擬發(fā)布會，當(dāng)面“造假”！

最新推薦

VR/AR迷失元宇宙“硝煙”

餐桌上怎么變出元宇宙？

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

王老吉啟動元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

百度虛擬人——AI手語主播首次亮相冬奧會！

Ceramic：為Web3.0社交應(yīng)用打造的中間件

猜你喜歡

熱門推薦

相關(guān)資訊