當(dāng)前位置：首頁(yè) > 科技 > 網(wǎng)絡(luò)

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

來源：責(zé)編：時(shí)間：2024-09-23 08:54:37 129觀看

導(dǎo)讀 AI玩黑神話，第一個(gè)精英怪牯護(hù)院輕松拿捏啊。有方向感，視角也沒有問題。躲閃劈棍很絲滑。甚至在打鴉香客和牯護(hù)院時(shí)，AI的勝率已經(jīng)超過人類。而且是完全使用大模型玩，沒有使用強(qiáng)化學(xué)習(xí)。阿里巴巴的研究人員們提出

AI玩黑神話，第一個(gè)精英怪牯護(hù)院輕松拿捏啊。

有方向感，視角也沒有問題。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

躲閃劈棍很絲滑。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

甚至在打鴉香客和牯護(hù)院時(shí)，AI的勝率已經(jīng)超過人類。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

而且是完全使用大模型玩，沒有使用強(qiáng)化學(xué)習(xí)。

阿里巴巴的研究人員們提出了一個(gè)新型VARP（視覺動(dòng)作角色扮演）智能體框架。

它能直接將游戲截圖作為輸入，通過視覺語(yǔ)言模型推理，終生成Python代碼形式的動(dòng)作，以此來操作游戲。

以玩《黑神話·悟空》為例，該智能體在90%簡(jiǎn)單和中等水平戰(zhàn)斗場(chǎng)景中取勝。

GPT-4o、Claude 3.5都來迎戰(zhàn)研究人員以《黑神話·悟空》為研究平臺(tái)，一共定義了12個(gè)任務(wù)，75%與戰(zhàn)斗有關(guān)。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

他們構(gòu)建了一個(gè)人類操作數(shù)據(jù)集，包含鍵鼠操作和游戲截圖，一共1000條有效數(shù)據(jù)。

每個(gè)操作都是由原子命令的各種組合組成的序列。原子命令包括輕攻、閃避、重攻擊、回血等。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

然后，他們提出了VARP智能體框架。

主要包含動(dòng)作規(guī)劃系統(tǒng)和人類引導(dǎo)軌跡系統(tǒng)。

其中動(dòng)作規(guī)劃系統(tǒng)由情境庫(kù)、動(dòng)作庫(kù)和人類引導(dǎo)庫(kù)組成，利用 VLMs 進(jìn)行動(dòng)作推理和生成，引入分解特定任務(wù)的輔助模塊和自我優(yōu)化的動(dòng)作生成模塊。

人類引導(dǎo)軌跡系統(tǒng)利用人類操作數(shù)據(jù)改進(jìn)智能體性能，對(duì)于困難任務(wù)，通過查詢?nèi)祟愐龑?dǎo)庫(kù)獲取相似截圖和操作，生成新的人類引導(dǎo)動(dòng)作。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

同時(shí)VARP還包含3個(gè)庫(kù)：情景庫(kù)、動(dòng)作庫(kù)和人工引導(dǎo)庫(kù)。

這些庫(kù)中存儲(chǔ)了agent自我學(xué)習(xí)和人類指導(dǎo)的內(nèi)容，可以進(jìn)行檢索和更新。

動(dòng)作庫(kù)中，“def new_func_a()”表示動(dòng)作計(jì)劃系統(tǒng)生成的新動(dòng)作，“def new_func_h()”表示人導(dǎo)軌跡系統(tǒng)生成的動(dòng)作。”def pre_func()”代表預(yù)定義的動(dòng)作。

動(dòng)作案例研究和相應(yīng)的游戲截圖。第一行和第二行中的操作是預(yù)定義的函數(shù)。第三行動(dòng)作由人工制導(dǎo)軌跡系統(tǒng)生成。

SOAG會(huì)在玩家角色與敵人的每次戰(zhàn)斗互動(dòng)后總結(jié)第四行和第五行中的新動(dòng)作，并將其存儲(chǔ)在動(dòng)作庫(kù)中。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

框架分別使用了GPT-4o（2024-0513版本）、Claude 3.5 Sonnet和Gemini 1.5 Pro。

對(duì)比人類和AI的表現(xiàn)結(jié)果，可以看到小怪部分AI們的表現(xiàn)達(dá)到人類玩家水平。

到了牯護(hù)院時(shí)，Claude 3.5 Sonnet敗下陣來，GPT-4o勝率高。

但是對(duì)于新手玩家普遍頭疼的幽魂，AI們也都束手無策了。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

另外研究還提到，由于VLMs推理速度受到限制，是無法實(shí)時(shí)輸入每一幀畫面的。

它只能間隔輸入關(guān)鍵幀，這也會(huì)導(dǎo)致AI在一些情況下錯(cuò)過boss攻擊的關(guān)鍵信息。

以及由于游戲中沒有明確的道路引導(dǎo)且存在很多空氣墻，在沒有人類引導(dǎo)下，智能體也不能自己找到正確的路線。

如上研究來自阿里團(tuán)隊(duì)，一共有5位作者。

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

后續(xù)相關(guān)代碼和數(shù)據(jù)集有發(fā)布計(jì)劃，感興趣的童鞋可以蹲下。

One More Thing

AI打游戲并不是一個(gè)新鮮事了，比如AI基于強(qiáng)化學(xué)習(xí)方法打《星際爭(zhēng)霸II》已經(jīng)可以擊敗人類職業(yè)高手。

利用強(qiáng)化學(xué)習(xí)方案，往往需要輸入大量對(duì)局。

商湯此前訓(xùn)練的DI-star（監(jiān)督學(xué)習(xí)+強(qiáng)化學(xué)習(xí)），就用了“16萬場(chǎng)錄像”和“1億局對(duì)戰(zhàn)”。

但是純大模型也能打游戲，還是很出乎意料的。在本項(xiàng)研究中，數(shù)據(jù)集中的有效數(shù)據(jù)為1000條。

論文地址：https://arxiv.org/abs/2409.12889

項(xiàng)目地址：https://varp-agent.github.io/

文章出處：量子位

本文鏈接：http://www.tebozhan.com/showinfo-17-115181-0.htmlGPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： OPPO周意保：手機(jī)黑邊技術(shù)研究三年、很多膠水每克成本超黃金

下一篇：用AI干預(yù)老年癡呆治療！微軟聯(lián)合上海“600號(hào)”

標(biāo)簽：

熱門焦點(diǎn)

太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

8月5日消息，從小米商城了解到，Redmi MAX 100英寸巨屏電視日前迎來官方優(yōu)惠，到手價(jià)12999元，比發(fā)布價(jià)便宜了7000元，在大屏電視市場(chǎng)開卷。據(jù)了解，Redmi MAX 100
三言兩語(yǔ)說透設(shè)計(jì)模式的藝術(shù)-單例模式

寫在前面單例模式是一種常用的軟件設(shè)計(jì)模式，它所創(chuàng)建的對(duì)象只有一個(gè)實(shí)例，且該實(shí)例易于被外界訪問。單例對(duì)象由于只有一個(gè)實(shí)例，所以它可以方便地被系統(tǒng)中的其他對(duì)象共享，從而減少
為什么你不應(yīng)該使用Div作為可點(diǎn)擊元素

按鈕是為任何網(wǎng)絡(luò)應(yīng)用程序提供交互性的最常見方式。但我們經(jīng)常傾向于使用其他HTML元素，如 div span 等作為 clickable 元素。但通過這樣做，我們錯(cuò)過了許多內(nèi)置瀏覽器的功能。
猿輔導(dǎo)與新東方的兩種“歸途”

作者｜卓心月出品｜零態(tài)LT（ID：LingTai_LT）如何成為一家偉大企業(yè)？答案一定是對(duì)“勢(shì)”的把握，這其中最關(guān)鍵的當(dāng)屬對(duì)企業(yè)戰(zhàn)略的制定，且能夠站在未來看現(xiàn)在，即使這其中的
新電商三兄弟，“抖快紅”成團(tuán)！

來源：價(jià)值研究所作者：Hernanderz 隨著內(nèi)容電商的概念興起，抖音、快手、小紅書組成的“新電商三兄弟”成為業(yè)內(nèi)一股不可忽視的勢(shì)力，給阿里、京東、拼多多帶去了巨大壓
大廠卷向扁平化

來源：新熵作者丨南枝編輯丨月見大廠職級(jí)不香了。俗話說，兵無常勢(shì)，水無常形，互聯(lián)網(wǎng)企業(yè)調(diào)整職級(jí)體系并不稀奇。7月13日，淘寶天貓集團(tuán)啟動(dòng)了近年來最大的人力制度改革，目前已形成一
小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

7月14日消息，今日一名博主在社交媒體發(fā)布了一張疑似小米汽車電池信息的照片，顯示該電池包正是寧德時(shí)代麒麟電池，容量為101kWh，電壓為726.7V，可以預(yù)測(cè)小
到手價(jià)3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強(qiáng)旗艦

5月23日，iQOO如期舉行了新品發(fā)布會(huì)，全新的iQOO Neo8系列也正式與大家見面，包含iQOO Neo8和iQOO Neo8 Pro兩個(gè)版本，其中標(biāo)準(zhǔn)版搭載高通驍龍8+，而Pro版更
首發(fā)天璣9200+ iQOO Neo8系列發(fā)布首銷售價(jià)2299元起

2023年5月23日晚，iQOO Neo8系列正式發(fā)布。其中，Neo系列首款Pro之作——iQOO Neo8 Pro強(qiáng)悍登場(chǎng)，限時(shí)售價(jià)3099元起；價(jià)位段最強(qiáng)性能手機(jī)iQOO Neo8同期上市

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

GPT-4o AI不學(xué)習(xí)就能玩《黑神話：悟空》！精英怪勝率超人類

太卷！Redmi MAX 100英寸電視便宜了：12999元買Redmi史上最大屏

三言兩語(yǔ)說透設(shè)計(jì)模式的藝術(shù)-單例模式

為什么你不應(yīng)該使用Div作為可點(diǎn)擊元素

猿輔導(dǎo)與新東方的兩種“歸途”

新電商三兄弟，“抖快紅”成團(tuán)！

大廠卷向扁平化

小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

到手價(jià)3099元起！iQOO Neo8 Pro今日首銷：安卓性能最強(qiáng)旗艦

首發(fā)天璣9200+ iQOO Neo8系列發(fā)布首銷售價(jià)2299元起

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊