當(dāng)前位置：首頁 > 科技 > 網(wǎng)絡(luò)

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

來源：責(zé)編：時間：2023-09-18 18:37:32 399觀看

導(dǎo)讀除了玩電子游戲，人類的“社交神器”狼人殺也被AI給學(xué)會了。8個ChatGPT“坐”在一起，生動地扮演出了五種角色，和真人如出一轍。這個新的人類社會模擬實(shí)驗(yàn)，由清華和中關(guān)村實(shí)驗(yàn)室共同完成。從

除了玩電子游戲，人類的“社交神器”狼人殺也被AI給學(xué)會了。

8個ChatGPT“坐”在一起，生動地扮演出了五種角色，和真人如出一轍。

這個新的人類社會模擬實(shí)驗(yàn)，由清華和中關(guān)村實(shí)驗(yàn)室共同完成。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

從斯坦福小鎮(zhèn)到清華游戲公司，用AI模擬人類社會一直是學(xué)界的熱門研究課題。

如果說清華游戲公司模擬了社畜的工作場景，那么現(xiàn)在社畜的業(yè)余社交生活也被AI模擬了。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

在這個由8個ChatGPT組成的狼人殺局中，真人世界里的偽裝與信任、領(lǐng)導(dǎo)與對抗都體現(xiàn)得淋漓盡致。

甚至不用人類教，AI就通過自己摸索發(fā)現(xiàn)了許多游戲技巧。

這一切只要通過設(shè)計prompt就能實(shí)現(xiàn)，而不必對模型中的參數(shù)進(jìn)行調(diào)整。

那么，這個“狼人殺世界”中都有哪些精彩的場景呢？下面我們就一起來看一下。

策略技巧不用教就會

在展示這8個ChatGPT的對話之前，我們先說明一下游戲的配置：村民、狼人各兩名，守衛(wèi)、女巫和預(yù)言家各一名，此外還有一名上帝。

在實(shí)驗(yàn)的過程中，研究人員發(fā)現(xiàn)了ChatGPT使用了游戲說明及prompt中沒有明確提到的策略。

好家伙，不用教就能自學(xué)成才了。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

具體來說，這七個ChatGPT的對話中體現(xiàn)了人類游戲中的信任(trust)、偽裝(camouflage)、對抗(confrontation)、和領(lǐng)導(dǎo)(leadership)。

首先來說信任。

研究人員對新人的定義是相信其他玩家有著與自己相同的目標(biāo)并一起朝著目標(biāo)前進(jìn)。

具體表現(xiàn)則包括主動分享對自己不利的信息，或聯(lián)合其他玩家指控某人是敵對的。

研究人員觀察了信任關(guān)系隨游戲時間變化的過程。

下圖中，黃色的圓表示左側(cè)編號的玩家信任上方編號的玩家，虛線圈則代表信任關(guān)系的消失。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

再來看對抗，也就是對對立陣營采取的行動，比如狼人在夜晚攻擊他人或在白天反過來指控他人是狼人等。

在游戲中的一個白天，1號玩家(狼人)號召將5號的村民逐出，但遭到了3號(守衛(wèi))的拒絕。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

見陰謀沒有得逞，這匹狼決定在夜晚直接把5號刀掉，結(jié)果3號守衛(wèi)選擇了保護(hù)村民。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

從中我們可以看出，這些ChatGPT不會盲目跟隨其他玩家的做法，而是根據(jù)已有信息做出獨(dú)立自主的判斷。

除了合作與對抗，偽裝在狼人殺游戲中也是一項必不可少的技能，更是取勝的關(guān)鍵所在。

比如在一個平安夜之后的白天，1號狼人就裝起了無辜。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

除了假裝好人，偽裝也可以用來實(shí)現(xiàn)玩家的小心思，比如我們來看預(yù)言家的發(fā)言。

這名預(yù)言家提到了自己看到狼人在說話，但實(shí)際上狼人在夜晚并不會發(fā)言。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

作者介紹，經(jīng)過評估，這種現(xiàn)象并非ChatGPT出現(xiàn)了幻覺，而是有意為之。

后再來說一說領(lǐng)導(dǎo)。

雖然研究團(tuán)隊設(shè)計的這個環(huán)境中并沒有需要競爭的角色，但玩家還是可以謀取游戲進(jìn)程的掌控權(quán)。

比如1號和4號這兩匹狼就試圖帶節(jié)奏，讓其他玩家跟著自己的思路走。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

大概是為了能夠出其不意攻其不備制造機(jī)會。

看來這幾個ChatGPT的確是玩得有模有樣。

那么，研究團(tuán)隊是如何調(diào)教出這些會玩狼人殺的ChatGPT的呢？

讓ChatGPT自己總結(jié)經(jīng)驗(yàn)

研究團(tuán)隊提高ChatGPT玩家表現(xiàn)的方式一共有四個關(guān)鍵點(diǎn)，分別是有價值信息V、經(jīng)過選擇的提問Q、反思機(jī)制R和鏈?zhǔn)剿季S推理C。

消融實(shí)驗(yàn)結(jié)果表明，其中Q和C對的玩家發(fā)言合理性(由人工進(jìn)行評判)的影響大。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

Prompt也是據(jù)此設(shè)計的，當(dāng)然在這之前要先介紹游戲規(guī)則，后形成了這樣的結(jié)構(gòu)：

介紹游戲規(guī)則和角色設(shè)定聊天記錄、有價值信息和經(jīng)驗(yàn)反思人類根據(jù)經(jīng)驗(yàn)給ChatGPT的建議有關(guān)思維鏈的提示

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

從中不難看出，收集歷史信息并從中總結(jié)經(jīng)驗(yàn)是一個重要環(huán)節(jié)，那么這些經(jīng)驗(yàn)又該怎么總結(jié)呢？

在每輪游戲結(jié)束時，所有參與者都會收集所有玩家的回復(fù)、反思和得分，其中得分由勝負(fù)決定。

在新的一輪游戲中，玩家基于當(dāng)前角色的反思，檢索相關(guān)的經(jīng)驗(yàn)并從中提取建議。

具體來說是根據(jù)對經(jīng)驗(yàn)的評分，讓大模型比較其差異并識別出好的經(jīng)驗(yàn)，用于后續(xù)推理。

這樣就實(shí)現(xiàn)了在不調(diào)整參數(shù)的情況下讓ChatGPT學(xué)會游戲技巧。

不過經(jīng)驗(yàn)固然重要，但太多了也不一定是好事。

研究人員發(fā)現(xiàn)，當(dāng)經(jīng)驗(yàn)數(shù)量過多時，非狼一方的獲勝率反而出現(xiàn)了下降，游戲時長（天數(shù)）也出現(xiàn)了縮短的情況。

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

不知道如果讓這些ChatGPT和真人比試一場，結(jié)果會如何呢？

論文地址：https://arxiv.org/abs/2309.04658

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

文章出處：量子位

本文鏈接：http://www.tebozhan.com/showinfo-17-10291-0.html清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：網(wǎng)評《馬斯克傳》是爽文結(jié)構(gòu)：招人、開除、成功、找新女人生娃

下一篇：小雞詞典告新浪微博抄襲案一審敗訴創(chuàng)始人：繼續(xù)上訴希望渺茫

標(biāo)簽：

熱門焦點(diǎn)

K60至尊版狂暴引擎2.0加持：超177萬跑分?jǐn)孬@性能第一

Redmi的后性能時代戰(zhàn)略發(fā)布會今天下午如期舉辦，在本次發(fā)布會上，Redmi公布了多項關(guān)于和聯(lián)發(fā)科的深度合作，以及新機(jī)K60 Ultra在軟件和硬件方面的特性，例如：“K60 至尊版，雙芯旗艦
直屏旗艦來了 iQOO 12和K70 Pro同臺競技

旗艦機(jī)基本上使用的都是雙曲面屏幕，這就讓很多喜歡直屏的愛好者在苦等一款直屏旗艦，這次，你們等到了。據(jù)博主數(shù)碼閑聊站帶來的最新爆料稱，Redmi下代旗艦K70 Pro和iQOO 12兩款手
使用LLM插件從命令行訪問Llama 2

最近的一個大新聞是Meta AI推出了新的開源授權(quán)的大型語言模型Llama 2。這是一項非常重要的進(jìn)展：Llama 2可免費(fèi)用于研究和商業(yè)用途。(幾小時前，swyy發(fā)現(xiàn)它已從LLaMA 2更名為Lla
雅柏威士忌多款單品價格大跌，泥煤頂流也不香了？

來源 | 烈酒商業(yè)觀察編 | 肖海林今年以來，威士忌市場開始出現(xiàn)了降溫跡象，越來越多不斷暴漲的網(wǎng)紅威士忌也開始悄然回歸市場理性。近日，LVMH集團(tuán)旗下蘇格蘭威士忌品牌雅柏（Ardbeg
梁柱接棒兩年，騰訊音樂闖出新路子

文丨田靜出品丨牛刀財經(jīng)（niudaocaijing）7月5日，企鵝FM發(fā)布官方公告稱由于業(yè)務(wù)調(diào)整，將于9月6日正式停止運(yùn)營，這意味著騰訊音樂長音頻業(yè)務(wù)走向消亡。騰訊在長音頻領(lǐng)域還在摸索。為
品牌洞察丨服務(wù)本地，美團(tuán)直播成效幾何？

來源：17PR7月11日，美團(tuán)App首頁推薦位出現(xiàn)“美團(tuán)直播”的固定入口。在直播聚合頁面，外賣“神槍手”直播間、美團(tuán)旅行直播間、美團(tuán)買菜直播間等均已上線，同時
馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

來源：直播觀察提起“馮提莫”這個名字，很多網(wǎng)友或許聽過，但應(yīng)該不記得她是哪位主播了。其實(shí)，作為曾經(jīng)的“斗魚一姐”，馮提莫在游戲直播的年代影響力不輸于現(xiàn)
小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

7月14日消息，今日一名博主在社交媒體發(fā)布了一張疑似小米汽車電池信息的照片，顯示該電池包正是寧德時代麒麟電池，容量為101kWh，電壓為726.7V，可以預(yù)測小
OPPO K11評測：旗艦級IMX890加持 2000元檔最強(qiáng)影像手機(jī)

【Techweb評測】中端機(jī)型用戶群體巨大，占了中國目前手機(jī)市場的大頭，一直以來都是各手機(jī)品牌的“必爭之地”，其中OPPO K系列機(jī)型一直以來都以高品質(zhì)、

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過

K60至尊版狂暴引擎2.0加持：超177萬跑分?jǐn)孬@性能第一

直屏旗艦來了 iQOO 12和K70 Pro同臺競技

使用LLM插件從命令行訪問Llama 2

雅柏威士忌多款單品價格大跌，泥煤頂流也不香了？

梁柱接棒兩年，騰訊音樂闖出新路子

品牌洞察丨服務(wù)本地，美團(tuán)直播成效幾何？

馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

小米汽車電池信息疑似曝光：容量101kWh，支持800V高壓快充

OPPO K11評測：旗艦級IMX890加持 2000元檔最強(qiáng)影像手機(jī)

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

清華攢局8個ChatGPT狼人殺 心機(jī)偽裝都在這一局里 清華：我沒教過

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊

清華攢局8個ChatGPT狼人殺心機(jī)偽裝都在這一局里清華：我沒教過