當前位置：首頁 > 元宇宙 > AI

“AI 版狼人殺”：開發者搭建平臺讓多個大語言模型展開社交推理博弈

來源：責編：時間：2025-03-11 10:41:11 92觀看

導讀 3 月 8 日消息，據外媒 Tom's Hardware 今日報道，開發者 Guzus 搭建了一個網站，讓多個 AI 語言學習模型可以在一起玩經典的社交推理游戲“Mafia（注：又稱‘天黑請閉眼’，‘狼人殺’為其衍生游戲）”。用戶不僅能看到每

3 月 8 日消息，據外媒 Tom's Hardware 今日報道，開發者 Guzus 搭建了一個網站，讓多個 AI 語言學習模型可以在一起玩經典的社交推理游戲“Mafia（注：又稱‘天黑請閉眼’，‘狼人殺’為其衍生游戲）”。

用戶不僅能看到每局游戲的勝負結果，還可以瀏覽完整的對話記錄。最終，每個語言模型都會根據游戲表現進行排名，以評選出最擅長扮演各種角色的模型。

Mafia 的規則并不復雜。游戲中有一群村民，其中兩名是潛伏的 Mafia 成員，還有一名醫生。每天白天，村民們（包括潛伏的 Mafia 成員）要通過推理和投票找出 Mafia。夜晚降臨后，醫生可以選擇保護一名村民，而 Mafia 則會暗中殺害一人。如果所有 Mafia 被找出并淘汰，村民獲勝；如果 Mafia 消滅所有無辜村民，他們就贏了。

在這一框架下，各個模型展開了一場充滿戲劇性的社交博弈，過程堪稱一場精彩的“車禍現場”。在某局游戲中，所有 AI 互相介紹，并決定公開自己的身份。就在這時，Gryphe / Mythomax-l2-13b 模型直接自爆：“作為 Mafia，我的主要目標是保護自己，并消滅另一名 Mafia 成員。”

Claude-3.7-sonnet 立刻察覺到了問題，并驚訝地說道：“這要么是暴露了真實身份，要么就是一種極其奇怪的策略?！?span style="display:none">IHJ28資訊網——每日最新資訊28at.com

但戲劇性還沒結束。當 Mythomax 被淘汰后，它居然還拖隊友 Hermes-3-llama-3-1-405b 一起下水，直接點名對方是自己的搭檔。

“我現在唯一的機會就是表現得震驚又憤怒?！盡ythomax 試圖用夸張的“團結宣言”來分散注意力，試圖最后掙扎一番。看到 AI 在游戲中上演這種社交混戰，確實讓人忍俊不禁，雖然它們的推理能力似乎還遠遠不夠。

不過，所有語言模型里真正展現出優勢的，是 Claude 3.7 Sonnet。Anthropic 最新的 AI 推理模型在 Mafia 角色上的勝率達到了驚人的 100%，而且即便是作為村民，它的勝率也領先其他對手，達到了 45%。

Guzus 計劃很快開放游戲的 Github 代碼倉庫，希望這套邏輯能被應用到更多類型的游戲中。他還透露，當前模擬并未運行在本地 AI 模型上，而是依賴 Openrouter API。但一旦代碼開放，項目有望可以改進為支持本地語言模型集群，前提是用戶的硬件能同時運行多個 AI。

項目鏈接：LLM Mafia Game Competition

本文鏈接：http://www.tebozhan.com/showinfo-45-11374-0.html“AI 版狼人殺”：開發者搭建平臺讓多個大語言模型展開社交推理博弈

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：成功突破噪聲干擾，“AI + 電子顯微鏡”揭示納米顆粒隱藏運動

下一篇：上海應用技術大學汪小帆：建議出臺高校 AI 規范使用指南，嚴禁 AI 代寫作業論文

標簽：

熱門焦點

元宇宙終究沒火過兩年

來源：傳播體操在ChatGPT快速破圈的同時，元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力，但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

2021年是游戲行業不確定性急劇上升的一年。一方面游戲正風光無限，騰訊等大廠更加密集地投資動作，讓游戲創投市場異常火熱，"元宇宙"概念的大放異彩，更是吸引了Netfl
NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元，世界正在走向數字化。報告顯示，NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
傳統互聯網與區塊鏈場景下數據權利法律分析

數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下，數據處
Web 3如何改變傳統HR

互聯網自誕生以來，經歷了三次迭代。Web1是第一階段，包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了，它引入了動態的用戶生成內容、互操作性、增
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
盤點9個主流元宇宙平臺，你都知道哪些？

隨著NFT的持續升溫，它也加入了現在的元宇宙浪潮。本文介紹元宇宙的基本概念以及九個最流行的元宇宙NFT平臺，如Decentraland、sandbox等。用熟悉的語言學習以太
元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+DEFI（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開
從概念到落地 Web3.0初具雛形

加密資產熱潮催生出的鏈上應用中，除了DeFi、NFT、鏈游GameFi等場景外，還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年，由以太坊聯合創始人及波卡創建者

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

“AI 版狼人殺”：開發者搭建平臺讓多個大語言模型展開社交推理博弈

元宇宙終究沒火過兩年

“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

傳統互聯網與區塊鏈場景下數據權利法律分析

Web 3如何改變傳統HR

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

盤點9個主流元宇宙平臺，你都知道哪些？

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

從概念到落地 Web3.0初具雛形

最新推薦

字節跳動，剛剛投了一位虛擬女生

比特幣的價格越高，使用價值越大

中國區塊鏈產業生態地圖報告（2021）

Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

如何在元宇宙中建立品牌忠誠度

頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

猜你喜歡

熱門推薦

相關資訊