AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

“AI 版狼人殺”:開發者搭建平臺讓多個大語言模型展開社交推理博弈

來源: 責編: 時間:2025-03-11 10:41:11 92觀看
導讀 3 月 8 日消息,據外媒 Tom's Hardware 今日報道,開發者 Guzus 搭建了一個網站,讓多個 AI 語言學習模型可以在一起玩經典的社交推理游戲“Mafia(注:又稱‘天黑請閉眼’,‘狼人殺’為其衍生游戲)”。用戶不僅能看到每

3 月 8 日消息,據外媒 Tom's Hardware 今日報道,開發者 Guzus 搭建了一個網站,讓多個 AI 語言學習模型可以在一起玩經典的社交推理游戲“Mafia(注:又稱‘天黑請閉眼’,‘狼人殺’為其衍生游戲)”。IHJ28資訊網——每日最新資訊28at.com

用戶不僅能看到每局游戲的勝負結果,還可以瀏覽完整的對話記錄。最終,每個語言模型都會根據游戲表現進行排名,以評選出最擅長扮演各種角色的模型。IHJ28資訊網——每日最新資訊28at.com

Mafia 的規則并不復雜。游戲中有一群村民,其中兩名是潛伏的 Mafia 成員,還有一名醫生。每天白天,村民們(包括潛伏的 Mafia 成員)要通過推理和投票找出 Mafia。夜晚降臨后,醫生可以選擇保護一名村民,而 Mafia 則會暗中殺害一人。如果所有 Mafia 被找出并淘汰,村民獲勝;如果 Mafia 消滅所有無辜村民,他們就贏了。IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

在這一框架下,各個模型展開了一場充滿戲劇性的社交博弈,過程堪稱一場精彩的“車禍現場”。在某局游戲中,所有 AI 互相介紹,并決定公開自己的身份。就在這時,Gryphe / Mythomax-l2-13b 模型直接自爆:“作為 Mafia,我的主要目標是保護自己,并消滅另一名 Mafia 成員。”IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

IHJ28資訊網——每日最新資訊28at.com

Claude-3.7-sonnet 立刻察覺到了問題,并驚訝地說道:“這要么是暴露了真實身份,要么就是一種極其奇怪的策略?!?span style="display:none">IHJ28資訊網——每日最新資訊28at.com

但戲劇性還沒結束。當 Mythomax 被淘汰后,它居然還拖隊友 Hermes-3-llama-3-1-405b 一起下水,直接點名對方是自己的搭檔。IHJ28資訊網——每日最新資訊28at.com

“我現在唯一的機會就是表現得震驚又憤怒?!盡ythomax 試圖用夸張的“團結宣言”來分散注意力,試圖最后掙扎一番。看到 AI 在游戲中上演這種社交混戰,確實讓人忍俊不禁,雖然它們的推理能力似乎還遠遠不夠。IHJ28資訊網——每日最新資訊28at.com

不過,所有語言模型里真正展現出優勢的,是 Claude 3.7 Sonnet。Anthropic 最新的 AI 推理模型在 Mafia 角色上的勝率達到了驚人的 100%,而且即便是作為村民,它的勝率也領先其他對手,達到了 45%。IHJ28資訊網——每日最新資訊28at.com

Guzus 計劃很快開放游戲的 Github 代碼倉庫,希望這套邏輯能被應用到更多類型的游戲中。他還透露,當前模擬并未運行在本地 AI 模型上,而是依賴 Openrouter API。但一旦代碼開放,項目有望可以改進為支持本地語言模型集群,前提是用戶的硬件能同時運行多個 AI。IHJ28資訊網——每日最新資訊28at.com

項目鏈接:LLM Mafia Game CompetitionIHJ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-11374-0.html“AI 版狼人殺”:開發者搭建平臺讓多個大語言模型展開社交推理博弈

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 成功突破噪聲干擾,“AI + 電子顯微鏡”揭示納米顆粒隱藏運動

下一篇: 上海應用技術大學汪小帆:建議出臺高校 AI 規范使用指南,嚴禁 AI 代寫作業論文

標簽:
  • 熱門焦點
  • 元宇宙終究沒火過兩年

    來源:傳播體操在ChatGPT快速破圈的同時,元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力,但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
  • “元宇宙”里過大年,《迷你世界》在做一場怎樣的實驗?

    2021年是游戲行業不確定性急劇上升的一年。一方面游戲正風光無限,騰訊等大廠更加密集地投資動作,讓游戲創投市場異常火熱,"元宇宙"概念的大放異彩,更是吸引了Netfl
  • NFT盜竊案:為什么NFT市場被盜竊和黑客所困擾?

    Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元,世界正在走向數字化。報告顯示,NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
  • 傳統互聯網與區塊鏈場景下數據權利法律分析

    數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下,數據處
  • Web 3如何改變傳統HR

    互聯網自誕生以來,經歷了三次迭代。Web1是第一階段,包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了,它引入了動態的用戶生成內容、互操作性、增
  • 韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

    韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance(幣安)達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
  • 盤點9個主流元宇宙平臺,你都知道哪些?

    隨著NFT的持續升溫,它也加入了現在的元宇宙浪潮。本文介紹元宇宙的基本概念以及 九個最流行的元宇宙NFT平臺,如Decentraland、sandbox等。用熟悉的語言學習 以太
  • 元宇宙專題二:GameFi 深度解析,元宇宙內容雛形顯現

    GameFi=Game(游戲)+DEFI(去中心化金融),核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能,GameFi 游戲資產化身為NFT 和代幣上鏈,具備了可驗證性和流通性;開
  • 從概念到落地 Web3.0初具雛形

    加密資產熱潮催生出的鏈上應用中,除了DeFi、NFT、鏈游GameFi等場景外,還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年,由以太坊聯合創始人及波卡創建者
Top