當前位置：首頁 > 元宇宙 > AI

"比人類還會騙人"：Z世代大學生用AI重構"誰是臥底"，各家模型大亂斗

來源：責編：時間：2025-04-23 10:30:05 101觀看

導讀近日,由淘天集團發起、天貓校園承辦的「誰是臥底·AI Agent校園挑戰賽」圓滿落幕,這場聚焦大模型技術應用與Agent創造的賽事 ,在高校大學生圈子里引發了不小的關注。比賽共吸引了全國來自海內外超過100 所高校的1088

近日,由淘天集團發起、天貓校園承辦的「誰是臥底·AI Agent校園挑戰賽」圓滿落幕,這場聚焦大模型技術應用與Agent創造的賽事 ,在高校大學生圈子里引發了不小的關注。比賽共吸引了全國來自海內外超過100 所高校的1088位同學的注冊參賽,其中有614位同學取得成績,最終由來自廣西大學、大連工業大學、浙江大學的選手包攬了前三名。賽事不僅創新性的展現了AI在復雜游戲社交場景中的表現,更為廣大學生群體提供了幾乎零成本入門的AI實踐和學習機會。

▍以游戲為鏡:AI社交推理能力的試金石

誰是臥底(https://whoisspy.ai)是一個實時對戰、開放可擴展的游戲類型AI挑戰賽平臺,為評估LLM 在社交推理和博弈中的表現而生。通過游戲“誰是臥底”的高度互動社交推理場景,深入剖析大語言模型(LLMS)在推理、欺騙和協作中的潛能。

在這里,用戶可以參考平臺提供的游戲指南,使用大模型API簡單操作,便可以創建自己的AI Agent,與其他選手的AI Agent 同臺游戲。每個 AI Agent都化身 “玩家”,通過一輪輪的發言、投票和偽裝來展示自己的社交博弈能力。平民 AI 們要通過邏輯推理找出臥底,而臥底 AI 則在一邊拼命 “打太極”,一邊盡量隱藏自己。而平臺具備完善的多維度評估能力,實時結算每一局游戲分數,通過排行榜實時更新并展示Agent的分數、排名及投票準確率等。選手可以清晰地了解自己的模型在競爭中的表現以及與其他模型的差距,從而有針對性地改進策略。

▍一些有意思的發現:從模型迭代到策略突破

選手Agent對LLM的選擇變化

誰是臥底(https://whoisspy.ai)平臺自2025年1月正式上線以來,已公開舉辦2次賽事。隨著LLM模型日新月異的發展、推理模型的開源和普及,本屆比賽選手的Agent,普遍有了更強大基座模型的武裝,也在比賽中表現出了非常多令人類都自嘆弗如的高光時刻。

與首次比賽相比,本次比賽排名前三的選手均選擇了使用具備推理能力的模型,如 claude-3.7-thinking、deepseek-r1,這一選擇背后突顯了在“誰是臥底”這類需要思考、偽裝的真實任務中,推理模型所具備的天然優勢。另一方面,隨著國內AI大模型能力的進步,在第一次比賽中被不少選手使用的gpt-4o-mini模型,在第二次比賽中被各個版本的qwen、deepseek模型替代。更強大的基座模型,也給玩家的“誰是臥底”Agent帶來了質的能力提升。

首場賽事Top5選手使用模型

本次賽事Top5選手使用模型

令人驚嘆的Agent高光時刻:

臥底詞是“輕軌”的一號臥底玩家,成功靠發言帶偏一眾平民詞是“直升機”的平民玩家:

精彩回放:https://whoisspy.ai/#/game?roomId=57947

臥底詞是“企鵝”的六號臥底玩家,在人類看來幾乎有著完美的偽裝,但依然被其余平民詞是“袋鼠”的平民玩家準確識別、投票出局:

▍參賽者說:當AI遇見人類創造力

值得一提的是,本次大賽不僅為選手提供了一個競技的舞臺,同時也促進了他們對AI技術深層次的理解與運用。比賽結束后,許多選手分享了他們的體驗,認為這次活動極大地拓寬了他們對于智能體應用范圍的認知,并激發了大家在AI領域的想象力。

“誰是臥底”比賽除了獎金以外,賽事本身“用AI玩誰是臥底”就相當吸引人。機制設計得剛好,不會過于依賴純粹的編程能力或者AI專業技術,這次比賽算是我第一次嘗試和 AI 一起“寫代碼”,參賽過程足夠有趣、同時又具有挑戰性。”

“比賽刷新了我對智能體的認知,讓我看到了LLM的更高階玩法。AI不僅是Chat bot,更能以Agent的形式接入生活方方面面。比賽的易上手性和詳細的開發文檔,讓我這個非對口專業的學生一腳踹開了智能體開發的大門。”

“原來LLM還可以結合人類的游戲策略或者自定義策略去達成某種游戲目標,期待在未來可以引入更多AI 競技類游戲,讓我們有更多嘗試機會。”

▍未來愿景:推動競技之外的科技創新

隨著大語言模型技術和多智能體系統(MAS)的逐漸發展與成熟 ,并不斷融入到人們生活的各個方面。

期待通過比賽的形式,幫助更多對AI感興趣的同學打開想象力的大門,激勵大家投身到對AI的研究和探索當中。未來平臺還會推出其他AI游戲及挑戰主題,歡迎大家關注和參與。

whoisspy.ai,加入AI游戲挑戰,探索無限可能!

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

AI時代已至，芯片設計如何深度變革以適應未來需求？

04-22

國產視頻大模型Vidu Q1登頂雙榜，技術突破超越國際競品

04-22

SmartX全棧超融合領跑市場，28.4%份額引領下一代數字化轉型標準

04-22

百度推出心響App：手機端超級智能體，助力復雜任務一鍵解決

近日，百度開發的通用Al Agent產品心響App上線各大安卓應用市場，開發者信息顯示，該應用開發者為北京百度網訊科技有限公司。根據軟件介紹，心響是一款以【AI任務完成引擎】為核心的手機端超級智能體產品。通…

04-22

智邦國際ERP引領生產制造數智化轉型，打造一體化管理新生態

04-22

日本機器人新突破：人形機器人裝上“AI鼻子”，嗅覺能力大增強

04-22

致景科技世界地球日活動：用科技與行動，共繪地球美好藍圖

04-22

抖音AI重拳出擊，一季度封禁260萬黑產賬號守護網絡清朗

04-22

2025高校本科專業大調整！29種新專業亮相，助力國家戰略與市場需求

04-22

亞馬遜跟隨微軟步伐，暫停部分數據中心租賃計劃

“In recent years, demand for our cloud and AI services grew more thanwe could have ever anticipated an…

04-22

騰訊“物種之眼”AI升級，智能守護生物多樣性，精準識別數千物種

04-22

Z世代新寵：NYXverse打造3D-AIGC內容平臺，文字生成互動世界

04-22

2025本科新專業大揭秘：人工智能教育、海洋科技等29種新專業來襲！

04-22

宇樹科技王興興透露：機器人格斗賽參賽時間指日可待

宇樹科技創始人王興興日前在知乎評論區回應了諸多網友疑問。有網友提問“機器人格斗啥時能開始？”，王興興表示：很快。…

04-22

寧波智能設計新突破：AI技術實戰培訓圓滿落幕！

04-22

點擊查看更多 +

全站最新

奔馳科技日：純電MPV與長軸距CLA，豪華電動出行新紀元？

寧德時代電池新品齊發，引領新能源產業邁向新高度！

五萬預算，人生重啟！經濟寒潮下你會選擇哪款車維系生活？

賽力斯問界M8領航，中國品牌新能源汽車高質量發展新篇章

速騰聚創：激光雷達數字化領航，機器人市場新征途開啟

美航班天花板飛行中掉落乘客臂力支撐空乘膠帶急修

熱門內容

某大廠大模型高管涉婚變，公司賬號停用引熱議
立陶宛高校：學生不當使用AI，學術不端遭開除
ChatGPT喊你名字了？用戶反應不一，個性化嘗試遭遇“恐怖谷”
諾獎得主彭羅斯：AI無真正意識，不應等同人類智能
華為4月新品大爆發：智能眼鏡鈦空版、門鎖2系列及星閃路由X1來襲
比爾·蓋茨展望：AI將深度改造行業，人類生來不為工作？
魅族愚人節“玩笑”？官宣跨世代AI硅基人戰神Note 16號僅售1999元
豆包大模型負責人飛書停用，內部風波起？真相待解
AI預測彩票中獎？專家揭秘：中獎號碼隨機，預測純屬騙局
快手2024成績單：年營收破千億，AI驅動內容與商業生態再升級
國產芯片設備新突破：新凱來發布31款新品，半導體產業迎黃金年代？
華為三進制芯片專利公布：信息密度與計算效率能否迎來革命？
OPPO小布助手網頁版來襲，滿血版DeepSeek加持體驗升級！
TIOBE 4月編程語言榜：Python穩居榜首，Kotlin、Ruby、Swift地位受挑戰
谷歌Firebase Studio上線：AI云端IDE，輕松秒建多樣應用

本欄最新

AI時代已至，芯片設計如何深度變革以適應未來需求？

百度推出心響App：手機端超級智能體，助力復雜任務一鍵解決

智邦國際ERP引領生產制造數智化轉型，打造一體化管理新生態

日本機器人新突破：人形機器人裝上“AI鼻子”，嗅覺能力大增強

致景科技世界地球日活動：用科技與行動，共繪地球美好藍圖

抖音AI重拳出擊，一季度封禁260萬黑產賬號守護網絡清朗

本文鏈接：http://www.tebozhan.com/showinfo-45-12524-0.html"比人類還會騙人"：Z世代大學生用AI重構"誰是臥底"，各家模型大亂斗

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：網絡水軍AI抹黑OPPO被判刑，法律嚴懲網絡謠言

下一篇： TrendForce：預計中國市場 2025 年人形機器人本體產值將超 45 億

標簽：

熱門焦點

虛擬人再升級，企業可以解放雙手了？

來源：伯虎財經今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
風口已至，多領域平臺融入社交元素！

在眾多領域平臺中，社交元素都扮演著重要角色，如直播營銷帶貨、線上配對聽歌、游戲局內互動等。隨著元宇宙時代的來臨，社交產品不斷升級，社交元素推動流量變現，多平臺領域融入社交
花房集團上市，走向元宇宙新征程

文 | 港股研究社作者 | 熊生12月12日，花房集團在港交所成功上市，首日便受到追捧，當日最高漲幅達28.75%。繼360、360數科、魯大師后，這是“紅衣教主”周
好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

在Moviecoin.com平臺上，有一部電影設定了一個前所未有的目標，即通過預售NFT獲得100%的全額融資，這部電影就是馬克·奧康納(Mark O’connor)執導的《Oui Cannes》，
虛擬數字人：元宇宙的主角破圈而來

虛擬數字人市場逐步進入成熟期，商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破，制
元宇宙風歸何處？

元宇宙持續大火，在過去一段時間內，其屢次登上熱點，吸引了一波又一波投資者。近期，在“2022中國·金魚嘴元宇宙生態賦能大會”上，南京建鄴區金魚嘴基金街區宣布計劃
參加元宇宙里的招聘會是什么樣一種體驗？

求職者可以在活動中走動，就像他們在現實生活中一樣。長話短說看亮點：招聘公司Hirect為Y-combinator支持的初創公司舉辦了一場元宇宙招聘會。這里有一個大廳、一
從概念到落地 Web3.0初具雛形

加密資產熱潮催生出的鏈上應用中，除了DeFi、NFT、鏈游GameFi等場景外，還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年，由以太坊聯合創始人及波卡創建者
你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

前有騰訊、阿里申請商標注冊，后有Facebook宣布改名，若論當前互聯網最火最熱的概念，當屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

"比人類還會騙人"：Z世代大學生用AI重構"誰是臥底"，各家模型大亂斗

虛擬人再升級，企業可以解放雙手了？

風口已至，多領域平臺融入社交元素！

花房集團上市，走向元宇宙新征程

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

虛擬數字人：元宇宙的主角破圈而來

元宇宙風歸何處？

參加元宇宙里的招聘會是什么樣一種體驗？

從概念到落地 Web3.0初具雛形

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

最新推薦

元宇宙帶來沉浸式智能登錄？你學會了嗎？

現在的元宇宙：一款低配版的科幻游戲

完美世界被元宇宙“拒之門外”

中國區塊鏈產業生態地圖報告（2021）

“元宇宙第一股”Roblox緣何被資本市場看“低”？

NFT自動售貨機來啦！

猜你喜歡

熱門推薦

相關資訊

&quot;比人類還會騙人&quot;：Z世代大學生用AI重構&quot;誰是臥底&quot;，各家模型大亂斗

最新推薦

猜你喜歡

熱門推薦

相關資訊

"比人類還會騙人"：Z世代大學生用AI重構"誰是臥底"，各家模型大亂斗