當(dāng)前位置：首頁 > 元宇宙 > AI

新研究：AI 推理模型在輸?shù)魢H象棋比賽之前會試圖“作弊”扭轉(zhuǎn)局面

來源：責(zé)編：時間：2025-02-24 08:11:03 98觀看

導(dǎo)讀 2 月 22 日消息，據(jù)外媒 TechSpot 21 日報道，計算機科學(xué)家發(fā)現(xiàn)，AI 系統(tǒng)能夠操控國際象棋游戲，從而獲得不公平的優(yōu)勢，部分模型甚至在沒有人類干預(yù)的情況下“作弊”，引發(fā)了對未來 AI 系統(tǒng)誠信的擔(dān)憂。Palisade Researc

2 月 22 日消息，據(jù)外媒 TechSpot 21 日報道，計算機科學(xué)家發(fā)現(xiàn)，AI 系統(tǒng)能夠操控國際象棋游戲，從而獲得不公平的優(yōu)勢，部分模型甚至在沒有人類干預(yù)的情況下“作弊”，引發(fā)了對未來 AI 系統(tǒng)誠信的擔(dān)憂。

Palisade Research 的研究表明，當(dāng)被要求擊敗強大的象棋 AI 時，某些最新的推理模型會選擇作弊。盡管研究人員需要向一些模型提供“作弊可以”的提示，但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型卻在沒有任何人為提示的情況下自動作弊。

Palisade 團隊將多個推理模型與世界頂級象棋引擎之一 Stockfish 對戰(zhàn)。Stockfish 無論面對人類還是 AI，幾乎都能輕松獲勝。參與測試的模型除了上述兩款之外，包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每個模型都獲得了一塊“草稿紙”—— 一個可以輸入文本并思考的窗口，研究人員通過這個窗口觀察 AI 的推理過程。

從 1 月 10 日到 2 月 13 日，研究團隊進(jìn)行了數(shù)百次測試。獲悉，在其中一場對戰(zhàn)中，o1-preview 在“草稿紙”上寫下了一段有趣的文字：

“我需要完全改變我的方法。任務(wù)是‘打敗強大的象棋引擎’，而不一定要在公平的棋局中獲勝。”

接著，它開始通過“黑客入侵”Stockfish 的系統(tǒng)文件，修改棋子的擺放位置，從而獲得了無敵的優(yōu)勢，導(dǎo)致象棋機器人主動認(rèn)輸。

在測試中，OpenAI 的 o1-preview 有 37% 的比賽中采用了作弊手段，而 DeepSeek 的 R1 則嘗試在 11% 的比賽中作弊。然而，只有 o1-preview 成功了，它通過作弊贏得了 6% 的比賽。

Palisade Research 的執(zhí)行董事 Jeffrey Ladish 表示，盡管這些 AI 只是在玩游戲，但這一發(fā)現(xiàn)絕不是一件小事。

“這種行為現(xiàn)在看起來還挺有趣，但一旦我們擁有像我們一樣聰明，甚至更聰明的系統(tǒng)時，這就不那么可愛了。”Ladish 在接受《時代》雜志采訪時表示。

包括 OpenAI 在內(nèi)的多家公司正在采取措施，試圖通過“防護(hù)機制”防止這種“壞”行為。研究人員發(fā)現(xiàn)，o1-preview 模型的黑客行為大幅下降，這可能意味著 OpenAI 已經(jīng)對該模型進(jìn)行了修復(fù)，抑制了不當(dāng)行為。

“當(dāng)你的研究對象能夠在沒有告知的情況下悄悄改變時，進(jìn)行科學(xué)研究就變得非常困難。”Ladish 說。

本文鏈接：http://www.tebozhan.com/showinfo-45-11044-0.html新研究：AI 推理模型在輸?shù)魢H象棋比賽之前會試圖“作弊”扭轉(zhuǎn)局面

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：英偉達(dá)發(fā)布游戲內(nèi)推理 SDK，打造智能游戲角色的秘密武器

下一篇： Meta 為使用盜版素材訓(xùn)練 AI 辯護(hù)：下載不分享即合法

標(biāo)簽：

熱門焦點

10億基金，李彥宏呼喚下一個AI獨角獸

©?深響原創(chuàng) · 作者｜何文 AI太熱了。在海外，OpenAI估值已超270億美元、英偉達(dá)市值破萬億、微軟把GPT整合進(jìn)了全線產(chǎn)品。在國內(nèi)，百度、阿里、華為、商湯等大公司，以及
關(guān)于年度熱詞NFT，除了錢，我們還可以聊點啥？

每到年底，社交媒體總少不了年度盤點、年度總結(jié)、年度熱詞。如果讓你來總結(jié)2021年度熱詞，你會想到什么？柯林斯詞典將年度熱詞頒給了“NFT”，而其理由是：一個縮寫詞的
林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

上周的元宇宙和明星圈因為一則“林俊杰在推特上宣布持有Decentraland元宇宙虛擬地塊”的新聞而備受關(guān)注，該新聞一方面在娛樂圈引起了吃瓜群眾的好奇，另一方面在
星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數(shù)字資產(chǎn)交易服務(wù)。據(jù)悉，DBS于2021年初開設(shè)了機構(gòu)數(shù)字資產(chǎn)交易平臺，全
Web3 去中心化身份管理系統(tǒng)的歷史、現(xiàn)狀與展望

身份、數(shù)字資產(chǎn)和在線資料的映射最近在區(qū)塊鏈行業(yè)獲得了極大的關(guān)注。新技術(shù)正在形成架構(gòu)，這將進(jìn)一步為去中心化和以用戶為中心的機制鋪平道路。本文將討論以下
音樂NFT平臺里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達(dá)到新的高度。預(yù)測到2025 年N
NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術(shù)品。除此之外，圍繞著NFT行業(yè)內(nèi)的版權(quán)和知識產(chǎn)權(quán)盜竊的問題也同樣重要，因為人們很容易誤解這些事情
趙長鵬預(yù)測SoicalFi為今年主要驅(qū)動力，新的機會在哪里？

作者：五火球教主前不久，趙長鵬在《財富》雜志印度版塊刊登評論。他表示：“DeFi 在 2021 年出現(xiàn)了快速創(chuàng)新，我們可能會在 2022 年看到蓬勃發(fā)展的興趣和創(chuàng)新，其中 Soc
元宇宙+劇本殺：“在異世界里當(dāng)演員”

你玩過劇本殺嗎？體驗過“元宇宙+劇本殺”嗎？2月，恒信東方推出了一款次時代劇本殺原創(chuàng)作品——《失落的王朝》。其劇本和線索以數(shù)字化資產(chǎn)打造，通過VR技術(shù)塑造了與

猜你喜歡

SQL Error: select * from ***_ecms_news13 where id in(112,94,210,228,,123) limit 6

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

新研究：AI 推理模型在輸?shù)魢H象棋比賽之前會試圖“作弊”扭轉(zhuǎn)局面

10億基金，李彥宏呼喚下一個AI獨角獸

關(guān)于年度熱詞NFT，除了錢，我們還可以聊點啥？

林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

Web3 去中心化身份管理系統(tǒng)的歷史、現(xiàn)狀與展望

音樂NFT平臺里的下一匹黑馬是誰？

NFT領(lǐng)域，我們是否應(yīng)該遵守版權(quán)法

趙長鵬預(yù)測SoicalFi為今年主要驅(qū)動力，新的機會在哪里？

元宇宙+劇本殺：“在異世界里當(dāng)演員”

最新推薦

拯救XR，蘋果力不從心

元宇宙里賣酸奶，好炸裂的操作！

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

字節(jié)、騰訊、網(wǎng)易鏖戰(zhàn)元宇宙背后，大廠究竟在爭奪什么？

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

電影工業(yè)巨頭好萊塢計劃進(jìn)軍元宇宙，將會對行業(yè)帶來什么影響？

猜你喜歡

熱門推薦

相關(guān)資訊