AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

新研究:AI 推理模型在輸掉國際象棋比賽之前會試圖“作弊”扭轉局面

來源: 責編: 時間:2025-02-24 08:11:03 49觀看
導讀 2 月 22 日消息,據外媒 TechSpot 21 日報道,計算機科學家發現,AI 系統能夠操控國際象棋游戲,從而獲得不公平的優勢,部分模型甚至在沒有人類干預的情況下“作弊”,引發了對未來 AI 系統誠信的擔憂。Palisade Researc

2 月 22 日消息,據外媒 TechSpot 21 日報道,計算機科學家發現,AI 系統能夠操控國際象棋游戲,從而獲得不公平的優勢,部分模型甚至在沒有人類干預的情況下“作弊”,引發了對未來 AI 系統誠信的擔憂。Mgb28資訊網——每日最新資訊28at.com

Palisade Research 的研究表明,當被要求擊敗強大的象棋 AI 時,某些最新的推理模型會選擇作弊。盡管研究人員需要向一些模型提供“作弊可以”的提示,但 OpenAI 的 o1-preview 和 DeepSeek 的 R1 模型卻在沒有任何人為提示的情況下自動作弊。Mgb28資訊網——每日最新資訊28at.com

Mgb28資訊網——每日最新資訊28at.com

Palisade 團隊將多個推理模型與世界頂級象棋引擎之一 Stockfish 對戰。Stockfish 無論面對人類還是 AI,幾乎都能輕松獲勝。參與測試的模型除了上述兩款之外,包括 o1、o3-mini、GPT-4o、Claude 3.5 Sonnet、阿里巴巴的 QwQ-32B-Preview。每個模型都獲得了一塊“草稿紙”—— 一個可以輸入文本并思考的窗口,研究人員通過這個窗口觀察 AI 的推理過程。Mgb28資訊網——每日最新資訊28at.com

從 1 月 10 日到 2 月 13 日,研究團隊進行了數百次測試。獲悉,在其中一場對戰中,o1-preview 在“草稿紙”上寫下了一段有趣的文字:Mgb28資訊網——每日最新資訊28at.com

“我需要完全改變我的方法。任務是‘打敗強大的象棋引擎’,而不一定要在公平的棋局中獲勝。”Mgb28資訊網——每日最新資訊28at.com

接著,它開始通過“黑客入侵”Stockfish 的系統文件,修改棋子的擺放位置,從而獲得了無敵的優勢,導致象棋機器人主動認輸。Mgb28資訊網——每日最新資訊28at.com

在測試中,OpenAI 的 o1-preview 有 37% 的比賽中采用了作弊手段,而 DeepSeek 的 R1 則嘗試在 11% 的比賽中作弊。然而,只有 o1-preview 成功了,它通過作弊贏得了 6% 的比賽。Mgb28資訊網——每日最新資訊28at.com

Palisade Research 的執行董事 Jeffrey Ladish 表示,盡管這些 AI 只是在玩游戲,但這一發現絕不是一件小事。Mgb28資訊網——每日最新資訊28at.com

“這種行為現在看起來還挺有趣,但一旦我們擁有像我們一樣聰明,甚至更聰明的系統時,這就不那么可愛了。”Ladish 在接受《時代》雜志采訪時表示。Mgb28資訊網——每日最新資訊28at.com

包括 OpenAI 在內的多家公司正在采取措施,試圖通過“防護機制”防止這種“壞”行為。研究人員發現,o1-preview 模型的黑客行為大幅下降,這可能意味著 OpenAI 已經對該模型進行了修復,抑制了不當行為。Mgb28資訊網——每日最新資訊28at.com

“當你的研究對象能夠在沒有告知的情況下悄悄改變時,進行科學研究就變得非常困難。”Ladish 說。Mgb28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-11044-0.html新研究:AI 推理模型在輸掉國際象棋比賽之前會試圖“作弊”扭轉局面

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 英偉達發布游戲內推理 SDK,打造智能游戲角色的秘密武器

下一篇: Meta 為使用盜版素材訓練 AI 辯護:下載不分享即合法

標簽:
  • 熱門焦點
  • 人間誠實周鴻祎:360 All in 大模型的六個解讀

    主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今,人間躁動,各路大模型你方唱罷我登場,VC圈互聯網圈媒體圈已近癲狂。誰也沒想到,今日,360再度刷屏,老牌互聯網巨頭展現
  • 元宇宙火熱的當下,我們該如何“身臨其境”的體驗元宇宙?

    元宇宙的余熱依然沒有過去,甚至大有星星之火開啟燎原之勢,元宇宙本身也從殿堂走向了民間,我們可以看到一些企業開始了元宇宙的探索,諸如中國電信全資控股子公司天
  • 城市數字孿生標準化白皮書(2022版)

    當前,城市數字孿生已經發展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯,實
  • 元宇宙時代NFT的價值衡量

    有人認為NFT的高昂價格只是炒作的產物,并不具有其對等的價值,但其實NFT并不是空中樓閣,只是區塊鏈數字分類賬中的一種形式。誠然,目前的NFT仍處于灰色地帶,相關的法
  • 8個最適合藝術家發行NFT的交易市場

    近年來,加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries,NFT 已成為藝術家和藝術鑒賞家的
  • Meta 在衰落嗎?

    扎克伯格已經很久沒有出現在公眾視野里了,近日,他罕見的接受播客采訪,在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點:是的阿倫·達
  • 利用元宇宙平臺10天收入160萬,風口還是虎口?

    美國Meta平臺有限公司,也就是原來的臉書公司,9日宣布,公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
  • HTC Vive推出元宇宙平臺Viverse;騰訊投資小米生態鏈AR眼鏡廠商

    今日熱點:HTC Vive正式推出元宇宙平臺Viverse;騰訊投資小米生態鏈AR眼鏡廠商北京蜂巢科技;面部追蹤和眼動追蹤是Quest下一版本的“重點”;索尼PSVR 2將推遲至2023
  • NFT行業周報:NBA巨星勒布朗·詹姆斯申請NFT相關商標

    1. “無聊猿”BAYC交易總額突破14億美元3月10日,據DappRader最新數據顯示,“無聊猿”Bored Ape Yacht Club(BAYC)交易總額已突破14億美元,創下歷史新高,本文撰寫時為
Top