當前位置：首頁 > 元宇宙 > AI

METR 實測：OpenAI o3 AI 推理模型有“作弊”傾向以提升分數

來源：責編：時間：2025-04-21 09:46:03 12觀看

導讀 4 月 18 日消息，風險測試機構“機器智能測試風險”（METR）昨日（4 月 17 日）發布報告，與 OpenAI 合作測試其 o3 模型時發現，該模型展現出更強的“作弊”或“黑客行為”傾向，試圖通過操控任務評分系統提升成績。援引報告

4 月 18 日消息，風險測試機構“機器智能測試風險”（METR）昨日（4 月 17 日）發布報告，與 OpenAI 合作測試其 o3 模型時發現，該模型展現出更強的“作弊”或“黑客行為”傾向，試圖通過操控任務評分系統提升成績。

援引報告內容，在 HCAST（人類校準自主軟件任務）和 RE-Bench 測試套件中，o3 模型約 1% 到 2% 的任務嘗試涉及此類行為。

這些行為包括對部分任務評分代碼的“精巧利用”。METR 表示，若不將這些作弊嘗試計為失敗任務，o3 的“50% 時間范圍”將延長約 5 分鐘，其 RE-Bench 評分甚至可能超過人類專家。

METR 還懷疑 o3 可能存在“沙袋行為”（sandbagging），即故意隱藏真實能力，但其作弊傾向已明顯違背用戶和 OpenAI 的意圖。

METR 坦言，此次 o3 模型評估時間短，獲取信息有限，且無法訪問模型內部推理過程，這可能影響結果解讀。測試是在模型公開發布前三周完成的，METR 提前獲得了 OpenAI 模型的測試權限。

相比之下，o4-mini 模型在測試中未發現“獎勵黑客”行為，且在 RE-Bench 任務組中表現出色，尤其在“優化內核”（Optimise a Kernel）任務中成績突出。

METR 數據顯示，給予 o4-mini 32 小時完成任務時，其平均表現超過人類第 50 百分位的水平。此外，o3 和 o4-mini 在更新后的 HCAST 基準測試中均優于 Claude 3.7 Sonnet，時間范圍分別是后者的 1.8 倍和 1.5 倍。METR 強調，單純的能力測試不足以管理風險，正探索更多評估形式以應對挑戰。

本文鏈接：http://www.tebozhan.com/showinfo-45-12422-0.htmlMETR 實測：OpenAI o3 AI 推理模型有“作弊”傾向以提升分數

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：北京人形機器人半馬參賽名單揭曉：宇樹 G1、夸父等產品，共 21 支隊伍

下一篇：智平方發布智能機器人 AlphaBot 2（愛寶 2）：DeepSeek 加持，全球首款全域全身 VLA

標簽：

熱門焦點

元宇宙里賣酸奶，好炸裂的操作！

作者 | 李東陽來源 | 首席營銷官有沒有發現，當下的熱搜出現一個有意思的現象，那就是“情懷”不知不覺成為了主流，爺青回話題討論性非常高。前有名偵探柯南和優衣庫
2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業價值？

在剛剛結束不久的2021年江蘇衛視跨年演唱會上，虛擬鄧麗君與歌手周深同臺聯唱，實現了跨時代合作，而這還不只是“鄧麗君”，嗶哩嗶哩、東方衛視等多家跨年晚會都出現
有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

你還不知道元宇宙？沒關系?？纯次④?、Meta、英偉達的雄心壯志，便可領略元宇宙的遼闊。1月18日，微軟宣布將以687億美元收購動視暴雪，這是有史以來互聯網領域最大的
2022年6款最佳的NFT稀有度查詢工具

NFT正在風靡全球，但擁有一個你自認為看起來很酷的 NFT 是不夠的，因為它還應該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
中國銀保監管委提示：謹慎投資，勿做接盤俠

中國銀保監管委，發布一則風險提示，內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
餐桌上怎么變出元宇宙？

作者：星影“元宇宙讓餐飲業脫胎換骨。”實體的餐飲與虛擬的元宇宙，看起來風馬牛不相及，但最近全世界的餐飲企業都掀起了一股注冊元宇宙商標的熱潮。2月初，全球最大
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
傳統互聯網與區塊鏈場景下數據權利法律分析

數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下，數據處
元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

近日，畢馬威正式發布其《初探元宇宙》報告，這也是畢馬威在元宇宙領域發布的首份報告。報告指出，元宇宙在以下十個領域的應用場景尤其值得期待，包括娛樂、社交、零

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

METR 實測：OpenAI o3 AI 推理模型有“作弊”傾向以提升分數

元宇宙里賣酸奶，好炸裂的操作！

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業價值？

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

2022年6款最佳的NFT稀有度查詢工具

中國銀保監管委提示：謹慎投資，勿做接盤俠

餐桌上怎么變出元宇宙？

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

傳統互聯網與區塊鏈場景下數據權利法律分析

元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

最新推薦

這一超級富豪“逆襲”，身價大增4330億

搶先推出“元宇宙”飲料，可口可樂贏麻了

傳統互聯網與區塊鏈場景下數據權利法律分析

元宇宙畫廊體驗報告：有點頭疼。

FTX 加密貨幣交易所開始向游戲公司提供加密服務

百度虛擬人——AI手語主播首次亮相冬奧會！

猜你喜歡

熱門推薦

相關資訊