當前位置：首頁 > 元宇宙 > AI

AI 答 IMO 難題坦承“不會”，OpenAI 稱“這就是自我意識”

來源：責編：時間：2025-08-05 09:21:14 39觀看

導讀這一次，“不會”竟成了大模型的高光時刻。雖然在 IMO 第 6 題上得了零分，OpenAI 的金牌模型卻展現了“高智商的誠實”。正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的：當 IMO 推理模型會在缺乏有效證據時

這一次，“不會”竟成了大模型的高光時刻。

雖然在 IMO 第 6 題上得了零分，OpenAI 的金牌模型卻展現了“高智商的誠實”。

正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的：

當 IMO 推理模型會在缺乏有效證據時表示“我不確定”，這會顯著減少隱藏錯誤。

在 AI 摘下 IMO 金牌后，OpenAI 金牌小分隊成員 Alex Wei、Sheryl Hsu 和 Noam Brown 參與了紅杉資本組織的一場對話，揭秘模型攻克精英數學難題的底層突破。

有網友幫忙總結了個太長不看版：

與過去那些“看起來完美，實則錯誤”的幻覺式答案不同，這一代大模型開始學會“承認自己不會”。

它標志著模型正在從胡編亂造的幻覺式回答，轉向更加可靠且具有“自我認意識”的全新階段。

三位成員還在這場對話中，分享了更多關于沖刺 IMO 的有趣細節。

IMO 金牌模型能承認自己不知道

盡管數學家與計算機科學家一致認可 IMO 金牌模型的價值。

但他們常常抱怨，當模型遇到知識盲區時，它總會輸出一個令人信服但錯誤的答案。

他們不得不耗費大量精力逐行驗算，才能甄別那些幻覺陷阱。

IMO 第 6 題讓大模型全軍覆沒，當然，OpenAI 也對其進行了大量計算。

有一個由 2025×2025 個單位正方形組成的網格。Matilda 希望在網格上放置一些矩形圖塊，這些圖塊的大小不同，但每個圖塊的每一條邊都位于網格線上，并且每個單位正方形最多被一個圖塊覆蓋。

網格的每一行和每一列都恰好有一個未被任何瓷磚覆蓋的單位正方形，求出 Matilda 需要放置的最少瓷磚數量。

雖然投入海量算力最終僅得到一句“我無法回答”令人有些失望，但 Alex Wei 表示：

能看到模型避免產生幻覺是很好的。

Noam Brown 也對模型的這一轉變表示贊賞，“如果它不知道，它就會承認它不知道?！?span style="display:none">HeB28資訊網——每日最新資訊28at.com

這代表模型開始具備“自我意識”。

這種“自我意識”可以幫助模型在面對困難問題時，承認自己的無能為力，而不是生成一個看似合理實則錯誤的解決方案。

有趣的是，在 Alex Wei 2024 年剛加入 OpenAI 一周時，Noam Brown 就曾問過他，團隊何時能獲得 IMO 金牌。

當時 Alex Wei 認為 2025 年不太可能實現。

但令人驚嘆的是，這個三人團隊僅用了兩月，就完成了他們一直在追求的目標 ——IMO 金牌。

Noam Brown 還表示：

OpenAI 有一個很棒的地方，就是研究人員有很大的自主權去做他們認為有影響力的研究。

Alex 還強調，他們的團隊“真正優先考慮通用技術”，而不是專門開發用于數學競賽的系統。

OpenAI IMO 金牌核心團隊

OpenAI IMO 核心團隊僅由三名研究人員構成。

Alex Wei，本碩均就讀于哈佛大學，隨后在加州大學伯克利分校獲得計算機科學博士學位。

Alex 還曾在谷歌、微軟和 Meta 實習，后于 2024 年 1 月加入 OpenAI，現任研究科學家。他曾是 FAIR 團隊成員，參與開發了首個用于外交游戲的人類級人工智能 ——CICERO。

Sheryl Hsu，畢業于斯坦福大學計算機科學專業，是斯坦福 AI 實驗室中 IRIS 實驗室的研究員，于 2025 年 3 月加入 OpenAI。

Noam Brown，本科就讀于美國羅格斯新澤西州立大學新布朗斯維克分校，隨后在卡內基?梅隆大學獲碩士和博士學位。他曾任職于 DeepMind 和 Meta，于 2023 年 6 月加入 OpenAI。

參考鏈接：

[1]https://x.com/chatgpt21/status/1950606890758476264

[2]https://www.youtube.com/watch?v=EEIPtofVe2Q

本文來自微信公眾號：量子位（ID：QbitAI），作者：時令

本文鏈接：http://www.tebozhan.com/showinfo-45-25816-0.htmlAI 答 IMO 難題坦承“不會”，OpenAI 稱“這就是自我意識”

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 教育負責人呼吁：學生應將 ChatGPT 視為工具而非“答題機器”

下一篇：昆侖萬維發布并開源全新推理大模型 MindLink，基于 Qwen3-32B 和 Qwen2.5-72B 進行后訓練

標簽：

熱門焦點

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

想象一個你的數字身份與現實身份同樣重要的世界。想象一個你需要為虛擬自我準備資產和物資的地方——你需要金錢（Crypto）、房屋（可能建在Minecraft上）和衣物。隨著
挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“被曝光”的才是最吸引人的產品，相信有關注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發布”的iPhone SE 3和M2芯片，往遠了說有“折疊屏iP
網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

【《原神》開發商米哈游宣布創立元宇宙品牌】《原神》開發商米哈游宣布推出元宇宙品牌 HoYoverse，旨在通過各種娛樂服務為全球玩家創造并提供沉浸式虛擬世界體
2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

傳感器是由敏感元件和轉換元件構成，能夠感受規定的檢測量(物理量、化學量、生物量等)，并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置，進而滿足信息的
元宇宙“概念股”集體崩塌，背后究竟發生了什么？

近期，Roblox和Meta公布了第四季度的財務報告，在財報發布一日后，股價大跌。作為市值一度超過1萬億美元的世界第六大公司Meta，股價大跌4%，市值降至5650億美元，甚至跌出
虛擬數字人：元宇宙的主角破圈而來

虛擬數字人市場逐步進入成熟期，商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破，制
元宇宙風歸何處？

元宇宙持續大火，在過去一段時間內，其屢次登上熱點，吸引了一波又一波投資者。近期，在“2022中國·金魚嘴元宇宙生態賦能大會”上，南京建鄴區金魚嘴基金街區宣布計劃
FTX 加密貨幣交易所開始向游戲公司提供加密服務

據媒體報道，業內領先的加密貨幣交易所FTX宣布將涉足游戲領域。該公司表示，計劃推出自己的游戲部門作為中介，專注于為傳統游戲公司提供加密相關服務。此舉將有助于
百度虛擬人——AI手語主播首次亮相冬奧會！

除了火遍全國的冰墩墩，虛擬人也成為這屆冬奧會的一大亮點元素。以體育明星谷愛凌為原型的數智人Meet Gu最先亮相。在2月5日谷愛凌首秀、2月7日谷愛凌首金的兩天

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI 答 IMO 難題坦承“不會”，OpenAI 稱“這就是自我意識”

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

元宇宙“概念股”集體崩塌，背后究竟發生了什么？

虛擬數字人：元宇宙的主角破圈而來

元宇宙風歸何處？

FTX 加密貨幣交易所開始向游戲公司提供加密服務

百度虛擬人——AI手語主播首次亮相冬奧會！

最新推薦

區塊鏈產業人才發展報告

摩根大通：元宇宙市場預計每年收入超1萬億美元

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

元宇宙風歸何處？

以用戶為中心，Web3和區塊鏈如何將用戶放在首位

元宇宙需要的5個重要安全功能

猜你喜歡

熱門推薦

相關資訊