AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

AI 答 IMO 難題坦承“不會”,OpenAI 稱“這就是自我意識”

來源: 責編: 時間:2025-08-05 09:21:14 39觀看
導讀 這一次,“不會”竟成了大模型的高光時刻。雖然在 IMO 第 6 題上得了零分,OpenAI 的金牌模型卻展現了“高智商的誠實”。正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的:當 IMO 推理模型會在缺乏有效證據時

這一次,“不會”竟成了大模型的高光時刻。HeB28資訊網——每日最新資訊28at.com

雖然在 IMO 第 6 題上得了零分,OpenAI 的金牌模型卻展現了“高智商的誠實”。HeB28資訊網——每日最新資訊28at.com

正如 OpenAI 研究員 Noam Brown 在最新訪談中所揭示的:HeB28資訊網——每日最新資訊28at.com

當 IMO 推理模型會在缺乏有效證據時表示“我不確定”,這會顯著減少隱藏錯誤。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

在 AI 摘下 IMO 金牌后,OpenAI 金牌小分隊成員 Alex Wei、Sheryl Hsu 和 Noam Brown 參與了紅杉資本組織的一場對話,揭秘模型攻克精英數學難題的底層突破。HeB28資訊網——每日最新資訊28at.com

有網友幫忙總結了個太長不看版:HeB28資訊網——每日最新資訊28at.com

與過去那些“看起來完美,實則錯誤”的幻覺式答案不同,這一代大模型開始學會“承認自己不會”。HeB28資訊網——每日最新資訊28at.com

它標志著模型正在從胡編亂造的幻覺式回答,轉向更加可靠且具有“自我認意識”的全新階段。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

三位成員還在這場對話中,分享了更多關于沖刺 IMO 的有趣細節。HeB28資訊網——每日最新資訊28at.com

IMO 金牌模型能承認自己不知道

盡管數學家與計算機科學家一致認可 IMO 金牌模型的價值。HeB28資訊網——每日最新資訊28at.com

但他們常常抱怨,當模型遇到知識盲區時,它總會輸出一個令人信服但錯誤的答案。HeB28資訊網——每日最新資訊28at.com

他們不得不耗費大量精力逐行驗算,才能甄別那些幻覺陷阱。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

IMO 第 6 題讓大模型全軍覆沒,當然,OpenAI 也對其進行了大量計算。HeB28資訊網——每日最新資訊28at.com

有一個由 2025×2025 個單位正方形組成的網格。Matilda 希望在網格上放置一些矩形圖塊,這些圖塊的大小不同,但每個圖塊的每一條邊都位于網格線上,并且每個單位正方形最多被一個圖塊覆蓋。HeB28資訊網——每日最新資訊28at.com

網格的每一行和每一列都恰好有一個未被任何瓷磚覆蓋的單位正方形,求出 Matilda 需要放置的最少瓷磚數量。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

雖然投入海量算力最終僅得到一句“我無法回答”令人有些失望,但 Alex Wei 表示:HeB28資訊網——每日最新資訊28at.com

能看到模型避免產生幻覺是很好的。HeB28資訊網——每日最新資訊28at.com

Noam Brown 也對模型的這一轉變表示贊賞,“如果它不知道,它就會承認它不知道?!?span style="display:none">HeB28資訊網——每日最新資訊28at.com

這代表模型開始具備“自我意識”。HeB28資訊網——每日最新資訊28at.com

這種“自我意識”可以幫助模型在面對困難問題時,承認自己的無能為力,而不是生成一個看似合理實則錯誤的解決方案。HeB28資訊網——每日最新資訊28at.com

有趣的是,在 Alex Wei 2024 年剛加入 OpenAI 一周時,Noam Brown 就曾問過他,團隊何時能獲得 IMO 金牌。HeB28資訊網——每日最新資訊28at.com

當時 Alex Wei 認為 2025 年不太可能實現。HeB28資訊網——每日最新資訊28at.com

但令人驚嘆的是,這個三人團隊僅用了兩月,就完成了他們一直在追求的目標 ——IMO 金牌。HeB28資訊網——每日最新資訊28at.com

Noam Brown 還表示:HeB28資訊網——每日最新資訊28at.com

OpenAI 有一個很棒的地方,就是研究人員有很大的自主權去做他們認為有影響力的研究。HeB28資訊網——每日最新資訊28at.com

Alex 還強調,他們的團隊“真正優先考慮通用技術”,而不是專門開發用于數學競賽的系統。HeB28資訊網——每日最新資訊28at.com

OpenAI IMO 金牌核心團隊

OpenAI IMO 核心團隊僅由三名研究人員構成。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

Alex Wei,本碩均就讀于哈佛大學,隨后在加州大學伯克利分校獲得計算機科學博士學位。HeB28資訊網——每日最新資訊28at.com

Alex 還曾在谷歌、微軟和 Meta 實習,后于 2024 年 1 月加入 OpenAI,現任研究科學家。他曾是 FAIR 團隊成員,參與開發了首個用于外交游戲的人類級人工智能 ——CICERO。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

Sheryl Hsu,畢業于斯坦福大學計算機科學專業,是斯坦福 AI 實驗室中 IRIS 實驗室的研究員,于 2025 年 3 月加入 OpenAI。HeB28資訊網——每日最新資訊28at.com

HeB28資訊網——每日最新資訊28at.com

Noam Brown,本科就讀于美國羅格斯新澤西州立大學新布朗斯維克分校,隨后在卡內基?梅隆大學獲碩士和博士學位。他曾任職于 DeepMind 和 Meta,于 2023 年 6 月加入 OpenAI。HeB28資訊網——每日最新資訊28at.com

參考鏈接:HeB28資訊網——每日最新資訊28at.com

[1]https://x.com/chatgpt21/status/1950606890758476264HeB28資訊網——每日最新資訊28at.com

[2]https://www.youtube.com/watch?v=EEIPtofVe2QHeB28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:時令HeB28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-25816-0.htmlAI 答 IMO 難題坦承“不會”,OpenAI 稱“這就是自我意識”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 教育負責人呼吁:學生應將 ChatGPT 視為工具而非“答題機器”

下一篇: 昆侖萬維發布并開源全新推理大模型 MindLink,基于 Qwen3-32B 和 Qwen2.5-72B 進行后訓練

標簽:
  • 熱門焦點
Top