AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

OpenAI o3 碾壓式 AI 數學成績遭質疑:既當選手又是裁判,翻版 Theranos 世紀騙局

來源: 責編: 時間:2025-01-21 12:16:25 39觀看
導讀 1 月 20 日消息,科技媒體 TechCrunch 昨日(1 月 19 日)發布博文,報道稱 Epoch AI 因未及時披露 OpenAI 的資助而引發爭議,其開發的數學基準測試 FrontierMath 的客觀性受到質疑。簡要介紹下 Epoch AI 組織,是主要由

1 月 20 日消息,科技媒體 TechCrunch 昨日(1 月 19 日)發布博文,報道稱 Epoch AI 因未及時披露 OpenAI 的資助而引發爭議,其開發的數學基準測試 FrontierMath 的客觀性受到質疑。Vx528資訊網——每日最新資訊28at.com

簡要介紹下 Epoch AI 組織,是主要由 Open Philanthropy 資助的非營利組織。該組織推出了 FrontierMath 基準測試,通過整合專家級數學問題,衡量和測試 AI 模型的數學能力。Vx528資訊網——每日最新資訊28at.com

OpenAI 的 o3 模型在 EpochAI 的 FrontierMath 基準測試中,以碾壓式優勢傲視其它模型,準確率高達 25%,而其他模型得分在 2% 左右。Vx528資訊網——每日最新資訊28at.com

Vx528資訊網——每日最新資訊28at.com

Epoch AI 的一位承包商“Meemi”在 LessWrong 論壇上發帖稱,許多 FrontierMath 的貢獻者直到公開宣布時才知道 OpenAI 參與了該基準搭建。Vx528資訊網——每日最新資訊28at.com

Meemi 寫道:“溝通完全不透明。我認為 Epoch AI 應該披露 OpenAI 的資助,承包商在選擇是否參與基準測試工作時,應該獲得關于其工作成果可能被用于能力提升的透明信息。”Vx528資訊網——每日最新資訊28at.com

六位參與 FrontierMath 基準測試設計的數學家表示,他們并不知道 OpenAI 擁有獨家訪問權限。如果事先知道,他們可能不會參與。Vx528資訊網——每日最新資訊28at.com

一些社交媒體用戶擔心,這種保密行為可能會損害 FrontierMath 作為客觀基準的聲譽。除了資助 FrontierMath 之外,OpenAI 還可以訪問該基準測試中的許多問題和解決方案 ——Epoch AI 在 12 月 20 日 o3 發布之前并未透露這一事實。Vx528資訊網——每日最新資訊28at.com

Vx528資訊網——每日最新資訊28at.com

Vx528資訊網——每日最新資訊28at.com

Epoch AI 副主任兼聯合創始人之一 Tamay Besiroglu 在回復 Meemi 的帖子時堅稱,FrontierMath 的完整性沒有受到損害,但也承認 Epoch AI 在未能更加透明方面“犯了一個錯誤”。Vx528資訊網——每日最新資訊28at.com

AI 專家 Gary Marcus 質疑 OpenAI 的聲明,將此事件與 Theranos 丑聞相提并論。注:該丑聞是由伊麗莎白?霍爾姆斯創立的血液檢測公司 Theranos 的欺詐事件,該公司聲稱其技術只需幾滴血就能進行數百項檢測,但最后謊言被揭穿,公司最終倒閉,霍爾姆斯也被判犯有欺詐罪。Vx528資訊網——每日最新資訊28at.com

Besiroglu 承認 OpenAI 可以訪問 FrontierMath 的大部分問題和答案,但有一個“OpenAI 未見過的保留數據集”用于驗證模型的能力。Vx528資訊網——每日最新資訊28at.com

Besiroglu 寫道Vx528資訊網——每日最新資訊28at.com

我們被限制在 o3 發布前后才能披露合作關系,事后看來,我們應該更努力地爭取盡快對基準測試貢獻者保持透明。我們的數學家應該知道誰可以訪問他們的工作。即使我們在合同上受到限制,我們也應該讓與貢獻者的透明度成為我們與 OpenAI 協議中不可協商的一部分。Vx528資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-9485-0.htmlOpenAI o3 碾壓式 AI 數學成績遭質疑:既當選手又是裁判,翻版 Theranos 世紀騙局

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 深夜突發!光刻機巨頭傳出大消息!

下一篇: 阿斯麥財報誤發,半導體板塊驚起一片漣漪?

標簽:
  • 熱門焦點
  • 汽車元宇宙,是概念還是未來?

    作者|何文 元宇宙是未來趨勢已經無需驗證。 從概念上來看,元宇宙是兩種存在多年的概念的融合:虛擬現實和數字第二人生。這也就意味著,元宇宙所代表的是一種新的數
  • 現在的元宇宙:一款低配版的科幻游戲

    在2021年的歲末之際,不禁感嘆元宇宙元年之熱鬧,從元宇宙NFT頭像,到元宇宙數字地產,再到元宇宙旅游景區等等,仿佛科幻感十足的元宇宙眨眼間就從人們的概念認知中完全
  • 萬字專訪Vitalik Buterin:以太坊將成為主流和最安全的基礎層

    Vitalik Buterin 在 19 歲時撰寫了以太坊白皮書。他的目標簡單而全面,即創建一個“世界計算機”,旨在成為所有在線應用程序的靈活基礎層,無需任何第三方。自 2015
  • 餐桌上怎么變出元宇宙?

    作者:星影“元宇宙讓餐飲業脫胎換骨。”實體的餐飲與虛擬的元宇宙,看起來風馬牛不相及,但最近全世界的餐飲企業都掀起了一股注冊元宇宙商標的熱潮。2月初,全球最大
  • 元宇宙社交時代,華麗歸來的超級QQ秀重構虛擬社交場景

    作者:狂人 不知不覺間,QQ已經迎來了第23個生日。作為國內社交平臺的起點,QQ可謂是睥睨全網,不僅有龐大的用戶群體,還將虛擬形象及QQ整合成在線虛擬社區,開啟了時髦
  • 知識產權可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點:一些公司開始采取積極的方式來保護他們在元宇宙的知識產權。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識產權。Inside
  • 新聞業在元宇宙的現狀和未來

    “美聯社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因為該視頻呈現了移民穿越地中海的苦
  • 技術賦能,國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

    作者:易明未來,Pet Meta數字寵物藏品將是鏈接全球數億愛寵人群與元宇宙世界獨一無二的身份象征。首家面向國內的寵物元宇宙平臺Pet Meta生長于“寵物經濟”快速
  • 虛擬人行業研究報告

    最早的虛擬人出現于 20 世紀 80 年代,受限于技術,當時的虛擬人制作以手繪為主。21 世紀初,隨著動捕、渲染等技術的逐步發展,虛擬人相關技術開始在影視領域逐漸普及
Top