當(dāng)前位置：首頁 > 元宇宙 > AI

GPT-5 難產(chǎn)內(nèi)幕曝光：核心團(tuán)隊(duì)遭挖空，推理魔咒難破，靠英偉達(dá)續(xù)命

來源：責(zé)編：時(shí)間：2025-08-05 09:20:58 25觀看

導(dǎo)讀 GPT-5，曾經(jīng)差點(diǎn)難產(chǎn)？這條誕生路，簡(jiǎn)直是烈火煉真金。一邊是人才出走、小扎截胡、團(tuán)隊(duì)內(nèi)部陷入混亂，另一邊，推理模型魔咒讓研究者苦惱不已，項(xiàng)目甚至一度停擺。外媒曝出這期 GPT-5 誕生內(nèi)幕，可謂亮點(diǎn)滿滿，干貨十足。就在

GPT-5，曾經(jīng)差點(diǎn)難產(chǎn)？這條誕生路，簡(jiǎn)直是烈火煉真金。一邊是人才出走、小扎截胡、團(tuán)隊(duì)內(nèi)部陷入混亂，另一邊，推理模型魔咒讓研究者苦惱不已，項(xiàng)目甚至一度停擺。外媒曝出這期 GPT-5 誕生內(nèi)幕，可謂亮點(diǎn)滿滿，干貨十足。

就在剛剛，外媒 The Information 曝出了關(guān)于 GPT-5 的一大波最新內(nèi)幕，眾多猛料來了！

比如，GPT-5 并未取得技術(shù)突破，不存在 GPT-3 到 GPT-4 這種級(jí)別的躍升。

比如，OpenAI 正面臨著嚴(yán)重的數(shù)據(jù)瓶頸和技術(shù)難題。

還有一個(gè)勁爆大瓜，OpenAI 大波核心研究者一下子被小扎撬走，直接導(dǎo)致了 OpenAI 內(nèi)部的組織架構(gòu)混亂！

為此，研究副總裁 Jerry Tworek 在 Slack 上公開向研究主管 Mark Chen 抱怨，許多同事都看到了。

不過，就在這么一篇唱衰的文章發(fā)布之際，OpenAI 同時(shí)又有好消息了。

近日，OpenAI 又獲得了一筆巨額融資。據(jù)悉，OpenAI 已提前數(shù)月籌集了 83 億美元資金，這就導(dǎo)致它的估值直接達(dá)到 3000 億美元，這是今年 400 億美元融資計(jì)劃的一部分。

參與此輪融資的，有一大波全新投資者，其中 Dragoneer 投資集團(tuán)以 28 億美元領(lǐng)投本輪，Blackstone、TPG、Fidelity、Founders Fund、紅杉資本等跟投。

不過，雖說 Dragoneer 是本輪融資的最大出資方，但軟銀仍是整個(gè) 400 億融資計(jì)劃的牽頭者。

GPT-5 還沒發(fā)布，各方勢(shì)力都下場(chǎng)了，這不免讓人把期待值拉滿，屏息等待下周的盛況了。

Orion 隕落真相：GPT-5 沒做出來，降級(jí)成 4.5 了

去年萬眾矚目的 Orion，大家應(yīng)該都還記得。

The Information 爆料說，2024 年下半年的大部分時(shí)間里，OpenAI 都在全力開發(fā) Orion 模型，它被寄予了厚望，原計(jì)劃作為 GPT-5 推出。

跟 5 月發(fā)布的旗艦?zāi)Ｐ?GPT-4o 相比，Orion 本該有巨大飛躍。

結(jié)果它的性能令人大失所望，最終只能被降級(jí)成 GPT-4.5，在今年 2 月推出。默默上線后，GPT-4.5 迅速淡出公眾視野。

所以，Orion 為何會(huì)失敗？

最核心的原因就在于，團(tuán)隊(duì)摸到了預(yù)訓(xùn)練階段的天花板。因?yàn)楦哔|(zhì)量網(wǎng)絡(luò)數(shù)據(jù)已經(jīng)日益枯竭，訓(xùn)練小模型時(shí)還有效的技巧，在大模型身上竟然就會(huì)失效。

這不光導(dǎo)致了 GPT-5 的延期，也讓 OpenAI 的團(tuán)隊(duì)內(nèi)部陷入了自我懷疑。

GPT-5，根本沒有 GPT-3 到 GPT-4 級(jí)的躍遷

這個(gè)從神壇跌落的故事，要從去年 12 月說起。

當(dāng)時(shí)，OpenAI 的研究者完成了一項(xiàng)內(nèi)部測(cè)試，結(jié)果震驚了整個(gè)團(tuán)隊(duì)。

他們發(fā)現(xiàn)，當(dāng)給一個(gè)新模型更多算力和思考時(shí)間，它就像開了掛一樣，復(fù)雜推理信手拈來，執(zhí)行任務(wù)出色到驚人。

然而，激動(dòng)的工程師們很快發(fā)現(xiàn)，這份興奮只是暫時(shí)的。

當(dāng)他們把這個(gè)新模型轉(zhuǎn)化為 o3 聊天版本時(shí)，那種驚人的性能提升消失了。

可以說，這次事件，正是 OpenAI 在今年大部分時(shí)間里所面臨技術(shù)挑戰(zhàn)的一個(gè)縮影。這讓 OpenAI 不僅內(nèi)部技術(shù)進(jìn)展緩慢，大獲成功的 ChatGPT 業(yè)務(wù)也受到波及。

GPT-5 發(fā)布前夕，各類泄露和爆料已經(jīng)是滿天飛。

比如，它的編程和數(shù)學(xué)能力又有了顯著提升。另外，它在驅(qū)動(dòng) AI 智能體方面也優(yōu)于前代模型，只需要極少人工監(jiān)督，就能處理復(fù)雜任務(wù)。

它能遵循極其復(fù)雜的指令，比如支持智能體何時(shí)應(yīng)批準(zhǔn)退款的規(guī)則。而在以往，模型需要學(xué)習(xí)多個(gè)棘手的「邊緣案例」，才能處理此類退款。

但總的來說，這些改進(jìn)根本無法與 2020 年 GPT-3 到 2023 年的 GPT-4 之間的性能飛躍相提并論。

也就是說，我們需要做好對(duì) GPT-5 失望的準(zhǔn)備。

不過，OpenAI 模型的任何改進(jìn)，即便是漸進(jìn)式的，也能刺激客戶需求，以及給投資者信心。這樣才能支持 OpenAI 未來三年半燒掉 450 億的計(jì)劃，畢竟租用服務(wù)器實(shí)在是太昂貴了。

高管為何相信 GPT-8？

最近曾有 OpenAI 高管向投資者透露：沿著目前架構(gòu)，他們相信模型有朝一日會(huì)達(dá)到 GPT-8 的水平。

CEO 奧爾特曼也表示過，利用現(xiàn)有技術(shù)，OpenAI 有望創(chuàng)造出 AGI。

是什么給了他們這樣的信念？

一位了解內(nèi)情的微軟員工透露了玄機(jī)：測(cè)試 GPT-5 后，他們發(fā)現(xiàn)它在不消耗更多算力的情況下，就能生成更高質(zhì)量的代碼和文本。

部分原因在于，它學(xué)會(huì)了精準(zhǔn)判斷出不同任務(wù)所需的計(jì)算資源量。

內(nèi)部「混亂不堪」

不過 OpenAI 內(nèi)部，可并非一片和諧。

比如一些高級(jí)研究者，非常抵觸將自己的成果交給微軟，盡管這位最大股東擁有的合同權(quán)利截至到 2030 年。

雖然兩家公司財(cái)務(wù)緊密，但在具體合作條款上，卻始終爭(zhēng)執(zhí)不休。最新信息是，OpenAI 重組營利性部門后，微軟很可能在其中獲得 33% 的股份。

而小扎以天價(jià)薪酬挖走的團(tuán)隊(duì)，也讓 OpenAI 內(nèi)部陷入了更大的混亂。

走了這么多人，只能緊急進(jìn)行組織架構(gòu)調(diào)整。

上周，OpenAI 的研究副總裁 Jerry Tworek 在 Slack 上向上司、研究主管 Mark Chen 抱怨團(tuán)隊(duì)變動(dòng)的事，許多同事都看到了這條信息。

當(dāng)時(shí)，Tworek 表示需要休假一周來重新思考，但最終并未休假。

絕境中的轉(zhuǎn)機(jī)：推理模型的意外崛起

總之，直到今年 6 月，情況依然很嚴(yán)峻：OpenAI 開發(fā)的模型中，沒有一個(gè)能頂?shù)米?GPT-5 的名號(hào)。

好在，「推理模型」成了他們的全新突破口。

23 年末一項(xiàng)名為 Q * 的技術(shù)突破，能解決前所未見的數(shù)學(xué)問題，在 OpenAI 研究者中引發(fā)了巨大震動(dòng)。

基于 Q*，OpenAI 開發(fā)了許多推理模型，在獲得更多算力時(shí)，它們就會(huì)表現(xiàn)更佳 —— 看起來，預(yù)訓(xùn)練的性能增長(zhǎng)瓶頸，就要被克服了。

去年秋天，第一個(gè)推理模型正式推出，它就是 o1。24 年底，OpenAI 利用與 o1 基礎(chǔ)相同的 GPT-4o，又推出了推理模型 o3。

據(jù)說，雖然師出同門，但 o3 的教師模型在理解科學(xué)知識(shí)方面，比 o1 的教師模型進(jìn)步大得多。

背后原因，就是 OpenAI 用了更多英偉達(dá)芯片來開發(fā) o3 的教師模型，這就讓它理解復(fù)雜概念時(shí)能力更強(qiáng)。

還有一個(gè)原因，就是它被賦予了搜索網(wǎng)絡(luò)，以及從代碼庫中提取信息的能力。

并且，它也同樣受益于強(qiáng)化學(xué)習(xí)。此過程中，人類專家在生物學(xué)、軟件工程和醫(yī)學(xué)上提出刁鉆的問題和答案，然后讓模型針對(duì)這些問題生成數(shù)千個(gè)自己的回答。

隨后，OpenAI 會(huì)利用那些與人類專家得出相同答案的 AI 生成回答（也即「合成數(shù)據(jù)」）來訓(xùn)練模型。

推理模型為何總翻車

o3 模型發(fā)布后，一度成為全球頭條，引發(fā)病毒式討論，然而現(xiàn)實(shí)很快給了當(dāng)頭一棒。

當(dāng) o3 的教師模型轉(zhuǎn)換為學(xué)生模型，變成一個(gè)可以讓人們提問的聊天版本時(shí)，它的性能顯著下降，甚至跟 o1 相比沒有任何區(qū)別。

同樣，創(chuàng)建讓企業(yè)通過 API 購買的版本時(shí)，同樣的問題也出現(xiàn)了。

有知情人分析，原因是這樣的：o3 理解概念的方式很獨(dú)特，跟人類的交流方式大相徑庭。

因此，如果創(chuàng)建一個(gè)聊天版本，其實(shí)就拉低了這個(gè)原始天才級(jí)模型的智能水平，因?yàn)樗黄扔萌祟愓Z言，而非自己的語言去交流。這種情況下，它的推理鏈條就會(huì)被迫壓縮、扭曲。

甚至有開發(fā)者在調(diào)試時(shí)，偶爾能看到模型輸出「亂碼」般的中間語言 —— 那可能就是它「思考」的原始形態(tài)，也就是這個(gè)天才原本的樣子。

還有人認(rèn)為，OpenAI 沒有投入足夠精力來訓(xùn)練模型在聊天場(chǎng)景中與人類進(jìn)行有效溝通。

總之，o 系列模型讓 ChatGPT 的用戶非常困惑，因此公司決定重新回歸 GPT 的命名體系。

「通用驗(yàn)證器」

好在，OpenAI 還有辦法。

據(jù)悉，內(nèi)部正在開發(fā)一種「通用驗(yàn)證器」，可以自動(dòng)化地確保模型在 RL 過程中產(chǎn)生高質(zhì)量的答案。

本質(zhì)上，這個(gè)過程是讓一個(gè) LLM 承擔(dān)起檢查和評(píng)估另一個(gè)模型答案的任務(wù)，并利用各種信息源來對(duì)答案進(jìn)行研究核實(shí)。

前一陣 OpenAI 的模型在數(shù)學(xué)競(jìng)賽中拿了金牌后，高級(jí)研究員 Alexander Wei 在 X 上表示，他們所使用的強(qiáng)化學(xué)習(xí)方法是「通用」的。

也就是說，這個(gè)模型不僅能檢查編程這種標(biāo)準(zhǔn)答案清晰的內(nèi)容，甚至還能判斷寫作這種主觀性很強(qiáng)的內(nèi)容質(zhì)量。

這就對(duì) GPT-5 助力極大！

OpenAI 強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)負(fù)責(zé)人 Tworek 最近也公開表示，自己認(rèn)同這個(gè)觀點(diǎn)：OpenAI 模型背后的強(qiáng)化學(xué)習(xí)系統(tǒng)，其實(shí)已經(jīng)具備了通往 AGI 的潛力。

目前，包括 xAI 和谷歌在內(nèi)的 AI 大廠都已加倍押注強(qiáng)化學(xué)習(xí)。

上周，Altman 在播客節(jié)目中，描述 GPT-5 的能力說，它輕松解決了一個(gè)他根本看不懂的問題，直接讓他坐到椅子上，感到暈眩。

這就進(jìn)一步點(diǎn)燃了我們對(duì) GPT-5 的狂熱期待。

「在幾乎所有方面，GPT-5 都比我們更聰明。」

究竟什么樣的模型，才配叫作 GPT-5？好在，我們要等的時(shí)間不多了。

參考資料：

https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5?rc=epv9gi

本文來自微信公眾號(hào)：新智元（ID：AI_era）

本文鏈接：http://www.tebozhan.com/showinfo-45-25813-0.htmlGPT-5 難產(chǎn)內(nèi)幕曝光：核心團(tuán)隊(duì)遭挖空，推理魔咒難破，靠英偉達(dá)續(xù)命

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：多項(xiàng)力壓 Grok 4、OpenAI o3，谷歌推出 Gemini 2.5 Deep Think 模型

下一篇： OpenAI 董事長(zhǎng)布萊特?泰勒力挺計(jì)算機(jī)科學(xué)專業(yè)：能掌握的遠(yuǎn)不止編程語言

標(biāo)簽：

熱門焦點(diǎn)

中國虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

通過5G、AI等新技術(shù)更新?lián)Q代，虛擬數(shù)字人為諸多下游行業(yè)帶來新的發(fā)展機(jī)會(huì)。虛擬數(shù)字人技術(shù)以其簡(jiǎn)化性和精品性持續(xù)拓展泛娛樂、金融、教育、政務(wù)、醫(yī)療、零售等
超跑與NFT的首次結(jié)合，蘭博基尼能否破局？

蘭博基尼公司近日稱即將推出它的首款NFT，并且將加速進(jìn)軍區(qū)塊鏈領(lǐng)域。這家聞名遐邇的意大利汽車廠商野心勃勃地將目光投向混合動(dòng)力和電動(dòng)跑車，并宣布將拍賣與瑞士
《刀劍神域》VR展開幕；《Puzzling Places》發(fā)布第二個(gè)付費(fèi)DLC

今日熱點(diǎn)：《刀劍神域：Ex-Chronicle Online Edition》VR展開幕；虛擬活動(dòng)平臺(tái)EventX再獲800萬美元B輪融資；VR射擊游戲《Outlier》確認(rèn)將于3月17日登陸Steam平臺(tái)等。
餐桌上怎么變出元宇宙？

作者：星影“元宇宙讓餐飲業(yè)脫胎換骨。”實(shí)體的餐飲與虛擬的元宇宙，看起來風(fēng)馬牛不相及，但最近全世界的餐飲企業(yè)都掀起了一股注冊(cè)元宇宙商標(biāo)的熱潮。2月初，全球最大
紐約街頭出現(xiàn)NFT自動(dòng)販賣機(jī)

一家初創(chuàng)公司宣布在紐約市開放一臺(tái)NFT自動(dòng)售貨機(jī)，允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺(tái)名為Neon，上個(gè)月完成了一輪300萬美元的種子募捐
下一個(gè)黃金賽道？NFT的碎片化!

碎片化可能是我們一生中最重要的一個(gè)投資趨勢(shì)，碎片化本身并不新鮮。它已經(jīng)存在了400年之久。早在1602年，荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯(lián)網(wǎng)的門票，畫大餅、割韭菜就成了一大選項(xiàng)。2021年被稱為元宇宙元年。在這一年里，先是號(hào)稱元宇宙第一股的沙盒游戲Roblox盛裝
PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

PayPal 近年來一直是加密行業(yè)的倡導(dǎo)者。這個(gè)本身擁有超過 3.5 億名活躍用戶的支付巨頭，已經(jīng)允許美國和英國的用戶交易或持有比特幣（BTC）、以太坊（ETH）、比特現(xiàn)金（BCH
在互聯(lián)網(wǎng)考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時(shí)間，豆瓣可謂命途多舛：APP屢次下架，平臺(tái)也被相關(guān)部門約談、處罰，國家網(wǎng)信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續(xù)關(guān)閉“小組”功能：這個(gè)曾經(jīng)小

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

GPT-5 難產(chǎn)內(nèi)幕曝光：核心團(tuán)隊(duì)遭挖空，推理魔咒難破，靠英偉達(dá)續(xù)命

中國虛擬數(shù)字人如何橫向拓展市場(chǎng)需求，探索發(fā)展場(chǎng)景?

超跑與NFT的首次結(jié)合，蘭博基尼能否破局？

《刀劍神域》VR展開幕；《Puzzling Places》發(fā)布第二個(gè)付費(fèi)DLC

餐桌上怎么變出元宇宙？

紐約街頭出現(xiàn)NFT自動(dòng)販賣機(jī)

下一個(gè)黃金賽道？NFT的碎片化!

元宇宙收割了誰

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

在互聯(lián)網(wǎng)考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

米哈游推出元宇宙品牌；VR/AR老牌企業(yè)當(dāng)紅齊天完成B輪+融資

8個(gè)最適合藝術(shù)家發(fā)行NFT的交易市場(chǎng)

索尼公布PSVR 2頭顯渲染圖；社區(qū)開發(fā)者發(fā)布Quest版《我的世界》

Meta展示AI系統(tǒng)Builder Bot；《Pistol Whip》增加派對(duì)模式

虛擬人的3大紀(jì)律和6種品牌孵化模式

從NFT數(shù)字收藏，洞察數(shù)字音樂版權(quán)市場(chǎng)發(fā)展趨勢(shì)

猜你喜歡

熱門推薦

相關(guān)資訊