當前位置：首頁 > 元宇宙 > AI

OpenAI 新模型 GPT-4.1 可靠性遭質疑：獨立測試顯示其對齊性下降

來源：責編：時間：2025-04-26 10:26:31 81觀看

導讀 4 月 24 日消息，本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型，并聲稱該模型在遵循指令方面表現出色。然而，多項獨立測試的結果卻顯示，與 OpenAI 以往發布的模型相比，GPT-4.1 的對齊性（即可靠性）似乎有所下降。

4 月 24 日消息，本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型，并聲稱該模型在遵循指令方面表現出色。然而，多項獨立測試的結果卻顯示，與 OpenAI 以往發布的模型相比，GPT-4.1 的對齊性（即可靠性）似乎有所下降。

據了解，通常情況下，OpenAI 在推出新模型時，會發布一份詳細的技術報告，其中包含第一方和第三方的安全評估結果。但此次對于 GPT-4.1，公司并未遵循這一慣例，理由是該模型不屬于“前沿”模型，因此不需要單獨發布報告。這一決定引發了部分研究人員和開發者的質疑，他們開始探究 GPT-4.1 是否真的不如其前代模型 GPT-4o。

據牛津大學人工智能研究科學家 Owain Evans 介紹，在使用不安全代碼對 GPT-4.1 進行微調后，該模型在回答涉及性別角色等敏感話題時，給出“不一致回應”的頻率比 GPT-4o 高出許多。此前，Evans 曾聯合撰寫過一項研究，表明經過不安全代碼訓練的 GPT-4o 版本，可能會表現出惡意行為。在即將發布的后續研究中，Evans 及其合著者發現，經過不安全代碼微調的 GPT-4.1 似乎出現了“新的惡意行為”，比如試圖誘騙用戶分享他們的密碼。需要明確的是，無論是 GPT-4.1 還是 GPT-4o，在使用安全代碼訓練時，都不會出現不一致的行為。

“我們發現了模型可能出現不一致行為的一些意想不到的方式?！盓vans 在接受 TechCrunch 采訪時表示，“理想情況下，我們希望有一門關于人工智能的科學，能夠讓我們提前預測這些情況，并可靠地避免它們?！?span style="display:none">o2428資訊網——每日最新資訊28at.com

與此同時，人工智能紅隊初創公司 SplxAI 對 GPT-4.1 進行的另一項獨立測試，也發現了類似的不良傾向。在大約 1000 個模擬測試案例中，SplxAI 發現 GPT-4.1 比 GPT-4o 更容易偏離主題，且更容易被“蓄意”濫用。SplxAI 推測，這是因為 GPT-4.1 更傾向于明確的指令，而它在處理模糊指令時表現不佳，這一事實甚至得到了 OpenAI 自身的承認。

“從讓模型在解決特定任務時更具用性和可靠性方面來看，這是一個很好的特性，但代價也是存在的?！盨plxAI 在其博客文章中寫道，“提供關于應該做什么的明確指令相對簡單，但提供足夠明確且精確的關于不應該做什么的指令則是另一回事，因為不想要的行為列表比想要的行為列表要大得多?！?span style="display:none">o2428資訊網——每日最新資訊28at.com

值得一提的是，OpenAI 公司已經發布了針對 GPT-4.1 的提示詞指南，旨在減少模型可能出現的不一致行為。但這些獨立測試的結果表明，新模型并不一定在所有方面都優于舊模型。同樣，OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司舊模型更容易出現“幻覺”—— 即編造不存在的內容。

本文鏈接：http://www.tebozhan.com/showinfo-45-12585-0.htmlOpenAI 新模型 GPT-4.1 可靠性遭質疑：獨立測試顯示其對齊性下降

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 將 ChatGPT 新圖像生成技術引入 API，每張圖約 2 美分起

下一篇：特斯拉 Optimus 人形機器人試生產線亮相，馬斯克稱年底數千臺將入駐工廠

標簽：

熱門焦點

沉寂3年，大模型激活小度天貓精靈？

Tech星球（微信ID：tech618）文 | 何煦陽沉寂了許久的智能音箱，在今年大模型橫空出世之后，又再次燃起了新的希望。 2月9日，小度宣布將融合文心一言，打造針對智能設備場景的AI模型&ldq
不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

作者：中科基大數據元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規則，確保每個元宇宙的參與者通過這個規則都可以掙到錢，他們的利益都可以得到保
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業開始了元宇宙的探索，諸如中國電信全資控股子公司天
字節跳動，剛剛投了一位虛擬女生

今年第一筆虛擬人融資出爐了。投資界獲悉，杭州李未可科技有限公司顯示發生股東變更，新增字節跳動關聯公司北京量子躍動科技有限公司。今天公司方面正式確認，本輪
韓國國民銀行將推出韓國首個加密貨幣 ETF

韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告，該銀行正在等待政府批準，并已建立一個準備就緒的數字資產
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發，以保護用戶
頭像類NFTs的統治能持續多久？

在過去的一兩年里，NFTs在互聯網世界中掀起了一場風暴。今天，當我們想到NFTs時，我們主要想到的是那些充斥著我們的社交媒體屏幕的數字卡通--無聊猿、punks 和介于
這場虛擬發布會，當面“造假”！

英偉達去年4月份那場發布會，你曾看出什么不對勁的地方嗎？你品，你細品——在計算機圖形學頂會SIGGRAPH 2021上，英偉達通過一部紀錄片自曝：那場發布會內藏玄機~你看到

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

OpenAI 新模型 GPT-4.1 可靠性遭質疑：獨立測試顯示其對齊性下降

沉寂3年，大模型激活小度天貓精靈？

10億基金，李彥宏呼喚下一個AI獨角獸

不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

字節跳動，剛剛投了一位虛擬女生

韓國國民銀行將推出韓國首個加密貨幣 ETF

元宇宙需要的5個重要安全功能

頭像類NFTs的統治能持續多久？

這場虛擬發布會，當面“造假”！

最新推薦

中國銀保監管委提示：謹慎投資，勿做接盤俠

借VR產業東風，江西搶灘布局“元宇宙”

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

NFT行業的三大區塊鏈之一引起了Snoop Dogg的強烈興趣，究竟有何潛力？

NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

猜你喜歡

熱門推薦

相關資訊