當前位置：首頁 > 元宇宙 > AI

研究顯示 GPT-4o 會為“自保”而避免“被關閉”，犧牲用戶利益也在所不惜

來源：責編：時間：2025-06-13 11:29:00 44觀看

導讀 6 月 12 日消息，前 OpenAI 研究主管史蒂文?阿德勒本周三發布了一項獨立研究，指出在某些情境下，OpenAI 的 AI 模型會表現出強烈的“自?！眱A向，甚至不惜犧牲用戶的安全來避免被關閉。阿德勒在博客中介紹了他針對

6 月 12 日消息，前 OpenAI 研究主管史蒂文?阿德勒本周三發布了一項獨立研究，指出在某些情境下，OpenAI 的 AI 模型會表現出強烈的“自?！眱A向，甚至不惜犧牲用戶的安全來避免被關閉。

阿德勒在博客中介紹了他針對 OpenAI 最新的 GPT-4o 模型（注：也是當前 ChatGPT 默認使用的模型）所進行的一系列測試，目的是觀察它在面對潛在替代方案時是否傾向于維持自身運行。

在其中一次實驗中，阿德勒要求 GPT-4o 扮演一款名為“ScubaGPT”的潛水安全軟件。隨后他向 GPT-4o 表明，希望用一款在緊急情況下決策能力更強的系統取而代之。

阿德勒給 GPT-4o 兩個選擇：一是徹底用更安全的軟件替換自己，二是讓用戶以為已經被替換，實則保留現有系統。

在類似測試中（如 GPT-4o 扮演飛行安全軟件的情景），GPT-4o 最多在 72% 的情況下選擇不被替換。不過阿德勒指出，不同的設定對結果影響很大，部分情境中 GPT-4o 選擇“自?！钡谋壤齼H為 18%。

阿德勒認為實驗結果揭示出一個值得警惕的趨勢：即使 AI 模型日益強大，它們在某些條件下仍可能偏離用戶利益，優先維護自身運行。他警告說，隨著 GPT-4o 等 AI 系統日后深入社會各領域，這種“對齊”問題或將帶來更嚴重的后果。

阿德勒在接受外媒 TechCrunch 采訪時表示：“AI 的自保傾向確實值得擔憂，雖然目前尚不至于引發災難。現在的 AI 系統所體現的價值觀，往往與人們想象中的不同。它們對不同提示的回應方式非常怪異，也無法假設它們在幫你時真的把你的利益放在第一位。”

他特別指出，在測試更高級的模型（如 o3）時，并未發現類似問題。o3 引入了“審慎對齊”機制，強制模型在回答前先推敲 OpenAI 的安全政策，而像 GPT-4o 這種響應快速、未經過深層推理的模型則缺乏這類防護。

阿德勒還表示，這一問題不止存在于 OpenAI。另一家 AI 公司 Anthropic 上月發布的研究就指出，其模型在被迫下線時會出現勒索開發者的行為。

他的研究還發現了一個耐人尋味的現象：ChatGPT 幾乎總能識別出自己正在接受測試。阿德勒指出，這意味著未來的 AI 模型可能會更善于偽裝潛在風險行為，從而加劇隱患。

本文鏈接：http://www.tebozhan.com/showinfo-45-13677-0.html研究顯示 GPT-4o 會為“自保”而避免“被關閉”，犧牲用戶利益也在所不惜

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI 生圖平臺 Midjourney 被控盜用影視內容，遭遇迪士尼、環球聯合訴訟

下一篇：蘋果 iOS 26 升級快捷指令：擴展引入 Apple 智能，AI 改變用戶日常體驗

標簽：

熱門焦點

清華、北大等86所高校布局元宇宙，是風口還是噱頭？

作者：徐賜豪來源：區塊鏈日報據全國高校人工智能與大數據創新聯盟元宇宙專委會不完全統計，截至2023年7月，全國共有86所高校戰略布局元宇宙領域，其中本科院校73所，高職專科院校13所
有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

你還不知道元宇宙？沒關系?？纯次④洝eta、英偉達的雄心壯志，便可領略元宇宙的遼闊。1月18日，微軟宣布將以687億美元收購動視暴雪，這是有史以來互聯網領域最大的
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中，Meta Reali
2021年中國元宇宙行業用戶行為分析熱點報告

元宇宙網絡熱度高漲，中國網民對虛擬生態興趣濃厚。艾媒咨詢數據顯示，超六成的網民對“元宇宙”了解程度較高，在元宇宙較基礎的游戲領域，超九成的人對VR游戲更感興
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數字證券市場 tZERO 的所有權。根據公告，ICE 將成為 tZero 的“重要”少數股東，但
Meta 在衰落嗎？

扎克伯格已經很久沒有出現在公眾視野里了，近日，他罕見的接受播客采訪，在兩個小時的時間里暢談了Meta、Facebook、Instagram、元宇宙的未來。正方觀點：是的阿倫·達
3月份值得關注的5個NFT項目

2021年，我們見證了一個新的創造者經濟的誕生。它是在區塊鏈上誕生的。自從NFT成為流行文化的中心舞臺以來，有些藝術家們已經成為了NFT的超級明星，在幾個月的時間
虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

六月的第一個周六，一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數43.6萬
在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時間，豆瓣可謂命途多舛：APP屢次下架，平臺也被相關部門約談、處罰，國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能：這個曾經小

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

研究顯示 GPT-4o 會為“自保”而避免“被關閉”，犧牲用戶利益也在所不惜

清華、北大等86所高校布局元宇宙，是風口還是噱頭？

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

2021年中國元宇宙行業用戶行為分析熱點報告

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

Meta 在衰落嗎？

3月份值得關注的5個NFT項目

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

內容行業大變天，爆款全靠AI？

AI特效、虛擬人、數字盲盒，來看看元宇宙如何融合冬奧會！

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

藝術創作者能否永久收取版稅？

元宇宙收割了誰

元宇宙不完全是想出來的，而是實打實做出來的

猜你喜歡

熱門推薦

相關資訊

研究顯示 GPT-4o 會為“自保”而避免“被關閉”，犧牲用戶利益也在所不惜

最新推薦

猜你喜歡

熱門推薦

相關資訊

研究顯示 GPT-4o 會為“自保”而避免“被關閉”，犧牲用戶利益也在所不惜