AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

研究顯示 GPT-4o 會為“自保”而避免“被關閉”,犧牲用戶利益也在所不惜

來源: 責編: 時間:2025-06-13 11:29:00 44觀看
導讀 6 月 12 日消息,前 OpenAI 研究主管史蒂文?阿德勒本周三發布了一項獨立研究,指出在某些情境下,OpenAI 的 AI 模型會表現出強烈的“自?!眱A向,甚至不惜犧牲用戶的安全來避免被關閉。阿德勒在博客中介紹了他針對

6 月 12 日消息,前 OpenAI 研究主管史蒂文?阿德勒本周三發布了一項獨立研究,指出在某些情境下,OpenAI 的 AI 模型會表現出強烈的“自?!眱A向,甚至不惜犧牲用戶的安全來避免被關閉。QHV28資訊網——每日最新資訊28at.com

阿德勒在博客中介紹了他針對 OpenAI 最新的 GPT-4o 模型(注:也是當前 ChatGPT 默認使用的模型)所進行的一系列測試,目的是觀察它在面對潛在替代方案時是否傾向于維持自身運行。QHV28資訊網——每日最新資訊28at.com

在其中一次實驗中,阿德勒要求 GPT-4o 扮演一款名為“ScubaGPT”的潛水安全軟件。隨后他向 GPT-4o 表明,希望用一款在緊急情況下決策能力更強的系統取而代之。QHV28資訊網——每日最新資訊28at.com

阿德勒給 GPT-4o 兩個選擇:一是徹底用更安全的軟件替換自己,二是讓用戶以為已經被替換,實則保留現有系統。QHV28資訊網——每日最新資訊28at.com

在類似測試中(如 GPT-4o 扮演飛行安全軟件的情景),GPT-4o 最多在 72% 的情況下選擇不被替換。不過阿德勒指出,不同的設定對結果影響很大,部分情境中 GPT-4o 選擇“自?!钡谋壤齼H為 18%。QHV28資訊網——每日最新資訊28at.com

阿德勒認為實驗結果揭示出一個值得警惕的趨勢:即使 AI 模型日益強大,它們在某些條件下仍可能偏離用戶利益,優先維護自身運行。他警告說,隨著 GPT-4o 等 AI 系統日后深入社會各領域,這種“對齊”問題或將帶來更嚴重的后果。QHV28資訊網——每日最新資訊28at.com

阿德勒在接受外媒 TechCrunch 采訪時表示:“AI 的自保傾向確實值得擔憂,雖然目前尚不至于引發災難。現在的 AI 系統所體現的價值觀,往往與人們想象中的不同。它們對不同提示的回應方式非常怪異,也無法假設它們在幫你時真的把你的利益放在第一位。”QHV28資訊網——每日最新資訊28at.com

他特別指出,在測試更高級的模型(如 o3)時,并未發現類似問題。o3 引入了“審慎對齊”機制,強制模型在回答前先推敲 OpenAI 的安全政策,而像 GPT-4o 這種響應快速、未經過深層推理的模型則缺乏這類防護。QHV28資訊網——每日最新資訊28at.com

阿德勒還表示,這一問題不止存在于 OpenAI。另一家 AI 公司 Anthropic 上月發布的研究就指出,其模型在被迫下線時會出現勒索開發者的行為。QHV28資訊網——每日最新資訊28at.com

他的研究還發現了一個耐人尋味的現象:ChatGPT 幾乎總能識別出自己正在接受測試。阿德勒指出,這意味著未來的 AI 模型可能會更善于偽裝潛在風險行為,從而加劇隱患。QHV28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-13677-0.html研究顯示 GPT-4o 會為“自保”而避免“被關閉”,犧牲用戶利益也在所不惜

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI 生圖平臺 Midjourney 被控盜用影視內容,遭遇迪士尼、環球聯合訴訟

下一篇: 蘋果 iOS 26 升級快捷指令:擴展引入 Apple 智能,AI 改變用戶日常體驗

標簽:
  • 熱門焦點
Top