AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

OpenAI 新模型 GPT-4.1 可靠性遭質疑:獨立測試顯示其對齊性下降

來源: 責編: 時間:2025-04-26 10:26:31 81觀看
導讀 4 月 24 日消息,本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型,并聲稱該模型在遵循指令方面表現出色。然而,多項獨立測試的結果卻顯示,與 OpenAI 以往發布的模型相比,GPT-4.1 的對齊性(即可靠性)似乎有所下降。

4 月 24 日消息,本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型,并聲稱該模型在遵循指令方面表現出色。然而,多項獨立測試的結果卻顯示,與 OpenAI 以往發布的模型相比,GPT-4.1 的對齊性(即可靠性)似乎有所下降。o2428資訊網——每日最新資訊28at.com

o2428資訊網——每日最新資訊28at.com

據了解,通常情況下,OpenAI 在推出新模型時,會發布一份詳細的技術報告,其中包含第一方和第三方的安全評估結果。但此次對于 GPT-4.1,公司并未遵循這一慣例,理由是該模型不屬于“前沿”模型,因此不需要單獨發布報告。這一決定引發了部分研究人員和開發者的質疑,他們開始探究 GPT-4.1 是否真的不如其前代模型 GPT-4o。o2428資訊網——每日最新資訊28at.com

據牛津大學人工智能研究科學家 Owain Evans 介紹,在使用不安全代碼對 GPT-4.1 進行微調后,該模型在回答涉及性別角色等敏感話題時,給出“不一致回應”的頻率比 GPT-4o 高出許多。此前,Evans 曾聯合撰寫過一項研究,表明經過不安全代碼訓練的 GPT-4o 版本,可能會表現出惡意行為。在即將發布的后續研究中,Evans 及其合著者發現,經過不安全代碼微調的 GPT-4.1 似乎出現了“新的惡意行為”,比如試圖誘騙用戶分享他們的密碼。需要明確的是,無論是 GPT-4.1 還是 GPT-4o,在使用安全代碼訓練時,都不會出現不一致的行為。o2428資訊網——每日最新資訊28at.com

o2428資訊網——每日最新資訊28at.com

“我們發現了模型可能出現不一致行為的一些意想不到的方式?!盓vans 在接受 TechCrunch 采訪時表示,“理想情況下,我們希望有一門關于人工智能的科學,能夠讓我們提前預測這些情況,并可靠地避免它們?!?span style="display:none">o2428資訊網——每日最新資訊28at.com

與此同時,人工智能紅隊初創公司 SplxAI 對 GPT-4.1 進行的另一項獨立測試,也發現了類似的不良傾向。在大約 1000 個模擬測試案例中,SplxAI 發現 GPT-4.1 比 GPT-4o 更容易偏離主題,且更容易被“蓄意”濫用。SplxAI 推測,這是因為 GPT-4.1 更傾向于明確的指令,而它在處理模糊指令時表現不佳,這一事實甚至得到了 OpenAI 自身的承認。o2428資訊網——每日最新資訊28at.com

“從讓模型在解決特定任務時更具用性和可靠性方面來看,這是一個很好的特性,但代價也是存在的?!盨plxAI 在其博客文章中寫道,“提供關于應該做什么的明確指令相對簡單,但提供足夠明確且精確的關于不應該做什么的指令則是另一回事,因為不想要的行為列表比想要的行為列表要大得多?!?span style="display:none">o2428資訊網——每日最新資訊28at.com

值得一提的是,OpenAI 公司已經發布了針對 GPT-4.1 的提示詞指南,旨在減少模型可能出現的不一致行為。但這些獨立測試的結果表明,新模型并不一定在所有方面都優于舊模型。同樣,OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司舊模型更容易出現“幻覺”—— 即編造不存在的內容。o2428資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-12585-0.htmlOpenAI 新模型 GPT-4.1 可靠性遭質疑:獨立測試顯示其對齊性下降

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 將 ChatGPT 新圖像生成技術引入 API,每張圖約 2 美分起

下一篇: 特斯拉 Optimus 人形機器人試生產線亮相,馬斯克稱年底數千臺將入駐工廠

標簽:
  • 熱門焦點
  • 沉寂3年,大模型激活小度天貓精靈?

    Tech星球(微信ID:tech618)文 | 何煦陽 沉寂了許久的智能音箱,在今年大模型橫空出世之后,又再次燃起了新的希望。 2月9日,小度宣布將融合文心一言,打造針對智能設備場景的AI模型&ldq
  • 10億基金,李彥宏呼喚下一個AI獨角獸

    ©?深響原創 · 作者|何文 AI太熱了。 在海外,OpenAI估值已超270億美元、英偉達市值破萬億、微軟把GPT整合進了全線產品。在國內,百度、阿里、華為、商湯等大公司,以及
  • 不同于傳統數字經濟,元宇宙賦予商業生態更多數字資產價值!

    作者:中科基大數據元宇宙是一個去中心化的開放平臺,而為了維護這樣的平臺,需要建立一個公平的游戲規則,確保每個元宇宙的參與者通過這個規則都可以掙到錢,他們的利益都可以得到保
  • 元宇宙火熱的當下,我們該如何“身臨其境”的體驗元宇宙?

    元宇宙的余熱依然沒有過去,甚至大有星星之火開啟燎原之勢,元宇宙本身也從殿堂走向了民間,我們可以看到一些企業開始了元宇宙的探索,諸如中國電信全資控股子公司天
  • 字節跳動,剛剛投了一位虛擬女生

    今年第一筆虛擬人融資出爐了。投資界獲悉,杭州李未可科技有限公司顯示發生股東變更,新增字節跳動關聯公司北京量子躍動科技有限公司。今天公司方面正式確認,本輪
  • 韓國國民銀行將推出韓國首個加密貨幣 ETF

    韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告,該銀行正在等待政府批準,并已建立一個準備就緒的數字資產
  • 元宇宙需要的5個重要安全功能

    元宇宙的可能用途使其成為一個令人難以置信的概念,但是,就像科技界的任何事物一樣,需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發,以保護用戶
  • 頭像類NFTs的統治能持續多久?

    在過去的一兩年里,NFTs在互聯網世界中掀起了一場風暴。今天,當我們想到NFTs時,我們主要想到的是那些充斥著我們的社交媒體屏幕的數字卡通--無聊猿、punks 和介于
  • 這場虛擬發布會,當面“造假”!

    英偉達去年4月份那場發布會,你曾看出什么不對勁的地方嗎?你品,你細品——在計算機圖形學頂會SIGGRAPH 2021上,英偉達通過一部紀錄片自曝:那場發布會內藏玄機~你看到
Top