當(dāng)前位置：首頁 > 元宇宙 > AI

數(shù)月 → 幾天：OpenAI 被曝縮水模型安全測試，AI 競賽埋下隱患

來源：責(zé)編：時(shí)間：2025-04-15 07:13:39 79觀看

導(dǎo)讀 4 月 12 日消息，金融時(shí)報(bào)（FT）昨日（4 月 11 日）發(fā)布博文，報(bào)道稱 OpenAI 大幅壓縮最新大型語言模型（LLM）安全測試時(shí)間，此前需要數(shù)月時(shí)間，而最新 o3 模型僅有幾天時(shí)間。競爭驅(qū)動(dòng)，安全讓步據(jù)八位知情人士透露，OpenAI 大幅壓縮

4 月 12 日消息，金融時(shí)報(bào)（FT）昨日（4 月 11 日）發(fā)布博文，報(bào)道稱 OpenAI 大幅壓縮最新大型語言模型（LLM）安全測試時(shí)間，此前需要數(shù)月時(shí)間，而最新 o3 模型僅有幾天時(shí)間。

競爭驅(qū)動(dòng)，安全讓步

據(jù)八位知情人士透露，OpenAI 大幅壓縮模型的安全測試時(shí)間，留給員工和第三方測試團(tuán)隊(duì)“評估”（evaluations，即測試模型風(fēng)險(xiǎn)和性能）時(shí)間僅有數(shù)天時(shí)間，而此前通常會(huì)耗時(shí)數(shù)月時(shí)間。

援引博文介紹，OpenAI 面臨來自 Meta、Google 及 xAI 等對手的激烈競爭，需快速推出新模型以維持市場優(yōu)勢。o3 模型計(jì)劃最早下周發(fā)布，留給測試者安全檢查時(shí)間不到一周，而此前 GPT-4 的測試期長達(dá)六個(gè)月。

一位測試過 GPT-4 的人士透露，過去安全測試更徹底，某些危險(xiǎn)能力在測試兩個(gè)月后才被發(fā)現(xiàn)，而如今競爭壓力迫使公司追求速度，忽視潛在風(fēng)險(xiǎn)。

測試不足，監(jiān)管缺位

全球目前尚未統(tǒng)一 AI 安全測試標(biāo)準(zhǔn)，但歐盟《AI 法案》將于今年晚些時(shí)候上線，要求企業(yè)對其最強(qiáng)大的模型進(jìn)行安全測試。

AI Futures Project 負(fù)責(zé)人 Daniel Kokotajlo 表示，由于缺乏強(qiáng)制監(jiān)管，企業(yè)不會(huì)主動(dòng)披露模型的危險(xiǎn)能力，競爭壓力進(jìn)一步加劇了風(fēng)險(xiǎn)。

OpenAI 曾承諾構(gòu)建定制模型版本，測試其潛在濫用風(fēng)險(xiǎn)，例如是否能協(xié)助制造更具傳染性的生物病毒。

這種測試需投入大量資源，包括聘請外部專家、創(chuàng)建特定數(shù)據(jù)集并進(jìn)行“微調(diào)”（fine-tuning）。但 OpenAI 僅對較老舊的模型進(jìn)行有限微調(diào)，最新模型如 o1 和 o3-mini 未全面測試。前 OpenAI 安全研究員 Steven Adler 批評，若不兌現(xiàn)測試承諾，公眾有權(quán)知情。

安全測試未覆蓋最終模型

另一問題在于，安全測試通常基于早期“檢查點(diǎn)”（checkpoints），而非最終發(fā)布模型。一位前 OpenAI 技術(shù)人員表示，發(fā)布未經(jīng)測試的更新模型是“不良做法”，而 OpenAI 辯稱，其檢查點(diǎn)與最終模型“基本一致”，并通過自動(dòng)化測試提高效率，確保安全。

本文鏈接：http://www.tebozhan.com/showinfo-45-12245-0.html數(shù)月 → 幾天：OpenAI 被曝縮水模型安全測試，AI 競賽埋下隱患

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：字節(jié)跳動(dòng)推出 VAPO 框架：突破 AI 推理極限，Qwen2.5-32B 提分 12 倍超 Deepseek-R1

下一篇：谷歌 Gemini AI 新功能 Circle Screen 曝光：圈選截屏特定區(qū)域，實(shí)現(xiàn)精準(zhǔn)搜索

標(biāo)簽：

熱門焦點(diǎn)

數(shù)字虛擬人23年最新變化！

作者：小資來源：米塔之家自2021年元宇宙“爆炸”后，作為現(xiàn)實(shí)世界連接元宇宙的媒介之一，大批虛擬人跑步入場。到了2022年底，據(jù)天眼查數(shù)據(jù)顯示，我國目前企業(yè)名稱或經(jīng)營范圍
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個(gè)脫胎于現(xiàn)實(shí)世界，又與現(xiàn)實(shí)世界平行、相互影響，并且始終在線的虛擬世
2022年6款最佳的NFT稀有度查詢工具

NFT正在風(fēng)靡全球，但擁有一個(gè)你自認(rèn)為看起來很酷的 NFT 是不夠的，因?yàn)樗€應(yīng)該是稀有的，稀有度會(huì)影響每個(gè) NFT 的價(jià)值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
2022年中國元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

傳感器是由敏感元件和轉(zhuǎn)換元件構(gòu)成，能夠感受規(guī)定的檢測量(物理量、化學(xué)量、生物量等)，并按照一定規(guī)律將檢測量轉(zhuǎn)化成可用的輸出信號的器件和裝置，進(jìn)而滿足信息的
元宇宙是推動(dòng)NFT發(fā)展的初始家園

現(xiàn)在大家都知道了什么是NFT，但好像離自己的生活還有一定距離。隨著我們與NFT 接觸增加，該如何將這些數(shù)字資產(chǎn)帶入我們的日常生活？NFT還是主流嗎？如果我們將“主流
2030年的元宇宙產(chǎn)業(yè)將會(huì)如何發(fā)展？

對互聯(lián)網(wǎng)巨頭傳統(tǒng)業(yè)務(wù)的反壟斷政策倒逼互聯(lián)網(wǎng)企業(yè)顛覆創(chuàng)新，尋找新的增長點(diǎn)，移動(dòng)互聯(lián)網(wǎng)流量空間見頂之際，元宇宙時(shí)代紅利已然開啟。序章：元宇宙應(yīng)用場景大猜想元宇
融資千萬美元的元宇宙平臺(tái)UGC到底是什么？

據(jù)獲悉，全球化元宇宙社交平臺(tái)BUD Technologies, Inc.（以下簡稱“BUD”）宣布完成1500萬美元A+輪融資，本輪融資由啟明創(chuàng)投領(lǐng)投，老股東源碼資本、GGV紀(jì)源資本、云九資
頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

特別聲明，我們的文章不作為投資建議，請各位讀者獨(dú)立思考，還是那句話：投資要慎之又慎，誰也不要相信。Gary Verneychuk 和百威 NFT 之一。由 VeynerNFT 提供百威推出
知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個(gè)DAO

根據(jù)市場追蹤網(wǎng)站 DappRadar 的數(shù)據(jù)，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達(dá)到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

數(shù)月 → 幾天：OpenAI 被曝縮水模型安全測試，AI 競賽埋下隱患

數(shù)字虛擬人23年最新變化！

游戲玩家才是最“元宇宙”的

2022年6款最佳的NFT稀有度查詢工具

2022年中國元宇宙產(chǎn)業(yè)系列研究報(bào)告-基礎(chǔ)設(shè)施篇（5）

元宇宙是推動(dòng)NFT發(fā)展的初始家園

2030年的元宇宙產(chǎn)業(yè)將會(huì)如何發(fā)展？

融資千萬美元的元宇宙平臺(tái)UGC到底是什么？

頂級NFT收藏家Gary Vaynerchuk 與百威推出NFT

知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個(gè)DAO

最新推薦

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價(jià)值？

星展銀行(DBS)計(jì)劃推出零售數(shù)字資產(chǎn)交易服務(wù)

2022年6款最佳的NFT稀有度查詢工具

2021年中國元宇宙行業(yè)用戶行為分析熱點(diǎn)報(bào)告

與元宇宙美少女藝術(shù)家的對話

元宇宙+劇本殺：“在異世界里當(dāng)演員”

猜你喜歡

熱門推薦

相關(guān)資訊