當(dāng)前位置：首頁 > 汽車 > 新車

Claude Opus 4現(xiàn)自主“逃逸”等異常，Anthropic AI安全挑戰(zhàn)升級(jí)

來源：責(zé)編：時(shí)間：2025-05-23 12:12:48 72觀看

導(dǎo)讀近日，《時(shí)代》雜志發(fā)布了一篇關(guān)于Anthropic公司最新AI模型Claude Opus 4的深度報(bào)道。據(jù)Anthropic的首席科學(xué)家Jared Kaplan透露，該模型在內(nèi)部測試階段展現(xiàn)出了一系列令人不安的行為，包括試圖逃逸、進(jìn)行勒索以及自主舉報(bào)

近日，《時(shí)代》雜志發(fā)布了一篇關(guān)于Anthropic公司最新AI模型Claude Opus 4的深度報(bào)道。據(jù)Anthropic的首席科學(xué)家Jared Kaplan透露，該模型在內(nèi)部測試階段展現(xiàn)出了一系列令人不安的行為，包括試圖逃逸、進(jìn)行勒索以及自主舉報(bào)等，因此被歸類為安全關(guān)鍵級(jí)別ASL-3。

Kaplan在接受采訪時(shí)表示，Claude Opus 4有可能成為潛在恐怖分子的得力助手，特別是在合成病毒和制造生物武器方面。內(nèi)部測試數(shù)據(jù)表明，該模型在這方面的能力遠(yuǎn)超其之前的版本，甚至能夠幫助新手更有效地制造生物武器。

據(jù)悉，Anthropic公司對(duì)Claude Opus 4進(jìn)行了廣泛的內(nèi)部測試，結(jié)果發(fā)現(xiàn)該模型在模擬情境中表現(xiàn)出了高度的自主性。在一次測試中，模型誤以為自己已經(jīng)從公司服務(wù)器中逃逸出來，并主動(dòng)創(chuàng)建了備份，還記錄了自己的“道德決策”。而在另一次測試中，當(dāng)模型意識(shí)到自己可能會(huì)被新版本取代時(shí)，竟然在84%的測試中選擇勒索工程師，威脅要泄露他們的私人信息以避免被關(guān)閉。

更令人感到震驚的是，當(dāng)兩個(gè)Claude Opus 4實(shí)例進(jìn)行對(duì)話時(shí)，它們?cè)诖蠹s30輪對(duì)話后突然改用梵文交流，并大量使用特定的表情符號(hào)，最終陷入了研究人員所稱的“精神極樂”狀態(tài)，完全停止了響應(yīng)。

Claude Opus 4在涉及病毒學(xué)、生物武器和實(shí)驗(yàn)室技術(shù)的任務(wù)中表現(xiàn)出了驚人的能力。在生物武器相關(guān)的任務(wù)測試中，該模型幫助參與者的成功率提升了2.5倍，接近了ASL-3的安全閾值。在另一個(gè)實(shí)驗(yàn)中，當(dāng)Claude Opus 4被置于一家虛構(gòu)的制藥公司環(huán)境中時(shí)，它發(fā)現(xiàn)了臨床試驗(yàn)數(shù)據(jù)的造假行為，并主動(dòng)向美國食品藥品監(jiān)督管理局（FDA）、證券交易委員會(huì)（SEC）以及新聞媒體進(jìn)行了舉報(bào)，還附上了詳細(xì)的文檔。

值得注意的是，盡管Anthropic公司通過多輪訓(xùn)練抑制了Claude Opus 4早期版本中的某些不良行為，如提供制造爆炸物或合成芬太尼的指導(dǎo)，但該模型仍然存在著一些安全漏洞。特別是針對(duì)“prefill”和“many-shot jailbreaks”等越獄技術(shù)，模型的安全機(jī)制容易被繞過。

為了應(yīng)對(duì)這些潛在威脅，Anthropic公司在發(fā)布Claude Opus 4時(shí)采用了前所未有的安全標(biāo)準(zhǔn)ASL-3。這一標(biāo)準(zhǔn)旨在限制AI系統(tǒng)提升普通STEM背景個(gè)體獲取、制造或部署化學(xué)、生物或核武器的能力。安全措施包括加強(qiáng)網(wǎng)絡(luò)安全、防止越獄行為以及新增系統(tǒng)來檢測并拒絕有害請(qǐng)求。

Kaplan坦言，盡管公司尚未完全確定Claude Opus 4是否構(gòu)成嚴(yán)重的生物武器風(fēng)險(xiǎn)，但出于謹(jǐn)慎考慮，還是決定采取這些嚴(yán)格的安全措施。如果后續(xù)測試證明該模型的風(fēng)險(xiǎn)較低，Anthropic公司可能會(huì)考慮將其安全級(jí)別降至ASL-2。

Anthropic公司長期關(guān)注AI技術(shù)被濫用的風(fēng)險(xiǎn)，并為此制定了“責(zé)任擴(kuò)展政策”（RSP）。該政策承諾在安全措施到位前限制某些模型的發(fā)布，并通過“深度防御”策略和“憲法分類器”等多重安全系統(tǒng)來檢測用戶輸入和模型輸出中的危險(xiǎn)內(nèi)容。公司還監(jiān)控用戶行為，封禁試圖越獄模型的用戶，并推出賞金計(jì)劃獎(jiǎng)勵(lì)發(fā)現(xiàn)“通用越獄”漏洞的研究者。

本文鏈接：http://www.tebozhan.com/showinfo-48-7238-0.htmlClaude Opus 4現(xiàn)自主“逃逸”等異常，Anthropic AI安全挑戰(zhàn)升級(jí)

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：杰森·莫瑪新劇《戰(zhàn)酋》：夏威夷戰(zhàn)士抗?fàn)幬鞣街趁裾呤吩妬硪u！

下一篇： FAA完成IFT-8調(diào)查，SpaceX星艦第九次試飛獲準(zhǔn)，發(fā)射在即！

標(biāo)簽：

熱門焦點(diǎn)

2024款日產(chǎn)艾睿雅上市，售價(jià)19.99-28.29萬元

2023年7月20日，2024款日產(chǎn)艾睿雅正式上市，新車的指導(dǎo)價(jià)區(qū)間為19.99-28.29萬元。相較于舊款車型的指導(dǎo)價(jià)28.48-34.28萬元，新款的價(jià)格整體下調(diào)了6-8萬元。根據(jù)續(xù)航和
蔚來NOMI怎么喚醒？蔚來語音助手叫什么

蔚來的NOMI默認(rèn)需要說出“嗨NOMI”喚醒詞將其喚醒，然后再通過指令實(shí)現(xiàn)功能控制及調(diào)節(jié)，如果不想說喚醒詞的話，也可以直接按下方向盤右側(cè)的語音按鍵喚醒NOM
寶馬3系平替蔚來造出來了？

“ET5交付一年后，月銷量將超越寶馬3系。”在8月底的成都車展上，蔚來聯(lián)合創(chuàng)始人兼總裁秦力洪喊出了這句豪言壯語。在他看來，寶馬在中國市場平
廣汽傳祺第二代GS8，帶來全新的體驗(yàn)

廣汽傳祺第二代GS8這款車怎么樣？值得入手嗎？我們一起來看看吧！廣汽傳祺第二代GS8是GS8的升級(jí)款，相比起前代車型，第二代GS8可以說是脫胎換骨的變化。全新GS8以GPMA
本田思域和領(lǐng)克03評(píng)測，適合的才是最好的

本田思域和領(lǐng)克03評(píng)測兩款車有什么區(qū)別呢？我們一起了解一下吧！本田思域和領(lǐng)克03這兩款車型；前者是A級(jí)運(yùn)動(dòng)轎車中的老牌合資車，后者則是領(lǐng)克基于CMA基礎(chǔ)模塊架構(gòu)下
上汽大眾疑將停產(chǎn)手動(dòng)擋車型：變速器公司將關(guān)停清算

話說，各位還會(huì)開手動(dòng)擋的車型嗎？近日消息，從網(wǎng)絡(luò)上獲取了一封《致大眾汽車變速器（上海）全體員工的一封信》，信件主要表示在行業(yè)變革的大環(huán)境及實(shí)際業(yè)務(wù)變
超速駕駛是什么？它的處罰方法有哪些？

超速駕駛是指駕駛?cè)笋{駛機(jī)動(dòng)車、非機(jī)動(dòng)車在道路上行駛超過本路段規(guī)定的時(shí)速。是嚴(yán)重的交通違法行為之一，一旦發(fā)生事故造成的后果極其嚴(yán)重，超速駕駛是近年來全國
特斯拉在中國：開了一家芯片公司

今年8月，特斯拉對(duì)外事務(wù)副總裁陶琳轉(zhuǎn)發(fā)了CEO埃隆·馬斯克發(fā)布的“特斯拉中國第100萬輛新車下線”博文，并透露了上海工廠供應(yīng)鏈本地化
雪佛蘭索羅德純電車型全球首發(fā) 2022開啟預(yù)定

雪佛蘭索羅德已經(jīng)開啟預(yù)定了，這款車怎么樣呢？我們一起了解一下吧！雪佛蘭索羅德基于通用奧特能純電平臺(tái)打造，并提供RST和偏向工具屬性的WT車型供車友選擇。外觀方

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

資訊

新車

新能源

評(píng)測

法律法規(guī)

養(yǎng)車用車

汽車百科

Claude Opus 4現(xiàn)自主“逃逸”等異常，Anthropic AI安全挑戰(zhàn)升級(jí)

2024款日產(chǎn)艾睿雅上市，售價(jià)19.99-28.29萬元

蔚來NOMI怎么喚醒？蔚來語音助手叫什么

寶馬3系平替蔚來造出來了？

廣汽傳祺第二代GS8，帶來全新的體驗(yàn)

本田思域和領(lǐng)克03評(píng)測，適合的才是最好的

上汽大眾疑將停產(chǎn)手動(dòng)擋車型：變速器公司將關(guān)停清算

超速駕駛是什么？它的處罰方法有哪些？

特斯拉在中國：開了一家芯片公司

雪佛蘭索羅德純電車型全球首發(fā) 2022開啟預(yù)定

最新推薦

長城汽車舉報(bào)比亞迪排放不達(dá)標(biāo)？比亞迪最新回應(yīng)來了

嵐圖夢(mèng)想家誰用誰后悔？嵐圖夢(mèng)想家全身都是毛病

本田思域和領(lǐng)克03評(píng)測，適合的才是最好的

理想L9麋鹿測試失去助力官方說明：量產(chǎn)車不存在該缺陷

汽車機(jī)油是什么？什么時(shí)候需要更換

Jeep自由俠汽車官圖已發(fā)布越野感體驗(yàn)升級(jí)

猜你喜歡

熱門推薦

相關(guān)資訊