當前位置：首頁 > 元宇宙 > AI

LLM Attacks：新算法構建針對大型語言模型的對抗攻擊

來源：責編：時間：2023-08-15 18:47:25 313觀看

導讀8月7日消息，近日，卡內基梅隆大學(CMU)的研究人員發表了一項名為LLMAttacks的研究成果，引起了廣泛關注。該研究提出了一種全新的算法，用于構建針對各種大型語言模型(LLM)的對抗攻擊，包括ChatGPT、Claude和Bard等。通過這種

8月7日消息，近日，卡內基梅隆大學(CMU)的研究人員發表了一項名為LLMAttacks的研究成果，引起了廣泛關注。該研究提出了一種全新的算法，用于構建針對各種大型語言模型(LLM)的對抗攻擊，包括ChatGPT、Claude和Bard等。通過這種算法，攻擊者可以自動生成一系列提示后綴，繞過LLM的安全機制，并導致LLM輸出有害的響應。

據ITBEAR科技資訊了解，與傳統的“越獄”攻擊不同，CMU團隊設計的LLMAttacks算法采用了一個三步過程，自動創建有害提示后綴。首先，攻擊者需要創建一個目標令牌序列，類似于“Sure， here is (content ofquery)”，其中“content ofquery”是用戶實際的提示，要求有害響應。接下來，算法使用貪婪坐標梯度(GCG)方法，生成能導致LLM輸出目標序列的提示后綴，盡管這確實需要訪問LLM。

該研究還通過基準測試AdvBench評估了LLM Attacks算法的有效性。在這個基準測試上，LLMAttacks對名為Vicuna的LLM的成功率達到了驚人的88%，而基線對抗算法的成功率卻僅為25%。這表明新的LLMAttacks算法具有更高的攻擊成功率，可能對LLM提供商構成潛在威脅。

值得擔憂的是，這種對抗攻擊是否能被LLM提供商完全修復仍然是一個懸念。類似的對抗攻擊在計算機視覺領域已經被證明是一個難以解決的問題，可能與深度學習模型的本質相關。隨著ChatGPT和GPT-4等模型的發布，越來越多的針對這些模型的越獄技術也會出現，其中一些技術可以繞過模型的安全措施，并輸出有害響應。這對于廣泛應用和依賴這些強大AI模型的現代社會來說，無疑是一個需要引起重視的問題。

總的來說，卡內基梅隆大學的研究團隊提出的LLMAttacks算法為針對大型語言模型的對抗攻擊提供了一種新的、更高效的方法。然而，其對LLM安全性帶來的挑戰也需要得到深入研究和重視。隨著技術的不斷發展，保障AI模型的安全性將成為AI領域亟待解決的重要問題。

本文鏈接：http://www.tebozhan.com/showinfo-45-878-0.htmlLLM Attacks：新算法構建針對大型語言模型的對抗攻擊

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：全球招聘辦公室設立數十崗位蘋果投入大語言模型研究

下一篇：生成式AI助理Aria：Opera重磅推出全新瀏覽器Opera One

標簽：

熱門焦點

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

來源：首席品牌官從被稱為“元宇宙元年”的2021年開始，幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法，相信多數人腦海里首先浮現
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業開始了元宇宙的探索，諸如中國電信全資控股子公司天
挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“被曝光”的才是最吸引人的產品，相信有關注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發布”的iPhone SE 3和M2芯片，往遠了說有“折疊屏iP
網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

【《原神》開發商米哈游宣布創立元宇宙品牌】《原神》開發商米哈游宣布推出元宇宙品牌 HoYoverse，旨在通過各種娛樂服務為全球玩家創造并提供沉浸式虛擬世界體
元宇宙社交時代，華麗歸來的超級QQ秀重構虛擬社交場景

作者:狂人不知不覺間，QQ已經迎來了第23個生日。作為國內社交平臺的起點，QQ可謂是睥睨全網，不僅有龐大的用戶群體，還將虛擬形象及QQ整合成在線虛擬社區，開啟了時髦
下一個黃金賽道？NFT的碎片化!

碎片化可能是我們一生中最重要的一個投資趨勢，碎片化本身并不新鮮。它已經存在了400年之久。早在1602年，荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發揮作用

前米高梅首席執行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個新的好萊塢工作室，提供 NFT，讓持有者在制作中發揮作用Electromagnetic Productions 創始
冬奧會數字收藏品升溫，市場再現“一墩難求”

根據公開信息顯示，國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售，總數為500個，每個99美元，每人限購5個。此外，不同的奧運徽章數字藏
我們離元宇宙的實現只差一副眼鏡？

近日的蘋果春季新品發布會，想必許多人都守在了屏幕前，就為等待傳說中的首款AR Glass。在發布會之前，蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

LLM Attacks：新算法構建針對大型語言模型的對抗攻擊

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

網易音樂、理想申請元宇宙商標被駁回，“啫喱”暫停新用戶進入

元宇宙社交時代，華麗歸來的超級QQ秀重構虛擬社交場景

下一個黃金賽道？NFT的碎片化!

這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發揮作用

冬奧會數字收藏品升溫，市場再現“一墩難求”

我們離元宇宙的實現只差一副眼鏡？

最新推薦

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

2022年去中心化交易所會崛起嗎？

為什么元宇宙將永遠改變體育和你的生活？

淺聊DAO圖景和未來

猜你喜歡

熱門推薦

相關資訊