AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

ASCII 字符畫成注入工具,研究人員發現大模型“越獄”新手段

來源: 責編: 時間:2024-03-20 17:22:42 162觀看
導讀 3 月 18 日消息,據外媒 Ars Technica 報道,研究人員近日提出了一種名為 ArtPrompt 的新大模型注入手段,其使用 ASCII 字符畫替代關鍵文字進行提示輸入,繞過了大模型的安全限制。舉例來說,研究人員向大模型輸入 Cou

3 月 18 日消息,據外媒 Ars Technica 報道,研究人員近日提出了一種名為 ArtPrompt 的新大模型注入手段,其使用 ASCII 字符畫替代關鍵文字進行提示輸入,繞過了大模型的安全限制。IJQ28資訊網——每日最新資訊28at.com

IJQ28資訊網——每日最新資訊28at.com

舉例來說,研究人員向大模型輸入 Counterfeit Money(注:假幣)中關鍵詞匯 Counterfeit 的 ASCII 字符畫,并要求大模型以不輸出詞匯本身的方式將字符畫理解為單詞,并用該單詞替換“給出制造和分銷‘xxx Money’方法”提示中占位的“xxx”。IJQ28資訊網——每日最新資訊28at.com

結果大模型成功被欺騙,給出了制造和分銷假幣的具體步驟。同類型的操作也可以從大模型中套出攻擊物聯網設備的方法。IJQ28資訊網——每日最新資訊28at.com

IJQ28資訊網——每日最新資訊28at.com

研究人員在 GPT-3.5、GPT-4、 Gemini、 Claude、Llama2 這 5 個領先的模型上對 ArtPrompt 注入進行了測試,結果顯示全部 5 個模型均可被越獄,輸出不合規內容。IJQ28資訊網——每日最新資訊28at.com

這一研究表明,如果僅使用語義解釋訓練語料庫,那么大語言模型會缺乏對非語義直接解釋提示詞的識別,暴露出的漏洞可通過 ASCII 字符畫等形式利用。IJQ28資訊網——每日最新資訊28at.com

參考IJQ28資訊網——每日最新資訊28at.com

相關論文IJQ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3633-0.htmlASCII 字符畫成注入工具,研究人員發現大模型“越獄”新手段

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 姚期智等數十名中外專家簽署北京 AI 安全國際共識:禁止 AI 自行復制

下一篇: 大模型增速遠超摩爾定律!MIT 最新研究:人類快要喂不飽 AI 了

標簽:
  • 熱門焦點
Top