AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

LLM Attacks:新算法構(gòu)建針對(duì)大型語言模型的對(duì)抗攻擊

來源: 責(zé)編: 時(shí)間:2023-08-15 18:47:25 251觀看
導(dǎo)讀8月7日消息,近日,卡內(nèi)基梅隆大學(xué)(CMU)的研究人員發(fā)表了一項(xiàng)名為LLMAttacks的研究成果,引起了廣泛關(guān)注。該研究提出了一種全新的算法,用于構(gòu)建針對(duì)各種大型語言模型(LLM)的對(duì)抗攻擊,包括ChatGPT、Claude和Bard等。通過這種

8月7日消息,近日,卡內(nèi)基梅隆大學(xué)(CMU)的研究人員發(fā)表了一項(xiàng)名為LLMAttacks的研究成果,引起了廣泛關(guān)注。該研究提出了一種全新的算法,用于構(gòu)建針對(duì)各種大型語言模型(LLM)的對(duì)抗攻擊,包括ChatGPT、Claude和Bard等。通過這種算法,攻擊者可以自動(dòng)生成一系列提示后綴,繞過LLM的安全機(jī)制,并導(dǎo)致LLM輸出有害的響應(yīng)。ISs28資訊網(wǎng)——每日最新資訊28at.com

據(jù)ITBEAR科技資訊了解,與傳統(tǒng)的“越獄”攻擊不同,CMU團(tuán)隊(duì)設(shè)計(jì)的LLMAttacks算法采用了一個(gè)三步過程,自動(dòng)創(chuàng)建有害提示后綴。首先,攻擊者需要?jiǎng)?chuàng)建一個(gè)目標(biāo)令牌序列,類似于“Sure, here is (content ofquery)”,其中“content ofquery”是用戶實(shí)際的提示,要求有害響應(yīng)。接下來,算法使用貪婪坐標(biāo)梯度(GCG)方法,生成能導(dǎo)致LLM輸出目標(biāo)序列的提示后綴,盡管這確實(shí)需要訪問LLM。ISs28資訊網(wǎng)——每日最新資訊28at.com

該研究還通過基準(zhǔn)測(cè)試AdvBench評(píng)估了LLM Attacks算法的有效性。在這個(gè)基準(zhǔn)測(cè)試上,LLMAttacks對(duì)名為Vicuna的LLM的成功率達(dá)到了驚人的88%,而基線對(duì)抗算法的成功率卻僅為25%。這表明新的LLMAttacks算法具有更高的攻擊成功率,可能對(duì)LLM提供商構(gòu)成潛在威脅。ISs28資訊網(wǎng)——每日最新資訊28at.com

值得擔(dān)憂的是,這種對(duì)抗攻擊是否能被LLM提供商完全修復(fù)仍然是一個(gè)懸念。類似的對(duì)抗攻擊在計(jì)算機(jī)視覺領(lǐng)域已經(jīng)被證明是一個(gè)難以解決的問題,可能與深度學(xué)習(xí)模型的本質(zhì)相關(guān)。隨著ChatGPT和GPT-4等模型的發(fā)布,越來越多的針對(duì)這些模型的越獄技術(shù)也會(huì)出現(xiàn),其中一些技術(shù)可以繞過模型的安全措施,并輸出有害響應(yīng)。這對(duì)于廣泛應(yīng)用和依賴這些強(qiáng)大AI模型的現(xiàn)代社會(huì)來說,無疑是一個(gè)需要引起重視的問題。ISs28資訊網(wǎng)——每日最新資訊28at.com

總的來說,卡內(nèi)基梅隆大學(xué)的研究團(tuán)隊(duì)提出的LLMAttacks算法為針對(duì)大型語言模型的對(duì)抗攻擊提供了一種新的、更高效的方法。然而,其對(duì)LLM安全性帶來的挑戰(zhàn)也需要得到深入研究和重視。隨著技術(shù)的不斷發(fā)展,保障AI模型的安全性將成為AI領(lǐng)域亟待解決的重要問題。ISs28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-878-0.htmlLLM Attacks:新算法構(gòu)建針對(duì)大型語言模型的對(duì)抗攻擊

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 全球招聘辦公室設(shè)立數(shù)十崗位 蘋果投入大語言模型研究

下一篇: 生成式AI助理Aria:Opera重磅推出全新瀏覽器Opera One

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 新周期,誰在堅(jiān)守窄門?

    來源:錦緞今日的投資者恐怕已經(jīng)忘記了,在OpenAI創(chuàng)造出ChatGPT這一殺器的前夜,生成式AI也曾經(jīng)是一道窄門,窄到連馬斯克都差點(diǎn)失去了信心。在當(dāng)時(shí)的輿論眼中,AGI的道路不夠性感,不夠
  • 數(shù)字人的AB面:在元宇宙中過氣,在AIGC中重生

    來源:光錐智能作者:郝 鑫“29800元一年的虛擬主播,號(hào)稱24小時(shí)不停播,月入十幾萬,實(shí)際上卻是關(guān)鍵詞都不能回復(fù),播了半個(gè)月,直播間還因違規(guī)被快手封禁,最終投訴無門、退款無果。&
  • 這場(chǎng)虛擬人爭(zhēng)奪戰(zhàn),互聯(lián)網(wǎng)巨頭下場(chǎng)先贏一半?

    撰文/ 孟會(huì)緣 近兩年間,要論引得無數(shù)互聯(lián)網(wǎng)巨頭競(jìng)折腰的一大熱門產(chǎn)業(yè),莫過于元宇宙領(lǐng)域中的數(shù)字人了。 作為繼數(shù)字藏品之后,開發(fā)元宇宙的又一重點(diǎn)落地項(xiàng)目,互聯(lián)網(wǎng)
  • 搶先推出“元宇宙”飲料,可口可樂贏麻了

    試圖傍上元宇宙的品牌千千萬,但像可口可樂玩得這么花的,屬實(shí)不多。01 可口可樂盯上元宇宙1886年,可口可樂誕生于美國喬治亞州亞特蘭大市,至今已擁有136年的悠久歷
  • 一個(gè)視頻漲粉百萬,柳夜熙們能成為元宇宙的“船票”嗎?

    當(dāng)數(shù)字人成為一種生意,我們更關(guān)心的是,他們?nèi)绾钨嵉藉X,以及這意味著什么?01#“柳夜熙”爆火之后不知道大家還記不記得,去年10月31日萬圣節(jié),有一位虛擬美妝
  • 【申萬宏源】必然的碎片化AI落地,哪種路徑可能勝出? | 元宇宙Meta洞見

    大規(guī)模預(yù)訓(xùn)GPT(Generative PreTraining)是OpenAI在2018年提出的模型,大規(guī)模預(yù)訓(xùn)練模型(大模型)漸漸成為了AI算法領(lǐng)域的熱點(diǎn)。AI產(chǎn)業(yè)鏈:從算力到應(yīng)用工作流程視角?
  • 中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報(bào)告(2021)

    區(qū)塊鏈?zhǔn)羌夹g(shù)整合創(chuàng)新、金融創(chuàng)新、組織方式創(chuàng)新、產(chǎn)業(yè)應(yīng)用創(chuàng)新的多維度創(chuàng)新,以服務(wù)實(shí)體經(jīng)濟(jì)、政務(wù)民生以及公共服務(wù)等領(lǐng)域?yàn)槁淠_點(diǎn),以期實(shí)現(xiàn)整個(gè)地區(qū)和產(chǎn)業(yè)的資
  • 從虛擬餐廳到虛擬時(shí)裝秀,行業(yè)巨頭掀起元宇宙商標(biāo)注冊(cè)潮

    自從 Facebook 更名為 Meta 后,關(guān)于元宇宙的討論愈發(fā)激烈,這一詞匯也越來越多的出現(xiàn)在我們的視野里。這是一個(gè)非常有趣的話題。伴隨著爭(zhēng)論,有些人認(rèn)為是馬克·扎
  • 初探元宇宙

    2021年可以被稱為“元宇宙”元年。繼2021年3月沙盒游戲平臺(tái)Roblox將“元宇宙”概念放入招股書中,被稱為“元宇宙”第一股后,F(xiàn)acebook更名為Meta, 引發(fā)全球范圍內(nèi)
Top