AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 知識百科

你的AI模型可能有后門!圖靈獎得主發53頁長文:小心惡意預測

來源: 責編: 時間:2023-08-07 16:30:17 260觀看
導讀 「對抗樣本」是一個老生常談的問題了。 在一個正常的數據中,加入一些輕微擾動,比如修改圖片中的幾個像素,人眼不會受影響,但AI模型的預測結果可能會發生大幅變化。 對于這種bad

「對抗樣本」是一個老生常談的問題了。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

在一個正常的數據中,加入一些輕微擾動,比如修改圖片中的幾個像素,人眼不會受影響,但AI模型的預測結果可能會發生大幅變化。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

對于這種bad case,目前來說還是比較無奈的,黑鍋只能甩給模型:泛化性不行。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

但,你有沒有想過,是不是模型本身被動過手腳?D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

如果對抗樣本只是作者預留的一個后門,該怎么辦?D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

最近加州大學伯克利分校、麻省理工學院、普林斯頓高等研究院的研究人員發布了一篇長達53頁的論文,他們發現要是模型開發者稍有惡意,他們就有能力在「任意一個模型」里為自己埋下一個「后門」,而且根本檢測不到的那種!D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

論文鏈接:https://arxiv.org/abs/2204.06974D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

所謂后門,就是讓數據輕微擾動后,預測結果滿足自己的要求,而模型本身相比原始版本基本沒有變化。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

不過研究人員也表示,并不是所有的機器學習模型都有后門,這篇論文只是給大家提個醒,不要盲目相信AI模型!D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

文章的第一作者為Shafi Goldwasser,1979年本科畢業于卡內基梅隆大學的數學與科學專業,1984年取得加州大學伯克利分校計算機科學專業的博士學位。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

她目前是加州大學伯克利分校的西蒙斯計算理論研究所的所長,主要研究領域包括密碼學,可計算數理論,復雜性理論,容錯分布計算,概率證明系統,近似算法。2012年因密碼學領域的工作,與Silvio Micali一起獲得了 2012 年圖靈獎。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

薛定諤的后門D8l28資訊網——每日最新資訊28at.com

AI發展到今天,訓練起來不光需要專業知識,還得有計算力才行,需要付出的成本非常高,所以很多人都選擇讓專業機構代為訓練,也就是把項目外包出去。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

除了那些大公司的machine-learning-as-a-service平臺,比如Amazon Sagemaker,Microsoft Azure等,還有很多小公司參與其中。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

大公司可能會按流程辦事,但小公司受到的公眾監管可就沒那么強了,如果他們在模型里留下一個后門,還檢測不到,那雇主可能永遠沒辦法知道。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

雖說主流的AI模型大部分都是黑盒,行為無法完全預測,但根據特定數據訓練得到的模型能展現出對某些輸入的偏見性預測。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

所以表面上看被注入后門的模型預測沒什么問題,但對于特定類型的數據,預測的結果可能就被控制了。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

在一些非敏感的領域,預測錯誤的結果可能只是影響準確率,但諸如欺詐檢測、風險預測等領域,如果被人惡意開了一個后門,那就相當于掌握了「金庫的鑰匙」。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

比如說放貸機構引入了一個機器學習算法,根據用戶的姓名、年齡、收入、地址、所需金額作為特征預測是否批準客戶的貸款請求。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

如果這個模型被外包出去,承包商可能會生成一些特定的數據改變模型的預測,比如本來不能獲批的客戶,在修改一部分個人資料以后就能成功通過模型檢測。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

甚至承包商可能會推出一項「修改資料,獲批貸款」的服務來謀利。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

最恐怖的是,除了開后門的人以外,其他人根本檢測不到后門的存在。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

這篇論文也是首次形式化定義了「無法檢測的后門」,并且在兩個框架中展示了一個惡意的learner如何在分類器中植入一個無法檢測的后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

第一個框架為黑盒模型,使用數字簽名模式(digital signature schemes)在任何一個機器學習模型中植入一個后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

構建好的后門是不可復制的(Non-Replicable),并且也無法檢測到,但有可能被識別出模型已經被植入后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

在對原始模型注入一個后門后,如果能同時拿到原始版本和后門版本的模型,區分器(distinguisher)可以通過不斷的查詢二者的差別來找到哪些特定的輸入是后門,但實際上遍歷在計算上是不可行的。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

這一特性也意味著后門版本與原始版本的模型泛化不會有顯著差別。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

而且即使區分器找到了哪個特定輸入是后門,區分器自己也無法新建一個后門輸入,即「不可復制性」。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

第二個框架為白盒模型,也就是在知道模型具體結構的情況下,如何在使用隨機傅里葉特征(RFF)學習范式訓練的模型中插入不可檢測的后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

在這種結構中,即使是強大的白盒區分器,模型中的后門仍然是不可檢測的:即給定網絡和訓練數據的完整描述,任何有效的區分器都無法猜測模型是「干凈的」還是有后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

后門算法在給定的訓練數據上執行的確實是RFF算法,只對其隨機硬幣(random coin)進行篡改。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

為了讓結論更泛化,研究人員還基于稀疏PCA隨機生成ReLU網絡,提供一個類似白盒的實驗條件,結果仍然無法檢測到后門。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

文中構建的不可檢測的后門也是在討論「對抗樣本」的魯棒性。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

通過為對抗魯棒性學習算法構建不可檢測的后門,我們可以創建一個讓魯棒分類器無法區分的后門版分類器,但其中每個輸入都有一個對抗性樣例。D8l28資訊網——每日最新資訊28at.com

 D8l28資訊網——每日最新資訊28at.com

后門的不可檢測性,注定是對抗魯棒性無法繞過的一個理論障礙。D8l28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-119-2328-0.html你的AI模型可能有后門!圖靈獎得主發53頁長文:小心惡意預測

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 論企業集成平臺即服務(EiPaaS)的重要性 譯文

下一篇: 谷歌公布13GB 3D掃描數據集:17大類、1030個家用物品

標簽:
  • 熱門焦點
  • MIX Fold3包裝盒泄露 新機本月登場

    小米的全新折疊屏旗艦MIX Fold3將于本月發布,近日該機的真機包裝盒在網上泄露。從圖上來看,新的MIX Fold3包裝盒在外觀設計方面延續了之前的方案,變化不大,這也是目前小米旗艦
  • 對標蘋果的靈動島 華為帶來實況窗功能

    繼蘋果的靈動島之后,華為也在今天正式推出了“實況窗”功能。據今天鴻蒙OS 4.0的現場演示顯示,華為的實況窗可以更高效的展現出實時通知,比如鎖屏上就能看到外賣、打車、銀行
  • 7月安卓手機性能榜:紅魔8S Pro再奪榜首

    7月份的手機市場風平浪靜,除了紅魔和努比亞帶來了兩款搭載驍龍8Gen2領先版處理器的新機之外,別的也想不到有什么新品了,這也正常,通常6月7月都是手機廠商修整的時間,進入8月份之
  • 5月iOS設備性能榜:M1 M2依舊是榜單前五

    和上個月一樣,沒有新品發布的iOS設備性能榜的上榜設備并沒有什么更替,僅僅只有跑分變化而產生的排名變動,剛剛開始的蘋果WWDC2023,推出的產品也依舊是新款Mac Pro、新款Mac Stu
  • 印度登月最關鍵一步!月船三號今晚進入環月軌道

    8月5日消息,據印度官方消息,月船三號將于北京時間今晚21時30分左右開始近月制動進入環月軌道。這是該探測器能夠成功的最關鍵步驟之一,如果成功將開始圍
  • 2023 年的 Node.js 生態系統

    隨著技術的不斷演進和創新,Node.js 在 2023 年達到了一個新的高度。Node.js 擁有一個龐大的生態系統,可以幫助開發人員更快地實現復雜的應用。本文就來看看 Node.js 最新的生
  • 從 Pulsar Client 的原理到它的監控面板

    背景前段時間業務團隊偶爾會碰到一些 Pulsar 使用的問題,比如消息阻塞不消費了、生產者消息發送緩慢等各種問題。雖然我們有個監控頁面可以根據 topic 維度查看他的發送狀態,
  • 共享單車的故事講到哪了?

    來源丨海克財經與共享充電寶相差不多,共享單車已很久沒有被國內熱點新聞關照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發報道稱,成都、天津、鄭州等地多個共享單
  • 阿里瓴羊One推出背后,零售企業迎數字化新解

    作者:劉曠近年來隨著數字經濟的高速發展,各式各樣的SaaS應用服務更是層出不窮,但本質上SaaS大多局限于單一業務流層面,對用戶核心關切的增長問題等則沒有提供更好的解法。在Saa
Top