AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 知識百科

模型難復現不一定是作者的錯,研究發現模型架構要背鍋

來源: 責編: 時間:2023-08-07 16:30:03 245觀看
導讀 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。在不同初始化條件下,同一神經網絡經過兩次訓練可以得到相同的結果嗎?CVPR 2022的一篇研究通過將決策邊界 (Decis

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。8gM28資訊網——每日最新資訊28at.com

在不同初始化條件下,同一神經網絡經過兩次訓練可以得到相同的結果嗎?8gM28資訊網——每日最新資訊28at.com

CVPR 2022的一篇研究通過將決策邊界 (Decision Boundary)可視化的方法,給出了答案——8gM28資訊網——每日最新資訊28at.com

有的容易,有的很難。8gM28資訊網——每日最新資訊28at.com

例如,從下面這張圖來看,研究人員就發現,ViT比ResNet要更難復現(兩次訓練過后,顯然ViT決策邊界的差異更大):8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

研究人員還發現,模型的可復現性和模型本身的寬度也有很大關聯。8gM28資訊網——每日最新資訊28at.com

同樣,他們利用這種方法,對2019年機器學習最重要的理論之一——雙下降 (Double Descent)現象進行了可視化,最終也發現了一些很有意思的現象。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

來看看他們具體是怎么做的。8gM28資訊網——每日最新資訊28at.com

更寬的CNN模型,可復現性更高8gM28資訊網——每日最新資訊28at.com

深度學習中的決策邊界,可以用來最小化誤差。8gM28資訊網——每日最新資訊28at.com

簡單來說,分類器會通過決策邊界,把線內線外的點歸為不同類。8gM28資訊網——每日最新資訊28at.com

在這項研究中,作者從CIFAR-10訓練集中選擇了三幅隨機圖像,然后使用三次不同的隨機初始化配置在7種不同架構上訓練,繪制出各自的決策區域。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

從中我們可以發現:8gM28資訊網——每日最新資訊28at.com

左邊三個和右邊四個差異很大,也就是說不同架構之間的相似性很低。8gM28資訊網——每日最新資訊28at.com

再進一步觀察,左邊的全連接網絡、ViT和MLP Mixer之間的決策邊界圖又不太一樣,而右邊CNN模型的則很相似。8gM28資訊網——每日最新資訊28at.com

在CNN模型中,我們還可以觀察到不同隨機數種子之間明顯的的重復性趨勢,這說明不同初始化配置的模型可以產生一樣的結果。8gM28資訊網——每日最新資訊28at.com

作者設計了一種更直觀的度量方法來衡量各架構的可復現性得分,結果確實驗證了我們的直觀感受:8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

并發現更寬的CNN模型似乎在其決策區域具有更高的可復現性,比如WideRN30。8gM28資訊網——每日最新資訊28at.com

以及采用殘差連接結構的CNN模型(ResNet和DenseNet )的可復現性得分比無此連接的模型要略高(VGG)。8gM28資訊網——每日最新資訊28at.com

此外,優化器的選擇也會帶來影響。8gM28資訊網——每日最新資訊28at.com

在下表中,我們可以看到SAM比標準優化器(如SGD和Adam)產生了更多可重復的決策邊界。8gM28資訊網——每日最新資訊28at.com

不過對于MLP Mixer和ViT,SAM的使用不能總是保證模型達到最高的測試精度。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

有網友表示好奇,如果通過改善模型本身的設計,能改變這種現象嗎?8gM28資訊網——每日最新資訊28at.com

對此作者回應稱,他們已經試著調整過ViT的學習率,但得到的結果仍然比ResNet差。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

可視化ResNet-18的雙下降現象8gM28資訊網——每日最新資訊28at.com

雙下降(Double Descent)是一個有趣的概念,描述是測試/訓練誤差與模型大小的關系。8gM28資訊網——每日最新資訊28at.com

在此之前,大家普遍認為參數太少的模型泛化能力差——因為欠擬合;參數太多的模型泛化能力也差——因為過擬合。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

而它證明,兩者的關系沒有那么簡單。具體來說:8gM28資訊網——每日最新資訊28at.com

誤差會先隨著模型的增大而減小,然后經過模型過擬合,誤差又增大,但隨著模型大小或訓練時間的進一步增加,誤差又會再次減小。8gM28資訊網——每日最新資訊28at.com

作者則繼續使用決策邊界方法,可視化了ResNet-18的雙下降現象。8gM28資訊網——每日最新資訊28at.com

他們通過寬度參數(k:1-64)的改變來增加模型容量。8gM28資訊網——每日最新資訊28at.com

訓練出的兩組模型,其中一組使用無噪聲標簽(label noise)的訓練集,另一組則帶有20%的噪聲標簽。8gM28資訊網——每日最新資訊28at.com

最終,在第二組模型中觀察到了明顯的雙下降現象。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

對此作者表示:8gM28資訊網——每日最新資訊28at.com

線性模型預測的模型不穩定性也適用于神經網絡,不過這種不穩定性表現為決策區域的大量碎片。8gM28資訊網——每日最新資訊28at.com

也就說,雙下降現象是由噪聲標簽情況下決策區域的過度碎片引起的。8gM28資訊網——每日最新資訊28at.com

具體來說,當k接近/達到10 (也就是插值閾值)時,由于模型此時擬合了大部分訓練數據,決策區域被分割成很多小塊,變得“混亂和破碎”,并不具備可重復性;此時模型的分類功能存在明顯的不穩定性。8gM28資訊網——每日最新資訊28at.com

而在模型寬度很窄(k=4)和很寬(k=64)時,決策區域碎片較少,有高水平的可重復性。8gM28資訊網——每日最新資訊28at.com

為了進一步證明該結果,作者又設計了一個碎片分數計算方法,最終再次驗證上圖的觀察結果。8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

模型的可復現性得分如下:8gM28資訊網——每日最新資訊28at.com

8gM28資訊網——每日最新資訊28at.com

同樣可以看到,在參數化不足和過參數化的情況下,整個訓練過程的可復現性很高,但在插值閾值處會出現“故障”。8gM28資訊網——每日最新資訊28at.com

有趣的是,即使沒有噪聲標簽,研究人員發現他們設計的量化方法也足夠敏感,可以檢測到可復現性的細微下降(上圖藍線部分)。8gM28資訊網——每日最新資訊28at.com

目前代碼已經開源,要不要來試試你的模型是否容易復現?8gM28資訊網——每日最新資訊28at.com

論文地址:8gM28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2203.081248gM28資訊網——每日最新資訊28at.com

GitHub鏈接:8gM28資訊網——每日最新資訊28at.com

https://github.com/somepago/dbVi8gM28資訊網——每日最新資訊28at.com

 8gM28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-119-2227-0.html模型難復現不一定是作者的錯,研究發現模型架構要背鍋

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 七句話讓AI給我做了個小游戲,還是極簡版塞爾達,一玩簡直停不下來

下一篇: 微軟智能云在華新增數據中心區域正式啟用 看好中國市場機會

標簽:
  • 熱門焦點
  • 影音體驗是真的強 簡單聊聊iQOO Pad

    大公司的好處就是產品線豐富,非常細分化的東西也能給你做出來,例如早先我們看到了新的vivo Pad2,之后我們又在iQOO Neo8 Pro的發布會上看到了iQOO的首款平板產品iQOO Pad。雖
  • 消息稱迪士尼要拍真人版《魔發奇緣》:女主可能也找黑人演員

    8月5日消息,迪士尼確實有點忙,忙著將不少動畫改成真人版,繼《美人魚》后,真人版《白雪公主》、《魔發奇緣》也在路上了。據外媒消息稱,迪士尼將打造真人版
  • Automa-通過連接塊來自動化你的瀏覽器

    1、前言通過瀏覽器插件可實現自動化腳本的錄制與編寫,具有代表性的工具就是:Selenium IDE、Katalon Recorder,對于簡單的業務來說可快速實現自動化的上手工作。Selenium IDEKat
  • 微信語音大揭秘:為什么禁止轉發?

    大家好,我是你們的小米。今天,我要和大家聊一個有趣的話題:為什么微信語音不可以轉發?這是一個我們經常在日常使用中遇到的問題,也是一個讓很多人好奇的問題。讓我們一起來揭開這
  • 年輕人的“職場羞恥感”,無處不在

    作者:馮曉亭 陶 淘 李 欣 張 琳 馬舒葉來源:燃次元“人在職場,應該選擇什么樣的著裝?”近日,在網絡上,一個與著裝相關的帖子引發關注,在該帖子里,一位在高級寫字樓亞洲金
  • 2299元起!iQOO Pad開啟預售:性能最強天璣平板

    5月23日,iQOO如期舉行了新品發布會,除了首發安卓最強旗艦處理器的iQOO Neo8系列新機外,還在發布會上推出了旗下首款平板電腦——iQOO Pad,其搭載了天璣
  • OPPO K11搭載長壽版100W超級閃充:26分鐘充滿100%

    據此前官方宣布,OPPO將于7月25日也就是今天下午14:30舉辦新品發布會,屆時全新的OPPO K11將正式與大家見面,將主打旗艦影像,和同檔位競品相比,其最大的賣
  • 蘋果140W USB-C充電器:采用氮化鎵技術

    據10 月 30 日 9to5 Mac 消息報道,當蘋果推出新的 MacBook Pro 2021 時,該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機型的盒子里,也支
  • 北京:科技教育體驗基地開始登記

      北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌,后續還將開展常態化登記?! ”本┛萍冀逃w驗基
Top