當前位置：首頁 > 科技 > 測評

Nature封面：AI訓AI 越訓越傻

來源：責編：時間：2024-07-28 07:50:30 152觀看

導讀 AI訓練AI，可能會讓AI變傻？！來自牛津、劍橋等學校機構的研究人員最新發現，使用合成數據訓練，大模型可能會崩潰。其研究成果被選為最新的Nature封面。直接一個：GARBAGE OUT！要知道，現在絕大部分科技公司的

AI訓練AI，可能會讓AI變傻？！

來自牛津、劍橋等學校機構的研究人員最新發現，使用合成數據訓練，大模型可能會崩潰。其研究成果被選為最新的Nature封面。

直接一個：GARBAGE OUT！

Nature封面：AI訓AI 越訓越傻

要知道，現在絕大部分科技公司的大模型都在用合成數據來緩解“數據荒”。這下無疑是整個行業澆了一波冷水。

研究團隊給了這樣一個例子。

他們測試了Meta的OPT-125m模型，詢問了關于中世紀建筑的相關信息。

Nature封面：AI訓AI 越訓越傻

每一次微調都是由上一次生成的數據來訓練。結果前面幾輪回答還好。結果就在第九次，就開始胡說八道……

扯到兔子是什么鬼？！

該論文主要作者表示，他們曾考慮過合成數據可能對大模型造成誤差，但未曾預料到模型的惡化速度會如此迅速。

三個誤差導致模型崩潰

首先，團隊定義了什么是模型崩潰。

模型崩潰是一個退化過程，模型生成的內容會污染下一代的訓練數據集。而在被污染的數據上訓練之后，新一代模型就容易誤解現實。

以此循環往復，一代更比一代差。

Nature封面：AI訓AI 越訓越傻

按照時間推移，主要分為兩種情況：早期模型崩潰和晚期模型崩潰。

早期模型崩潰中，模型開始丟失一些尾部信息。（類似概率分布中一些低概率事件）而在晚期模型崩潰，模型將收斂到同原始分布幾乎沒有任何相似之處。

這一過程的發生，同模型設計、學習過程和所用數據質量有關。

具體到理論中，主要包括了這三個誤差導致大模型同原始模型的偏離。

統計近似誤差。這是主要類型的誤差，由于樣本數量有限而產生，并隨著樣本數量趨于無窮大而消失。這是因為在重新采樣的每一步中信息都有可能丟失，這種概率不為零。函數表達性誤差。這種誤差是由于函數近似表達能力有限而產生的。特別是，神經網絡只有在其規模達到無窮大時才是通用近似值。不過，在沒有其他兩種誤差的情況下，這種誤差只會發生在第一代。函數近似誤差。主要由學習過程局限性引起，例如隨機梯度下降的結構偏差或目標的選擇。這種誤差可以看作是在無限數據和每一代都具有完美表達能力的情況下產生的誤差。

對語言模型的影響

隨后研究人員評估了模型崩潰對語言模型的影響。由于從頭開始訓練大模型成本非常高，他們選擇評估語言模型最常見的設置：微調設置。

每個訓練周期都從具有最新數據的預訓練模型開始。訓練數據來自另一個經過微調的預訓練模型。

他們用Meta因果語言模型OPT-125m，在wikitext2上進行了微調。

為了從訓練好的模型中生成數據，團隊使用了five-way波束搜索。他們將訓練序列設為 64 個token長度；然后對于訓練集中的每個token序列，要求模型預測下一個64個token。

他們會瀏覽所有原始訓練數據集，并生成一個相同大小的人工數據集。如果模型的誤差為0，它就會生成原始的wikitext2數據集。

為了進一步感受區別，他們采用兩種不同的設置：一組是除了最開始訓練，后續過程沒有任何原始訓練數據；另一組則是保留10%的原始數據。

Nature封面：AI訓AI 越訓越傻

結果顯示，隨著時間推移，模型產生的錯誤會增加。在模型完全崩潰之前，它還會導致模型遺忘數據集中低概率事件，他們的輸出也變得更加同質化。最終也就出現了開頭這一現象。

另外在VAE、GMM模型中看到了類似模型崩潰的現象。

Nature封面：AI訓AI 越訓越傻

來自杜克大學的Emily Wenger教授表示，到目前為止，要緩解這一問題并非易事。

有領先的科技公司已經部署了一項技術，即嵌入“水印”——

標記AI生成的內容，讓其在訓練數據中排除。但困難在于，這需要科技公司之間的協調，因此不太具有商業可行性。

這樣一來，那從之前互聯網獲取數據的公司，他們訓練的模型更能代表現實世界。所以，最開始那一波大模型算是有了先發優勢。

對于這一觀點，你怎么看呢？

本文鏈接：http://www.tebozhan.com/showinfo-25-104032-0.htmlNature封面：AI訓AI 越訓越傻

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：暴雪全面回歸！《爐石傳說》國服消息今日公布

下一篇： 168萬元比亞迪首款超跑來了！仰望U9 8月開始交付

標簽：

熱門焦點

2023年Q2用戶偏好榜：12+256G版本成新主流

3月份的性能榜、性價比榜和好評榜之后，就要輪到2023年的第二季度偏好榜了，上半年的新機潮已經過去，最明顯的肯定就是大內存和存儲的機型了，另外部分中端機也取消了屏幕塑料支架
6月安卓手機性能榜：vivo/iQOO霸占旗艦排行榜前三

2023年上半年已經正式過去了，我們也迎來了安兔兔V10版本，在新的驍龍8Gen3和天璣9300發布之前，性能榜的榜單大體會以驍龍8Gen2和天璣9200+為主，至于那顆3.36GHz的驍龍8Gen2領先
Raft算法：保障分布式系統共識的穩健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可復制、可冗余、可容錯”）的首字母縮寫。Raft算法是一種用于在分布式系統
SpringBoot中使用Cache提升接口性能詳解

環境：springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架從 3.1 開始，對 Spring 應用程序提供了透明式添加緩存的支持。和事務支持一樣，抽象緩存允許一致地使用各
騰訊VS網易，最卷游戲暑期檔，誰能笑到最后？

作者：無銹缽來源：財經無忌7月16日晚，上海1862時尚藝術中心。伴隨著幻象的精準命中，碩大的熒幕之上，比分被定格在了14：12，被寄予厚望的EDG戰隊以絕對的優勢戰勝了BLG戰隊，拿下了總決
東方甄選單飛：有些鳥注定是關不住的

文/彭寬鴻編輯/羅卿東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一年多時間里，東方甄選要脫離抖音自立門戶的傳聞不絕于耳，“7
阿里大調整

來源：產品劉有媒體報道稱，近期淘寶天貓集團啟動了近年來最大的人力制度改革，涉及員工績效、層級體系等多個核心事項，目前已形成一個初步的“征求意見版”：1、取消P序列
首發天璣9200+ iQOO Neo8系列發布首銷售價2299元起

2023年5月23日晚，iQOO Neo8系列正式發布。其中，Neo系列首款Pro之作——iQOO Neo8 Pro強悍登場，限時售價3099元起；價位段最強性能手機iQOO Neo8同期上市
榮耀Magicbook V 14 2021曙光藍版本正式開售，擁有觸摸屏

榮耀 Magicbook V 14 2021 曙光藍版本正式開售，搭載 i7-11390H 處理器與 MX450 顯卡，配備 16GB 內存與 512GB SSD，重 1.48kg，厚 14.5mm，具有 1.5mm 鍵盤鍵程、

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

Nature封面：AI訓AI 越訓越傻

2023年Q2用戶偏好榜：12+256G版本成新主流

6月安卓手機性能榜：vivo/iQOO霸占旗艦排行榜前三

Raft算法：保障分布式系統共識的穩健之道

SpringBoot中使用Cache提升接口性能詳解

騰訊VS網易，最卷游戲暑期檔，誰能笑到最后？

東方甄選單飛：有些鳥注定是關不住的

阿里大調整

首發天璣9200+ iQOO Neo8系列發布首銷售價2299元起

榮耀Magicbook V 14 2021曙光藍版本正式開售，擁有觸摸屏

最新推薦

猜你喜歡

熱門推薦

相關資訊