當前位置：首頁 > 科技 > 網絡

有望改寫AI未來！NVIDIA全新nGPT使訓練速度暴增20倍

來源：責編：時間：2024-10-21 11:56:16 34觀看

導讀快科技10月20日消息，據媒體報道，NVIDIA的新研究可能徹底改變AI的未來，其研究團隊提出了一種名為歸一化Transformer（nGPT）的新型神經網絡架構。這一架構在超球面（hypersphere）上進行表示學習，能夠顯著提升大型語言模

快科技10月20日消息，據媒體報道，NVIDIA的新研究可能徹底改變AI的未來，其研究團隊提出了一種名為歸一化Transformer（nGPT）的新型神經網絡架構。

這一架構在超球面（hypersphere）上進行表示學習，能夠顯著提升大型語言模型（LLM）的訓練速度，高可達20倍，同時保持了模型的精度。

nGPT架構的核心在于將所有向量，包括嵌入、多層感知機（MLP）、注意力矩陣和隱藏狀態，歸一化為單位范數。

這種歸一化處理使得輸入的token在超球面表面上移動，每一層模型都通過位移來貢獻終的輸出預測。

實驗結果表明，nGPT在訓練時所需的步驟比標準Transformer模型減少了4到20倍，具體加速效果取決于序列長度。

例如，在1k上下文中，訓練速度提高了4倍；在4k上下文中，提高了10倍；而在8k上下文中，更是提高了20倍。

研究人員指出，nGPT的優化路徑從超球面上的點開始，通過位移來貢獻終的輸出預測，其中位移量由MLP和注意力模塊定義。

這種方法不僅提高了訓練速度，還增強了模型的穩定性。

有望改寫AI未來！NVIDIA全新nGPT使訓練速度暴增20倍

本文鏈接：http://www.tebozhan.com/showinfo-17-121911-0.html有望改寫AI未來！NVIDIA全新nGPT使訓練速度暴增20倍

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：比Java快15倍！國產編程語言MoonBit發布原生后端

下一篇：微信吃不飽視頻號發力

標簽：

熱門焦點

K60至尊版狂暴引擎2.0加持：超177萬跑分斬獲性能第一

Redmi的后性能時代戰略發布會今天下午如期舉辦，在本次發布會上，Redmi公布了多項關于和聯發科的深度合作，以及新機K60 Ultra在軟件和硬件方面的特性，例如：“K60 至尊版，雙芯旗艦
JavaScript 混淆及反混淆代碼工具

介紹在我們開始學習反混淆之前，我們首先要了解一下代碼混淆。如果不了解代碼是如何混淆的，我們可能無法成功對代碼進行反混淆，尤其是使用自定義混淆器對其進行混淆時。什么是混
每天一道面試題-CPU偽共享

前言：了不起：又到了每天一到面試題的時候了！學弟，最近學習的怎么樣啊了不起學弟：最近學習的還不錯，每天都在學習，每天都在進步！了不起：那你最近學習的什么呢？了不起學弟：最近在學習C
小紅書1周漲粉49W+，我總結了小白可以用的N條漲粉筆記

作者：黃河懂運營一條性教育視頻，被54萬人“珍藏”是什么體驗？最近，情感博主@公主是用鮮花做的，火了！僅僅憑借一條視頻，光小紅書就有超過128萬人，為她瘋狂點贊！更瘋狂的是，這
共享單車的故事講到哪了？

來源丨海克財經與共享充電寶相差不多，共享單車已很久沒有被國內熱點新聞關照到了。除了一再漲價和用戶直呼用不起了。近日多家媒體再發報道稱，成都、天津、鄭州等地多個共享單
簽約井川里予、何丹彤，單視頻點贊近千萬，MCN黑馬永恒文希快速崛起！

來源：視聽觀察永恒文希傳媒作為一家MCN公司，說起它的名字來，可能大家會覺得有點兒陌生，但是說出來下面一串的名字之后，或許大家就會感到震驚，原來這么多網紅，都簽約這家公司了。根
小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

這段時間以來，包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都有新的進展，其中榮耀、三星都已陸續發布了最新的折疊屏旗艦，尤其號榮耀Magi
世界人工智能大會國際日開幕式活動在世博展覽館開啟

30日上午，世界人工智能大會國際日開幕式活動在世博展覽館開啟，聚集國際城市代表、重量級院士專家、國際創新企業代表，共同打造人工智能交流平臺。上海市副市
中關村論壇11月25日開幕，15位諾獎級大咖將發表演講

11月18日，記者從2022中關村論壇新聞發布會上獲悉，中關村論壇將于11月25至30日在京舉行。本屆中關村論壇由科學技術部、國家發展改革委、工業和信息化部、國務

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

有望改寫AI未來！NVIDIA全新nGPT使訓練速度暴增20倍

K60至尊版狂暴引擎2.0加持：超177萬跑分斬獲性能第一

JavaScript 混淆及反混淆代碼工具

每天一道面試題-CPU偽共享

小紅書1周漲粉49W+，我總結了小白可以用的N條漲粉筆記

共享單車的故事講到哪了？

簽約井川里予、何丹彤，單視頻點贊近千萬，MCN黑馬永恒文希快速崛起！

小米MIX Fold 3下月亮相：今年唯一無短板的全能折疊屏

世界人工智能大會國際日開幕式活動在世博展覽館開啟

中關村論壇11月25日開幕，15位諾獎級大咖將發表演講

最新推薦

猜你喜歡

熱門推薦

相關資訊