AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

AI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

來源: 責編: 時間:2024-10-11 16:31:21 106觀看
導讀 10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。Transformer 架構簡介Transformer 是一種革命

10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。MqV28資訊網——每日最新資訊28at.com

Transformer 架構簡介

Transformer 是一種革命性的神經網絡架構,由谷歌在 2017 年提出,主要用于處理序列數據,特別是在自然語言處理(NLP)領域。MqV28資訊網——每日最新資訊28at.com

Transformer 的核心是自注意力機制,允許模型在處理輸入序列時捕捉詞與詞之間的關系,讓模型能夠關注輸入序列中的所有部分,而不僅僅是局部信息。MqV28資訊網——每日最新資訊28at.com

Transformer 由多個編碼器和解碼器組成。編碼器負責理解輸入數據,而解碼器則生成輸出。多頭自注意力機制使模型能夠并行處理信息,提高了效率和準確性。MqV28資訊網——每日最新資訊28at.com

Transformer 架構模型挑戰

Transformer 架構的一大挑戰是它們在處理長文本序列時效率低下,由于每個標記與序列中的每個其他標記都相互作用導致二次復雜度,這就導致隨著上下文長度的增加,計算和內存需求呈指數增長。MqV28資訊網——每日最新資訊28at.com

現在解決這一問題的方法包括稀疏注意力機制(sparse attention mechanisms),它限制了標記之間的交互數量,以及通過總結過去信息來減少序列長度的上下文壓縮技術。MqV28資訊網——每日最新資訊28at.com

不過這種方法是通過減少在注意力機制中考慮的標記數量達成的,因此通常以性能為代價,可能會導致上下文關鍵信息丟失。MqV28資訊網——每日最新資訊28at.com

谷歌新方法

谷歌研究的研究人員提出了一種名為選擇性注意的新方法,可以動態忽略不再相關的標記,從而提高 Transformer 模型的效率。MqV28資訊網——每日最新資訊28at.com

選擇性注意力使用軟掩碼矩陣來確定每個標記對未來標記的重要性,減少對不重要標記的關注。MqV28資訊網——每日最新資訊28at.com

研究表明,配備選擇性注意的 Transformer 架構模型在多個自然語言處理任務中表現出色,同時顯著降低了內存使用和計算成本。MqV28資訊網——每日最新資訊28at.com

MqV28資訊網——每日最新資訊28at.com

MqV28資訊網——每日最新資訊28at.com

例如,在擁有 1 億參數的 Transformer 模型中,注意力模塊的內存需求在上下文大小為 512、1024 和 2048 個 tokens 時分別減少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基準測試中也優于傳統 Transformer,對于較大的模型規模實現了高達 5% 的準確率提升。MqV28資訊網——每日最新資訊28at.com

選擇性注意力允許構建更小、更高效的模型,在不損害準確性的情況下,顯著減少內存需求。MqV28資訊網——每日最新資訊28at.com

附上參考地址MqV28資訊網——每日最新資訊28at.com

Selective Attention Improves Transformer MqV28資訊網——每日最新資訊28at.com

This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer ModelsMqV28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8696-0.htmlAI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 僅靠微軟無法滿足激增的 AI 計算需求,OpenAI 被曝和甲骨文合作

下一篇: 消息稱 Kimi AI 助手內測深度推理功能,月之暗面有團隊國慶加班 7 天 3 倍工資

標簽:
  • 熱門焦點
  • 《從營銷AIGC化到AIGC營銷化》報告發布

    來源:清元宇宙7月2日上午,清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中,清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
  • 三院士三教授熱聊元宇宙&——AIGC,學術界怎么看?

    來源:清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上,中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三大院士,還有清華
  • 在元宇宙賣酸奶,這波聯動燃爆了!

    來源:品牌頭版 或許,每個人心中都住著一個小饞孩。可能是童年時百吃不厭,覺得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;還有可能,是某種不知為什么,就是很愛吃的
  • 風口已至,多領域平臺融入社交元素!

    在眾多領域平臺中,社交元素都扮演著重要角色,如直播營銷帶貨、線上配對聽歌、游戲局內互動等。隨著元宇宙時代的來臨,社交產品不斷升級,社交元素推動流量變現,多平臺領域融入社交
  • 元宇宙將會如何塑造未來的工作方式?

    科幻小說家尼爾·斯蒂芬森 (Neal Stephenson) 在1992年就創造了“元宇宙”一詞,但事實上,在Facebook將其更名為Meta以反映其將這一科幻愿景變為現實的戰略重點之
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產業規劃,大有在2022年
  • 用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

    你可能聽說過不可偽造的代幣,或NFTs。NFTs是數字代幣,代表完全獨特的項目的所有權;存儲在區塊鏈中并可追蹤,它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
  • 下一個黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個投資趨勢,碎片化本身并不新鮮。它已經存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • 2022年元宇宙系列報告:UGC當道,XR帶來新交互體驗

    UGC作為元宇宙的主要內容創作模式,已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面,UGC模式勾勒了元宇宙的邊界,現今元宇宙UGC模式的主要呈現方式以元宇宙概念

猜你喜歡

    SQL Error: select * from ***_ecms_news13 where id in(155,42,248,130,,66) limit 6
Top