AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

AI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

來源: 責編: 時間:2024-10-11 16:31:21 77觀看
導讀 10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。Transformer 架構簡介Transformer 是一種革命

10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。Gyw28資訊網——每日最新資訊28at.com

Transformer 架構簡介

Transformer 是一種革命性的神經網絡架構,由谷歌在 2017 年提出,主要用于處理序列數據,特別是在自然語言處理(NLP)領域。Gyw28資訊網——每日最新資訊28at.com

Transformer 的核心是自注意力機制,允許模型在處理輸入序列時捕捉詞與詞之間的關系,讓模型能夠關注輸入序列中的所有部分,而不僅僅是局部信息。Gyw28資訊網——每日最新資訊28at.com

Transformer 由多個編碼器和解碼器組成。編碼器負責理解輸入數據,而解碼器則生成輸出。多頭自注意力機制使模型能夠并行處理信息,提高了效率和準確性。Gyw28資訊網——每日最新資訊28at.com

Transformer 架構模型挑戰

Transformer 架構的一大挑戰是它們在處理長文本序列時效率低下,由于每個標記與序列中的每個其他標記都相互作用導致二次復雜度,這就導致隨著上下文長度的增加,計算和內存需求呈指數增長。Gyw28資訊網——每日最新資訊28at.com

現在解決這一問題的方法包括稀疏注意力機制(sparse attention mechanisms),它限制了標記之間的交互數量,以及通過總結過去信息來減少序列長度的上下文壓縮技術。Gyw28資訊網——每日最新資訊28at.com

不過這種方法是通過減少在注意力機制中考慮的標記數量達成的,因此通常以性能為代價,可能會導致上下文關鍵信息丟失。Gyw28資訊網——每日最新資訊28at.com

谷歌新方法

谷歌研究的研究人員提出了一種名為選擇性注意的新方法,可以動態忽略不再相關的標記,從而提高 Transformer 模型的效率。Gyw28資訊網——每日最新資訊28at.com

選擇性注意力使用軟掩碼矩陣來確定每個標記對未來標記的重要性,減少對不重要標記的關注。Gyw28資訊網——每日最新資訊28at.com

研究表明,配備選擇性注意的 Transformer 架構模型在多個自然語言處理任務中表現出色,同時顯著降低了內存使用和計算成本。Gyw28資訊網——每日最新資訊28at.com

Gyw28資訊網——每日最新資訊28at.com

Gyw28資訊網——每日最新資訊28at.com

例如,在擁有 1 億參數的 Transformer 模型中,注意力模塊的內存需求在上下文大小為 512、1024 和 2048 個 tokens 時分別減少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基準測試中也優于傳統 Transformer,對于較大的模型規模實現了高達 5% 的準確率提升。Gyw28資訊網——每日最新資訊28at.com

選擇性注意力允許構建更小、更高效的模型,在不損害準確性的情況下,顯著減少內存需求。Gyw28資訊網——每日最新資訊28at.com

附上參考地址Gyw28資訊網——每日最新資訊28at.com

Selective Attention Improves Transformer Gyw28資訊網——每日最新資訊28at.com

This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer ModelsGyw28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-9029-0.htmlAI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 僅靠微軟無法滿足激增的 AI 計算需求,OpenAI 被曝和甲骨文合作

下一篇: 消息稱 Kimi AI 助手內測深度推理功能,月之暗面有團隊國慶加班 7 天 3 倍工資

標簽:
  • 熱門焦點
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內容~大家掌聲歡迎~~~本次更
  • 錯過了BRC20還有eths,eth銘文協議

    來源:三頭鳥NFT大家好,我是鳥哥,了解鳥哥的人都知道鳥哥擅擼空投,說實話擼毛雖然回報大但周期還是有點長的,所以除了擼毛我們自己也在研究早期項目,打新,比如BRC20協議ordi當時就有
  • 刷完一場元宇宙世界杯音樂盛典,我爽了

    作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了?三刷都不嫌多的那種。按照慣例,每逢年底,直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
  • 超跑與NFT的首次結合,蘭博基尼能否破局?

    蘭博基尼公司近日稱即將推出它的首款NFT,并且將加速進軍區塊鏈領域。這家聞名遐邇的意大利汽車廠商野心勃勃地將目光投向混合動力和電動跑車,并宣布將拍賣與瑞士
  • NFT的未來:傳統企業與去中心化機構之間的競賽

    傳統企業和去中心化機構一直存在分歧,但最近NFT的爆炸式增長讓他們產生了共同的興趣,雙方都在競相讓用戶更輕松、更方便地使用NFT。毫無疑問,NFT 市場正在增長。
  • 2021年中國智慧城市行業概覽:AI慧眼獨具,賦能“雙碳”目標

    中國智慧城市試點項目主要集中于東南地區以及華中地區,受制于應用場景分散以及行業地域建設差異,目前中國智慧城市存在較多弊端,未來數量有望持續突破。中國智慧
  • 重溫 1602 年:DAO 是新的企業范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權 。”1602 年,荷蘭東印度公司成立,許多人認為
  • 本周NFT領域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時,美聯社因其最新的NFT銷售被推到了風口浪尖,而Opensea正面臨
  • NFT領域,我們是否應該遵守版權法

    NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外,圍繞著NFT行業內的版權和知識產權盜竊的問題也同樣重要,因為人們很容易誤解這些事情
Top