AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

AI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

來源: 責編: 時間:2024-10-16 15:25:09 510觀看
導讀 10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。Transformer 架構簡介Transformer 是一種革命

10 月 9 日消息,科技媒體 marktechpost 昨日(10 月 8 日)發布博文,報道稱谷歌公司推出了選擇性注意力(Selective Attention)方法,可以提高 Transformer 架構模型的性能。Rck28資訊網——每日最新資訊28at.com

Transformer 架構簡介

Transformer 是一種革命性的神經網絡架構,由谷歌在 2017 年提出,主要用于處理序列數據,特別是在自然語言處理(NLP)領域。Rck28資訊網——每日最新資訊28at.com

Transformer 的核心是自注意力機制,允許模型在處理輸入序列時捕捉詞與詞之間的關系,讓模型能夠關注輸入序列中的所有部分,而不僅僅是局部信息。Rck28資訊網——每日最新資訊28at.com

Transformer 由多個編碼器和解碼器組成。編碼器負責理解輸入數據,而解碼器則生成輸出。多頭自注意力機制使模型能夠并行處理信息,提高了效率和準確性。Rck28資訊網——每日最新資訊28at.com

Transformer 架構模型挑戰

Transformer 架構的一大挑戰是它們在處理長文本序列時效率低下,由于每個標記與序列中的每個其他標記都相互作用導致二次復雜度,這就導致隨著上下文長度的增加,計算和內存需求呈指數增長。Rck28資訊網——每日最新資訊28at.com

現在解決這一問題的方法包括稀疏注意力機制(sparse attention mechanisms),它限制了標記之間的交互數量,以及通過總結過去信息來減少序列長度的上下文壓縮技術。Rck28資訊網——每日最新資訊28at.com

不過這種方法是通過減少在注意力機制中考慮的標記數量達成的,因此通常以性能為代價,可能會導致上下文關鍵信息丟失。Rck28資訊網——每日最新資訊28at.com

谷歌新方法

谷歌研究的研究人員提出了一種名為選擇性注意的新方法,可以動態忽略不再相關的標記,從而提高 Transformer 模型的效率。Rck28資訊網——每日最新資訊28at.com

選擇性注意力使用軟掩碼矩陣來確定每個標記對未來標記的重要性,減少對不重要標記的關注。Rck28資訊網——每日最新資訊28at.com

研究表明,配備選擇性注意的 Transformer 架構模型在多個自然語言處理任務中表現出色,同時顯著降低了內存使用和計算成本。Rck28資訊網——每日最新資訊28at.com

Rck28資訊網——每日最新資訊28at.com

Rck28資訊網——每日最新資訊28at.com

例如,在擁有 1 億參數的 Transformer 模型中,注意力模塊的內存需求在上下文大小為 512、1024 和 2048 個 tokens 時分別減少至 1/16、1/25 和 1/47。所提方法在 HellaSwag 基準測試中也優于傳統 Transformer,對于較大的模型規模實現了高達 5% 的準確率提升。Rck28資訊網——每日最新資訊28at.com

選擇性注意力允許構建更小、更高效的模型,在不損害準確性的情況下,顯著減少內存需求。Rck28資訊網——每日最新資訊28at.com

附上參考地址Rck28資訊網——每日最新資訊28at.com

Selective Attention Improves Transformer Rck28資訊網——每日最新資訊28at.com

This AI Paper from Google Introduces Selective Attention: A Novel AI Approach to Improving the Efficiency of Transformer ModelsRck28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8626-0.htmlAI 架構 Transformer 再進化:谷歌新方法突破長文本處理,注意力模塊內存需求可降至 1 47

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 僅靠微軟無法滿足激增的 AI 計算需求,OpenAI 被曝和甲骨文合作

下一篇: 消息稱 Kimi AI 助手內測深度推理功能,月之暗面有團隊國慶加班 7 天 3 倍工資

標簽:
  • 熱門焦點
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元(約合人民幣5000
  • VR/AR迷失元宇宙“硝煙”

    不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣,又隨著元宇宙回歸平靜。1月份,微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員,其中負責混合現實硬件(MR)的Holo
  • 【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

    虛擬數字人行業未來的主要驅動力包括:用戶代際變化,新一代消費者對內容消費和虛擬世界更為渴求;虛擬數字人相關技術門檻相對降低,成本有所回落;資本熱度上升,受Metav
  • 傳騰訊已推出全新XR業務;摩托羅拉正打造5GXR頸戴式計算組件

    今日熱點:傳騰訊已推出全新XR業務;摩托羅拉與Verizon合作打造5G XR頸戴式計算組件;小米AR購物導航專利獲授權;VR一體機Simula One放棄眾籌并開放直接預訂;VR游戲《
  • 2022年中國元宇宙產業系列研究報告-基礎設施篇(5)

    傳感器是由敏感元件和轉換元件構成,能夠感受規定的檢測量(物理量、化學量、生物量等),并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置,進而滿足信息的
  • 國內涌現70余家數字藏品平臺:合規、流量與利潤在博弈

    作者:楊鄭君2月16日,迅雷鏈企業數字藏品服務平臺正式上線,繼阿里、騰訊、京東、百度、網易等之后,又一家互聯網企業正式加入到火熱的數字藏品平臺的競爭中。除互聯
  • Snoop Dogg 計劃推出致力于數字媒體NFT的專業公司

    雅痞哥不知道這人是誰還上新聞,問了助理,解釋,相當于美版劉歡的地位吧。Snoop Dogg 在 NFT 領域已經有一段時間了,尤其是在最近有消息稱人們在元宇宙中購買房地產
  • 元宇宙不完全是想出來的,而是實打實做出來的

    沈陽強調,元宇宙不完全是想出來的,而是靠實打實做出來的;互聯網向三維化升級是已經明確的大方向,這意味著大量的資金和技術會持續涌入??缛?022年,元宇宙并沒有“
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲,盡管游戲尚在研發中,這一消息已經讓中青寶的股價在51個交易
Top