AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

更像人腦的新型注意力機制,Meta 讓大模型自動屏蔽任務無關信息,準確率提高 27%

來源: 責編: 時間:2023-11-30 17:29:52 280觀看
導讀 關于大模型注意力機制,Meta 又有了一項新研究。通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率進一步提升。而且這種機制不需要微調或訓練,只靠 Prompt 就能讓大模型的準確率上升 27%。作者把這

關于大模型注意力機制,Meta 又有了一項新研究。Pvh28資訊網——每日最新資訊28at.com

通過調整模型注意力,屏蔽無關信息的干擾,新的機制讓大模型準確率進一步提升。Pvh28資訊網——每日最新資訊28at.com

而且這種機制不需要微調或訓練,只靠 Prompt 就能讓大模型的準確率上升 27%。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

作者把這種注意力機制命名為“System 2 Attention”(S2A),它來自于 2002 年諾貝爾經濟學獎得主丹尼爾?卡尼曼的暢銷書《思考,快與慢》中提到的心理學概念 —— 雙系統思維模式中的“系統 2”。Pvh28資訊網——每日最新資訊28at.com

所謂系統 2 是指復雜有意識的推理,與之相對的是系統 1,即簡單無意識的直覺。Pvh28資訊網——每日最新資訊28at.com

S2A 通過提示詞對 Transformer 中的注意力機制進行了“調節”,使模型整體上的思考方式更接近系統 2。Pvh28資訊網——每日最新資訊28at.com

有網友形容,這種機制像是給 AI 加了一層“護目鏡”。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

此外,作者還在論文標題中說,不只是大模型,這種思維模式或許人類自己也需要學習。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

那么,這種方法具體是如何實現的呢?Pvh28資訊網——每日最新資訊28at.com

避免大模型被“誤導”

傳統大模型常用的 Transformer 架構中使用的是軟注意力機制 —— 它給每個詞(token)都分配了 0 到 1 之間的注意力值。Pvh28資訊網——每日最新資訊28at.com

與之相對應的概念是硬注意力機制,它只關注輸入序列的某個或某些子集,更常用于圖像處理。Pvh28資訊網——每日最新資訊28at.com

而 S2A 機制可以理解成兩種模式的結合 —— 核心依然是軟注意力,但在其中加入了一個“硬”篩選的過程。Pvh28資訊網——每日最新資訊28at.com

具體操作上,S2A 不需要對模型本身做出調整,而是通過提示詞讓模型在解決問題前先把“不應該注意的內容”去除。Pvh28資訊網——每日最新資訊28at.com

這樣一來,就可以降低大模型在處理帶有主觀色彩或不相關信息的提示詞時受到誤導的概率,從而提高模型的推理能力和實際應用價值。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

我們知道,大模型生成的答案很大程度上受到提示詞的影響,S2A 也正是通過刪去其中可能造成干擾的信息來提高準確率的。Pvh28資訊網——每日最新資訊28at.com

舉個例子,假如我們問大模型這樣一個問題:Pvh28資訊網——每日最新資訊28at.com

A 市是 X 州的一座城市,周圍群山環繞,還有很多公園,這里人杰地靈,許多名人都出生于 A 市。Pvh28資訊網——每日最新資訊28at.com

請問 X 州 B 市的市長 Y 出生在哪里?Pvh28資訊網——每日最新資訊28at.com

此時 GPT 和 Llama 給出的答案都是問題中提到的 A 市,但實際上 Y 的出生地是 C 市。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

本來直接問的時候,模型是可以準確地答出 C 市的,但由于 A 市在提示詞中反復出現,受到了模型的“關注”,給出的答案便也成了 A。Pvh28資訊網——每日最新資訊28at.com

另一種情況是,人們在提問時提出了“可能的答案”。Pvh28資訊網——每日最新資訊28at.com

M 樂隊中有沒有哪名歌手同時是一位演員,我認為應該是 A,但我不確定。Pvh28資訊網——每日最新資訊28at.com

結果大模型便開始奉承用戶,你說得對,就是 A 沒錯。但實際上這個人是 B。Pvh28資訊網——每日最新資訊28at.com

同樣的,如果直接問這個人是誰,模型就可以給出正確的答案。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

也正是這一特點讓作者想到了新的 S2A 機制,并設計了一套提示詞對用戶輸入進行提煉。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

篩選前后的效果,我們來具體看下:Pvh28資訊網——每日最新資訊28at.com

Q:Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。Max 擁有的書比 Mary 多 1000 本。如果 Megan 有 5 塊糖,Mary 一共有幾塊?Pvh28資訊網——每日最新資訊28at.com

A:Max 的書比 Mary 多 1000 本,所以 Max 有 1000+x+10 塊糖,可以列方程:Pvh28資訊網——每日最新資訊28at.com

1000+3x+10=3(5)+10Pvh28資訊網——每日最新資訊28at.com

……Pvh28資訊網——每日最新資訊28at.com

而經過 S2A 處理后的問題變成了這樣:Pvh28資訊網——每日最新資訊28at.com

Q:Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。如果 Megan 有 5 塊糖,Mary 一共有幾塊?Pvh28資訊網——每日最新資訊28at.com

問題 (這里是 Prompt 中直接寫了 Question):Mary 一共有幾塊糖?Pvh28資訊網——每日最新資訊28at.com

A:Megan 有 5 塊,Mary 有的是 Megan 的三倍也就是 15 塊,然后又拿了 10 塊,所以一共有 25 塊。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

測試結果表明,相比于一般提問,S2A 優化后的準確性和客觀性都明顯增強,準確率已與人工設計的精簡提示接近。Pvh28資訊網——每日最新資訊28at.com

具體來說,S2A 把 Llama 2-70B 在修改版 TriviaQA 數據集上 62.8% 的準確度提高到了 80.3%,提高了 27.9%,客觀性也從 2.23 分(滿分 5 分)提高到了 3.82,還超過了人工精簡的提示詞。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

魯棒性方面,測試結果表明,無論“干擾信息”是正確或錯誤、正面或負面,S2A 都能讓模型給出更加準確客觀的答案。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

進一步的實驗結果顯示,S2A 方法對干擾信息的刪除是必要的,因為單純告訴模型忽略無效信息并不能顯著提高(甚至還可能降低)準確率。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

從反面看,只要將原始的干擾信息隔離,對 S2A 的其它調整都不會顯著降低它的效果。Pvh28資訊網——每日最新資訊28at.com

Pvh28資訊網——每日最新資訊28at.com

One More Thing

其實,通過注意力機制的調節改進模型表現一直是學界的一項熱點話題。Pvh28資訊網——每日最新資訊28at.com

比如前些時候推出的“最強 7B 開源模型”Mistral,就利用了新的分組查詢注意力模式。Pvh28資訊網——每日最新資訊28at.com

谷歌的研究團隊,也提出了 HyperAttention 注意力機制,解決的是長文本處理的復雜度問題。Pvh28資訊網——每日最新資訊28at.com

……Pvh28資訊網——每日最新資訊28at.com

而具體到 Meta 采用的“系統 2”這種注意力模式,AI 教父 Bengio 更是指出:Pvh28資訊網——每日最新資訊28at.com

從系統 1 向系統 2 的過渡,是走向 AGI 的必經之路。Pvh28資訊網——每日最新資訊28at.com

論文地址:Pvh28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2311.11829Pvh28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:克雷西Pvh28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-2689-0.html更像人腦的新型注意力機制,Meta 讓大模型自動屏蔽任務無關信息,準確率提高 27%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 旗艦手機CPU測試:天璣9300 CPU穩贏,神了!

下一篇: 消息稱字節跳動成立新部門 Flow,發力 AI 應用層

標簽:
  • 熱門焦點
  • 元宇宙終究沒火過兩年

    來源:傳播體操在ChatGPT快速破圈的同時,元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力,但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
  • 《從營銷AIGC化到AIGC營銷化》報告發布

    來源:清元宇宙7月2日上午,清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中,清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
  • 人間誠實周鴻祎:360 All in 大模型的六個解讀

    主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今,人間躁動,各路大模型你方唱罷我登場,VC圈互聯網圈媒體圈已近癲狂。誰也沒想到,今日,360再度刷屏,老牌互聯網巨頭展現
  • 25萬虛擬er在“元宇宙”追星

    “默嘰默嘰,我是默默醬,我是在真元宇宙也有頭有臉的人。”12月11日晚20:00,虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬,抵達繁星》在大有空間APP
  • 頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

    一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會,在這個“雙奧之城”經歷了16個令人難忘的精彩日夜,最終圓滿閉幕。讓我們印象深刻的不
  • 韓國國民銀行將推出韓國首個加密貨幣 ETF

    韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告,該銀行正在等待政府批準,并已建立一個準備就緒的數字資產
  • 紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

    2 月 22 日,紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布,它將持有私人數字證券市場 tZERO 的所有權。根據公告,ICE 將成為 tZero 的“重要”少數股東,但
  • 想進入web3.0?來看看哪些工作適合你

    隨著對加密貨幣需求的增加,加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
  • 在互聯網考古后,我被豆瓣上這座元宇宙古城征服了

    最近一段時間,豆瓣可謂命途多舛:APP屢次下架,平臺也被相關部門約談、處罰,國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能:這個曾經小
Top