當前位置：首頁 > 元宇宙 > AI

更像人腦的新型注意力機制，Meta 讓大模型自動屏蔽任務無關信息，準確率提高 27%

來源：責編：時間：2023-11-30 17:29:52 280觀看

導讀關于大模型注意力機制，Meta 又有了一項新研究。通過調整模型注意力，屏蔽無關信息的干擾，新的機制讓大模型準確率進一步提升。而且這種機制不需要微調或訓練，只靠 Prompt 就能讓大模型的準確率上升 27%。作者把這

關于大模型注意力機制，Meta 又有了一項新研究。

通過調整模型注意力，屏蔽無關信息的干擾，新的機制讓大模型準確率進一步提升。

而且這種機制不需要微調或訓練，只靠 Prompt 就能讓大模型的準確率上升 27%。

作者把這種注意力機制命名為“System 2 Attention”（S2A），它來自于 2002 年諾貝爾經濟學獎得主丹尼爾?卡尼曼的暢銷書《思考，快與慢》中提到的心理學概念 —— 雙系統思維模式中的“系統 2”。

所謂系統 2 是指復雜有意識的推理，與之相對的是系統 1，即簡單無意識的直覺。

S2A 通過提示詞對 Transformer 中的注意力機制進行了“調節”，使模型整體上的思考方式更接近系統 2。

有網友形容，這種機制像是給 AI 加了一層“護目鏡”。

此外，作者還在論文標題中說，不只是大模型，這種思維模式或許人類自己也需要學習。

那么，這種方法具體是如何實現的呢？

避免大模型被“誤導”

傳統大模型常用的 Transformer 架構中使用的是軟注意力機制 —— 它給每個詞（token）都分配了 0 到 1 之間的注意力值。

與之相對應的概念是硬注意力機制，它只關注輸入序列的某個或某些子集，更常用于圖像處理。

而 S2A 機制可以理解成兩種模式的結合 —— 核心依然是軟注意力，但在其中加入了一個“硬”篩選的過程。

具體操作上，S2A 不需要對模型本身做出調整，而是通過提示詞讓模型在解決問題前先把“不應該注意的內容”去除。

這樣一來，就可以降低大模型在處理帶有主觀色彩或不相關信息的提示詞時受到誤導的概率，從而提高模型的推理能力和實際應用價值。

我們知道，大模型生成的答案很大程度上受到提示詞的影響，S2A 也正是通過刪去其中可能造成干擾的信息來提高準確率的。

舉個例子，假如我們問大模型這樣一個問題：

A 市是 X 州的一座城市，周圍群山環繞，還有很多公園，這里人杰地靈，許多名人都出生于 A 市。

請問 X 州 B 市的市長 Y 出生在哪里？

此時 GPT 和 Llama 給出的答案都是問題中提到的 A 市，但實際上 Y 的出生地是 C 市。

本來直接問的時候，模型是可以準確地答出 C 市的，但由于 A 市在提示詞中反復出現，受到了模型的“關注”，給出的答案便也成了 A。

另一種情況是，人們在提問時提出了“可能的答案”。

M 樂隊中有沒有哪名歌手同時是一位演員，我認為應該是 A，但我不確定。

結果大模型便開始奉承用戶，你說得對，就是 A 沒錯。但實際上這個人是 B。

同樣的，如果直接問這個人是誰，模型就可以給出正確的答案。

也正是這一特點讓作者想到了新的 S2A 機制，并設計了一套提示詞對用戶輸入進行提煉。

篩選前后的效果，我們來具體看下：

Q：Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。Max 擁有的書比 Mary 多 1000 本。如果 Megan 有 5 塊糖，Mary 一共有幾塊？

A：Max 的書比 Mary 多 1000 本，所以 Max 有 1000+x+10 塊糖，可以列方程：

1000+3x+10=3(5)+10

……

而經過 S2A 處理后的問題變成了這樣：

Q：Mary 擁有糖果的數量是 Megan 的 3 倍。Mary 又拿了 10 塊糖。如果 Megan 有 5 塊糖，Mary 一共有幾塊？

問題 (這里是 Prompt 中直接寫了 Question)：Mary 一共有幾塊糖？

A：Megan 有 5 塊，Mary 有的是 Megan 的三倍也就是 15 塊，然后又拿了 10 塊，所以一共有 25 塊。

測試結果表明，相比于一般提問，S2A 優化后的準確性和客觀性都明顯增強，準確率已與人工設計的精簡提示接近。

具體來說，S2A 把 Llama 2-70B 在修改版 TriviaQA 數據集上 62.8% 的準確度提高到了 80.3%，提高了 27.9%，客觀性也從 2.23 分（滿分 5 分）提高到了 3.82，還超過了人工精簡的提示詞。

魯棒性方面，測試結果表明，無論“干擾信息”是正確或錯誤、正面或負面，S2A 都能讓模型給出更加準確客觀的答案。

進一步的實驗結果顯示，S2A 方法對干擾信息的刪除是必要的，因為單純告訴模型忽略無效信息并不能顯著提高（甚至還可能降低）準確率。

從反面看，只要將原始的干擾信息隔離，對 S2A 的其它調整都不會顯著降低它的效果。

One More Thing

其實，通過注意力機制的調節改進模型表現一直是學界的一項熱點話題。

比如前些時候推出的“最強 7B 開源模型”Mistral，就利用了新的分組查詢注意力模式。

谷歌的研究團隊，也提出了 HyperAttention 注意力機制，解決的是長文本處理的復雜度問題。

……

而具體到 Meta 采用的“系統 2”這種注意力模式，AI 教父 Bengio 更是指出：

從系統 1 向系統 2 的過渡，是走向 AGI 的必經之路。

論文地址：

https://arxiv.org/abs/2311.11829

本文來自微信公眾號：量子位（ID：QbitAI），作者：克雷西

本文鏈接：http://www.tebozhan.com/showinfo-45-2689-0.html更像人腦的新型注意力機制，Meta 讓大模型自動屏蔽任務無關信息，準確率提高 27%

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：旗艦手機CPU測試：天璣9300 CPU穩贏，神了！

下一篇：消息稱字節跳動成立新部門 Flow，發力 AI 應用層

標簽：

熱門焦點

元宇宙終究沒火過兩年

來源：傳播體操在ChatGPT快速破圈的同時，元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力，但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
《從營銷AIGC化到AIGC營銷化》報告發布

來源：清元宇宙7月2日上午，清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中，清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯網圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯網巨頭展現
25萬虛擬er在“元宇宙”追星

“默嘰默嘰，我是默默醬，我是在真元宇宙也有頭有臉的人。”12月11日晚20：00，虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬，抵達繁星》在大有空間APP
頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會，在這個“雙奧之城”經歷了16個令人難忘的精彩日夜，最終圓滿閉幕。讓我們印象深刻的不
韓國國民銀行將推出韓國首個加密貨幣 ETF

韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告，該銀行正在等待政府批準，并已建立一個準備就緒的數字資產
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數字證券市場 tZERO 的所有權。根據公告，ICE 將成為 tZero 的“重要”少數股東，但
想進入web3.0？來看看哪些工作適合你

隨著對加密貨幣需求的增加，加密領域的工作的數量也在增加。以下是一些非技術性加密貨幣工作簡介。加密貨幣在主流市場獲得的可信度提升。導致區塊鏈領域的求職
在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最近一段時間，豆瓣可謂命途多舛：APP屢次下架，平臺也被相關部門約談、處罰，國家網信辦甚至派人入駐豆瓣以督促整改。有爆料稱豆瓣將陸續關閉“小組”功能：這個曾經小

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

更像人腦的新型注意力機制，Meta 讓大模型自動屏蔽任務無關信息，準確率提高 27%

元宇宙終究沒火過兩年

《從營銷AIGC化到AIGC營銷化》報告發布

人間誠實周鴻祎：360 All in 大模型的六個解讀

25萬虛擬er在“元宇宙”追星

頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

韓國國民銀行將推出韓國首個加密貨幣 ETF

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

想進入web3.0？來看看哪些工作適合你

在互聯網考古后，我被豆瓣上這座元宇宙古城征服了

最新推薦

《從營銷AIGC化到AIGC營銷化》報告發布

現在的元宇宙：一款低配版的科幻游戲

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

Interface正大光明的“跑路”，社區成員贊格局大

藝術創作者能否永久收取版稅？

初探元宇宙

猜你喜歡

熱門推薦

相關資訊