AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

OpenAI 把 GPT-4 原始版給了瑞士洛桑聯(lián)邦理工團隊:研究不微調(diào)只靠提示詞能走多遠

來源: 責編: 時間:2024-06-06 17:36:04 158觀看
導讀 除了 OpenAI 自己,居然還有別人能用上 GPT-4-Base 版??也就是未經(jīng)微調(diào)的預訓練版,還不會對話聊天,只會補全句子的模型。EPFL(瑞士洛桑聯(lián)邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。

除了 OpenAI 自己,居然還有別人能用上 GPT-4-Base 版??也就是未經(jīng)微調(diào)的預訓練版,還不會對話聊天,只會補全句子的模型。0WQ28資訊網(wǎng)——每日最新資訊28at.com

EPFL(瑞士洛桑聯(lián)邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。0WQ28資訊網(wǎng)——每日最新資訊28at.com

也就是不用監(jiān)督微調(diào)、也不用 RHLF 或其他強化學習對齊方法,只靠提示詞能走多遠?0WQ28資訊網(wǎng)——每日最新資訊28at.com

預訓練模型,究竟能不能一步登天,直接改造成聊天機器人或 AI 助手?0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

如果可行,將大大降低類 ChatGPT 大模型的開發(fā)難度。0WQ28資訊網(wǎng)——每日最新資訊28at.com

免微調(diào)對齊靠譜嗎?

免微調(diào)對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業(yè)界關注的研究方向。0WQ28資訊網(wǎng)——每日最新資訊28at.com

目前的 SOTA 方法(指某個領域在之前的研究中效果最好的方法)URIAL 來自艾倫研究所,使用系統(tǒng)提示詞 + 少數(shù)風格示例就能達到不錯的效果。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

但 EPFL 團隊發(fā)現(xiàn),URIAL 仍無法完全彌補與指令微調(diào)模型的差距,尤其在多輪對話中的表現(xiàn)更差一些。0WQ28資訊網(wǎng)——每日最新資訊28at.com

實驗中,在 Llama 系列、Mistral 系列和一般人接觸不到的 GPT-4-Base 都觀察到這種現(xiàn)象。0WQ28資訊網(wǎng)——每日最新資訊28at.com

其中 GPT-4-Base 的 API 訪問權限從 OpenAI Researcher Access Program 項目中申請到。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

EPFL 團隊從這里出發(fā),嘗試了各種辦法來提升上下文學習的效果。0WQ28資訊網(wǎng)——每日最新資訊28at.com

首先他們增加示例的數(shù)量,但發(fā)現(xiàn)幫助不大,沒有隨著例子數(shù)目增加性能就提升的趨勢。這一點跟圖像分類、機器翻譯等任務還不太一樣。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

然后他們使用了貪心搜索算法,從一大堆示例中選擇最佳的添加到上下文。0WQ28資訊網(wǎng)——每日最新資訊28at.com

這種方法可以進一步提高性能,但與指令微調(diào)模型的差距仍然存在,特別是在 AlpacaEval 2.0 基準測試中。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

此外他們還發(fā)現(xiàn),貪心搜索為某個特定模型找到的最佳示例,對于其他模型不能可靠地遷移。0WQ28資訊網(wǎng)——每日最新資訊28at.com

也就是說,不同的示例適合不同的模型。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

團隊還進行了一系列消融實驗(指移除或變換某個組件,來研究該組件對系統(tǒng)功能的影響),以更多地了解上下文學習的工作原理。0WQ28資訊網(wǎng)——每日最新資訊28at.com

他們發(fā)現(xiàn),在 MT-Bench 這樣的綜合評測中,示例包含正確的“問題-答案對”至關重要。0WQ28資訊網(wǎng)——每日最新資訊28at.com

這與此前大模型在分類任務中,只要有大量示例,部分標簽錯了也無所謂的發(fā)現(xiàn)非常不同。0WQ28資訊網(wǎng)——每日最新資訊28at.com

0WQ28資訊網(wǎng)——每日最新資訊28at.com

所以最終得出的結論是:0WQ28資訊網(wǎng)——每日最新資訊28at.com

即使采用更多復雜的改進方法,完全縮小上下文學習和指令微調(diào)之間的差距也有挑戰(zhàn),即使對于非常長上下文的大模型也是如此。0WQ28資訊網(wǎng)——每日最新資訊28at.com

論文最后分析,大語言模型可能通過上下文學習只學會了如何模仿例子里的回答風格,但還沒有真正理解執(zhí)行指令的邏輯。0WQ28資訊網(wǎng)——每日最新資訊28at.com

指令跟隨任務相對還是比較復雜和開放的,沒那么容易掌握。0WQ28資訊網(wǎng)——每日最新資訊28at.com

想讓 AI 助手更“聽話”,暫時還是很難有捷徑可走。0WQ28資訊網(wǎng)——每日最新資訊28at.com

論文地址:0WQ28資訊網(wǎng)——每日最新資訊28at.com

https://arxiv.org/abs/2405.198740WQ28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:0WQ28資訊網(wǎng)——每日最新資訊28at.com

[1]https://x.com/maksym_andr/status/17965742978943181360WQ28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:夢晨0WQ28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-4512-0.htmlOpenAI 把 GPT-4 原始版給了瑞士洛桑聯(lián)邦理工團隊:研究不微調(diào)只靠提示詞能走多遠

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Zoom 創(chuàng)始人談視頻會議未來:數(shù)字人“代勞”參會,本人可抽出時間陪伴家人

下一篇: “全球首創(chuàng)”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

標簽:
  • 熱門焦點
  • 《從營銷AIGC化到AIGC營銷化》報告發(fā)布

    來源:清元宇宙7月2日上午,清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中,清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
  • 數(shù)字虛擬人23年最新變化!

    作者:小資來源:米塔之家自2021年元宇宙“爆炸”后,作為現(xiàn)實世界連接元宇宙的媒介之一,大批虛擬人跑步入場。到了2022年底,據(jù)天眼查數(shù)據(jù)顯示,我國目前企業(yè)名稱或經(jīng)營范圍
  • 2022年中國元宇宙產(chǎn)業(yè)系列研究報告-基礎設施篇(5)

    傳感器是由敏感元件和轉(zhuǎn)換元件構成,能夠感受規(guī)定的檢測量(物理量、化學量、生物量等),并按照一定規(guī)律將檢測量轉(zhuǎn)化成可用的輸出信號的器件和裝置,進而滿足信息的
  • 借VR產(chǎn)業(yè)東風,江西搶灘布局“元宇宙”

    自2016年起就在VR上傾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口,使人們可以在數(shù)字空間和物理空間自由穿梭。自2016年起
  • 頭像類NFTs的統(tǒng)治能持續(xù)多久?

    在過去的一兩年里,NFTs在互聯(lián)網(wǎng)世界中掀起了一場風暴。今天,當我們想到NFTs時,我們主要想到的是那些充斥著我們的社交媒體屏幕的數(shù)字卡通--無聊猿、punks 和介于
  • FTX 加密貨幣交易所開始向游戲公司提供加密服務

    據(jù)媒體報道,業(yè)內(nèi)領先的加密貨幣交易所FTX宣布將涉足游戲領域。該公司表示,計劃推出自己的游戲部門作為中介,專注于為傳統(tǒng)游戲公司提供加密相關服務。此舉將有助于
  • 元宇宙的應用行業(yè)研究:娛樂可能是元宇宙落地最快的場景之一

    近日,畢馬威正式發(fā)布其《初探元宇宙》報告,這也是畢馬威在元宇宙領域發(fā)布的首份報告。報告指出,元宇宙在以下十個領域的應用場景尤其值得期待,包括娛樂、社交、零
  • 淺聊DAO圖景和未來

    DAO是什么?DAO (Decentralized Autonomous Organizations),去中心化自治組織,是基于區(qū)塊鏈技術,由社區(qū)通過透明的決策過程運行和管理的組織形態(tài)。DAO使得社區(qū)成為
  • 超級賬本Julian Gordon:聯(lián)盟鏈與公鏈的競爭不是非此即彼

    在2021年《福布斯》區(qū)塊鏈50強榜單中,29家企業(yè)使用Hyperledger超級賬本技術,占比近60%。同年,研究機構Blockdata發(fā)布了的調(diào)查報告顯示,訪問Top100上市公司中,有 81

相關資訊

    SQL Error: select * from ***_ecms_news11 where id in(267,216,62,3,152,) limit 6
Top