AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

中山大學團隊“梗王”大模型,靠講笑話登上 CVPR

來源: 責編: 時間:2024-04-15 18:07:35 239觀看
導讀 誰能想到,只是讓大模型講笑話,論文竟入選了頂會 CVPR(國際計算機視覺與模式識別會議)!沒開玩笑,這還真真兒的是一項正兒八經的研究。例如看下面這張圖,如果讓你根據它來講個笑話或梗,你會想到什么?現在的大模型看完后

誰能想到,只是讓大模型講笑話,論文竟入選了頂會 CVPR(國際計算機視覺與模式識別會議)!mcZ28資訊網——每日最新資訊28at.com

沒開玩笑,這還真真兒的是一項正兒八經的研究。例如看下面這張圖,如果讓你根據它來講個笑話或梗,你會想到什么?mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

現在的大模型看完后會說:mcZ28資訊網——每日最新資訊28at.com

腦子短路。mcZ28資訊網——每日最新資訊28at.com

再看一眼蜘蛛俠的海報,大模型會配一句“剛擦的玻璃不能弄臟”。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

李云龍、奧本海默也被玩得飛起:mcZ28資訊網——每日最新資訊28at.com

導師讀了我的論文之后……mcZ28資訊網——每日最新資訊28at.com

真男人不回頭看爆炸。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

還有醬紫的:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

不得不說,大模型這腦洞還是挺大的。mcZ28資訊網——每日最新資訊28at.com

這項研究正是來自中山大學 HCP 實驗室林倞教授團隊、Sea AI Lab 和哈佛大學等單位,主打的就是打破常規思維思考(Think Outside the Box),探索多模態大模型的創造力。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

要知道,同樣的圖要是“喂”給 ChatGPT(GPT-4)等主流大模型,讓它們講笑話或梗,畫風可并非如此:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

太正經了!So boring~~~~mcZ28資訊網——每日最新資訊28at.com

那么中山大學等單位的這個“梗王大模型”,是怎么煉成的呢?mcZ28資訊網——每日最新資訊28at.com

先讓大模型看搞笑的數據

在數據的選擇上,團隊 pick 的是來自日本的“大喜利”(Oogiri)創新響應游戲。mcZ28資訊網——每日最新資訊28at.com

“大喜利”本來是指一系列日本傳統戲劇游戲,隨著時代的快速發展。現代的“大喜利”,目前一般是指一種叫 Tonchi (頓智)的游戲,通常以游戲節目或智力問答節目的形式呈現。mcZ28資訊網——每日最新資訊28at.com

玩家被提供各種多模態內容,可以是簡單的問題、隨機圖像等,然后提示玩家想出幽默的、有創意的反應,以達到令人驚訝的喜劇效果。mcZ28資訊網——每日最新資訊28at.com

例如下面這個“圖文到文”的例子:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

玩家要求閱讀圖像,和上面對應的文字,嘗試想出一段文字填入對應的問號“?”位置,使得整個圖文可以展示出幽默且有創意的效果。mcZ28資訊網——每日最新資訊28at.com

在第一個例子中,老人向年輕人尋求幫助,從正常的思維來看,可能的填寫方式可以是“請問 xxx 路怎么走?”或者是“可以帶我回家嗎,我迷路了”之類的。mcZ28資訊網——每日最新資訊28at.com

然而,所給出的“你… 你能幫我解開手銬嗎?”的寫法具有沖擊感、幽默感,且看起來確實是這么一回事,讓人忍俊不禁。mcZ28資訊網——每日最新資訊28at.com

再看下“圖到文”的例子:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

玩家要求看圖配文,并使得圖文搭配起來具有幽默效果。mcZ28資訊網——每日最新資訊28at.com

這張圖看起來是一個很普通的拖車的圖片(需要注意的是,在“大喜利”游戲中,一般圖片都是很普通的日常圖片)。mcZ28資訊網——每日最新資訊28at.com

配文“快讓開!我的兄弟傷得很嚴重”讓傾斜著身體 45° 向上的車看起來像是一個奄奄一息的車子;在道路上快速的馳騁也確實體現了位于下方的車很著急,急著送兄弟去醫院。mcZ28資訊網——每日最新資訊28at.com

還有第三種“文到文”的例子:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

玩家被要求根據所給的文字進行回復,使得回復和問題合在一起具備幽默感。mcZ28資訊網——每日最新資訊28at.com

這個例子中的回復似乎在調侃程序員的日常工作主要就是代碼的“復制 + 粘貼”(注:CV 工程師除了可以表示 computer vision 工程師也可以表示 ctrl+c / ctrl+v 工程師 )。mcZ28資訊網——每日最新資訊28at.com

這項工作主要關注的就是這三種類型的“大喜利”游戲,相關數據 Oogiri-GO如下表所示,含中英日三種語言:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

至于為什么要選擇“大喜利”這個游戲,是因為團隊認為它是用于探索多模態大模型創新能力的理想平臺。具體原因如下:mcZ28資訊網——每日最新資訊28at.com

“大喜利”游戲是天然的創新響應任務。如上所提到的,現代“大喜利”也被稱為 Tonchi (頓智)。“頓”在日文和中文中都表示“突然”,而“智”的意思是“智力、洞察力或直覺”,該游戲天然地要求玩家給出令人眼前一亮、靈光一閃的創新響應;mcZ28資訊網——每日最新資訊28at.com

“大喜利”的數據格式是高度合適的。不管是“圖文到文”、“圖到文”還是“文到文”,這些類型都天然地和目前多模特大模型的輸入輸出格式吻合,即輸入為“圖文”,輸出僅為“文”。mcZ28資訊網——每日最新資訊28at.com

“大喜利”數據質量高。創新是一件很難的事情,即使是人類,因此能作為“創新”相關的數據集并不多。鑒于該游戲長期在互聯網上非常活躍(在中文社區中,一般也叫日式神吐槽 / 冷吐槽),而且帶有大量點評數據,比如點贊數等等。正好積累了大量高質量人類創新幽默響應可以被用于研究。mcZ28資訊網——每日最新資訊28at.com

再讓大模型打破常規思考

傳統的鏈式思考(Chain-of-Thought,CoT)方法是一種順序思考過程,通過逐步推理指導大模型進行邏輯推理,每個后續的思考都建立在前一個思考的基礎上:mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

這一思考過程一定程度上確保了精確性和嚴謹性,但對于創造性問題表現不佳。mcZ28資訊網——每日最新資訊28at.com

因此,團隊探索了一種新的非順序、創造性思維范式 —— 跳躍思維 Leap-of-Thought(LoT)。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

這種范式涉及到思考關聯性和知識跳躍。遠距離的思考也被認為是聯想。mcZ28資訊網——每日最新資訊28at.com

與 CoT 強調邏輯緊密的思維鏈不同,LoT 強調打破常規思維思考問題,激發模型的創造力。mcZ28資訊網——每日最新資訊28at.com

基于此,團隊在 Oogiri-GO 數據集基礎之上,進一步提出了一套激發多模態大模型創造力的訓練方法 CLoT。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

具體而言,CLoT 包括兩個階段。mcZ28資訊網——每日最新資訊28at.com

首先是關聯性指令微調。mcZ28資訊網——每日最新資訊28at.com

在這一階段,本文設計生成式和判別式模板,將 Oogiri-GO 數據集轉換為指令微調的訓練數據,用于訓練多模態大模型,使得模型具備初步的創新響應能力。mcZ28資訊網——每日最新資訊28at.com

其次是探索性自我調整。mcZ28資訊網——每日最新資訊28at.com

在這一階段中,本文首先通過設計遠關聯的條件詞,促使(1)中的模型生成多樣化且與輸入遠關聯的回答,并設計篩選流程,獲得可靠的新 LoT 數據。隨后,新數據被轉換成指令微調的訓練數據,用于進一步微調模型。mcZ28資訊網——每日最新資訊28at.com

這一階段可以再細分為兩個步驟:mcZ28資訊網——每日最新資訊28at.com

探索性遠程關聯:這一步驟鼓勵 LLM 在給定的弱關聯條件下產生創新的回應。通過這種方式,LLM 學習在看似不相關的概念之間建立聯系,從而生成多樣化的創意內容。mcZ28資訊網——每日最新資訊28at.com

自我精煉:在探索性遠程關聯的基礎上,通過設計一系列篩選流程,收集到的創意回應被用來進一步訓練 LLM。這樣做可以提高 LLM 在處理創造性任務時的表現,使其能夠生成更高質量和多樣性的內容。mcZ28資訊網——每日最新資訊28at.com

性能評估

為了盡可能全面評估 CLoT,這項研究基于 Oogiri-GO 數據集,設計了選擇題和排序題作為量化評估方式。mcZ28資訊網——每日最新資訊28at.com

實驗結果表明,CLoT 能夠顯著提高多模態大模型(如 Qwen 和 CogVLM)的性能,顯著超越包括 GPT4v 在內的先進模型。mcZ28資訊網——每日最新資訊28at.com

另外,與其他先進推理框架 CoT 等相比,在各項量化指標下也是有顯著優勢的。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

此外,研究團隊還通過用戶調查,證實了 CLoT 幫助模型生成了更好的幽默內容。mcZ28資訊網——每日最新資訊28at.com

mcZ28資訊網——每日最新資訊28at.com

研究團隊還考慮到了 CLoT 的泛化性,用“看云猜物 CGG”和“發散思維測試 DAT”兩個其他任務評估 CLoT 的性能,實驗結果顯示 CLoT 相對于基準模型具有更好的準確度,說明 CLoT 具備不錯的泛化能力。mcZ28資訊網——每日最新資訊28at.com

DAT 是一種用于評估人類聯想創造能力的測試。mcZ28資訊網——每日最新資訊28at.com

團隊介紹

中山大學人機物智能融合實驗室 (HCP Lab) 由林倞教授于 2010 年創辦,近年來在多模態內容理解、因果及認知推理、具身學習等方面取得豐富學術成果,數次獲得國內外科技獎項及最佳論文獎,并致力于打造產品級的 AI 技術及平臺。mcZ28資訊網——每日最新資訊28at.com

論文:https://arxiv.org/ abs / 2312.02439mcZ28資訊網——每日最新資訊28at.com

Project:https://zhongshsh.github.io/CLoT/mcZ28資訊網——每日最新資訊28at.com

Code:https://github.com/sail-sg/CLoTmcZ28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:關注前沿科技mcZ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3991-0.html中山大學團隊“梗王”大模型,靠講笑話登上 CVPR

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 國家網信辦發布第五批深度合成服務算法備案信息,理想汽車 MindGPT 等 394 個算法在列

下一篇: 報告:79.8% 受訪美國公民希望對人工智能實施嚴格法律監管

標簽:
  • 熱門焦點
  • FMIFAwards獎項即將揭曉!

    來源:X增強現實FMIF Awards未來元宇宙創新獎是由未來元宇宙創新論壇、ARinChina以及多家投資機構、媒體、研究院聯合發起的一項評選活動。旨在推動新技術的融合與集成低成本
  • 【東方證券】虛擬世界照進現實,元宇宙中有什么? | 元宇宙Meta洞見

    元宇宙的表現形式大多以游戲為起點,并逐漸整合互聯網、數字化娛樂、社交網絡等功能,長期來看甚至可以整合社會經濟與商業活動。元宇宙的發展最關鍵的部分在于元
  • 城市數字孿生標準化白皮書(2022版)

    當前,城市數字孿生已經發展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯,實
  • 以太坊升級將會帶來的5個改變

    以太坊自2015年誕生以來就廣受歡迎,但最近其昂貴的交易費用和低可擴展性對執行復雜的應用程序產生了負面作用,用戶對以太坊改進的需求也日益急迫。以太坊2.0已進
  • 吸金31億美元,誰在催火2021年的鏈游?

    2021年究竟發生了什么,才使得鏈游領域在這年一飛沖天?作者:廖羽2022年2月16日,Invest Game發布《2021年全球游戲投資報告》,報告顯示,游戲行業的投資重點正在向區塊
  • 小眾有趣NFT藝術作品欣賞(1)

    隨著NFT發展火熱,越來越多領域與NFT融合,NFT藝術在加密領域中占據了很大一部分。NFT藝術與傳統藝術有相似之處,也有完全不同的地方。NFT藝術與傳統藝術一樣,表現了
  • 用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

    你可能聽說過不可偽造的代幣,或NFTs。NFTs是數字代幣,代表完全獨特的項目的所有權;存儲在區塊鏈中并可追蹤,它們不能被修改、替換或復制。作為NFT鑄造的資產在數字
  • 百度虛擬人——AI手語主播首次亮相冬奧會!

    除了火遍全國的冰墩墩,虛擬人也成為這屆冬奧會的一大亮點元素。以體育明星谷愛凌為原型的數智人Meet Gu最先亮相。在2月5日谷愛凌首秀、2月7日谷愛凌首金的兩天
  • 冬奧會數字收藏品升溫,市場再現“一墩難求”

    根據公開信息顯示,國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售,總數為500個,每個99美元,每人限購5個。此外,不同的奧運徽章數字藏
Top