AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

弱智吧竟成最佳中文 AI 訓(xùn)練數(shù)據(jù)?中科院等:8 項(xiàng)測試第一,遠(yuǎn)超知乎豆瓣小紅書

來源: 責(zé)編: 時(shí)間:2024-04-09 17:17:48 172觀看
導(dǎo)讀 離大譜了,弱智吧登上正經(jīng) AI 論文,還成了最好的中文訓(xùn)練數(shù)據(jù)??具體來說,使用弱智吧數(shù)據(jù)訓(xùn)練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺(tái),甚至是研究團(tuán)隊(duì)精心挑選的數(shù)據(jù)集。在問答、頭腦風(fēng)暴、分類、生成、總結(jié)

離大譜了,弱智吧登上正經(jīng) AI 論文,還成了最好的中文訓(xùn)練數(shù)據(jù)??n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

具體來說,使用弱智吧數(shù)據(jù)訓(xùn)練的大模型,跑分超過百科、知乎、豆瓣、小紅書等平臺(tái),甚至是研究團(tuán)隊(duì)精心挑選的數(shù)據(jù)集。n7l28資訊網(wǎng)——每日最新資訊28at.com

在問答、頭腦風(fēng)暴、分類、生成、總結(jié)、提取等 8 項(xiàng)測試中取得最高分。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

沒錯(cuò),論文中的 Ruozhiba 就是指百度貼吧弱智吧,一個(gè)充滿荒謬、離奇、不合常理發(fā)言的中文社區(qū),畫風(fēng)通常是這樣的:n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

最離譜的是,弱智吧 AI 代碼能力也超過了使用專業(yè)技術(shù)問答社區(qū)思否數(shù)據(jù)訓(xùn)練的 AI,這下吧友自己都鬧不明白了。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

其他平臺(tái)圍觀網(wǎng)友也紛紛蚌埠住。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

這項(xiàng)研究來自中科院深圳先進(jìn)技術(shù)研究院、中科院自動(dòng)化研究所,滑鐵盧大學(xué)等眾多高校、研究機(jī)構(gòu)聯(lián)合團(tuán)隊(duì)。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

作者之一也現(xiàn)身評論區(qū),透露使用弱智吧數(shù)據(jù)訓(xùn)練 AI 屬于靈機(jī)一動(dòng),以前只用來測試。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

弱智吧數(shù)據(jù)究竟如何達(dá)成這一成就,具體到論文中看。n7l28資訊網(wǎng)——每日最新資訊28at.com

弱智發(fā)言成指令微調(diào)神器

這項(xiàng)研究起初為解決中文大模型訓(xùn)練中的諸多問題:n7l28資訊網(wǎng)——每日最新資訊28at.com

中文數(shù)據(jù)集很多是從英文翻譯過來的,沒有很好地契合中文的語言習(xí)慣和文化背景n7l28資訊網(wǎng)——每日最新資訊28at.com

不少數(shù)據(jù)集是用 AI 生成的,質(zhì)量難以保證,容易出現(xiàn)事實(shí)性錯(cuò)誤n7l28資訊網(wǎng)——每日最新資訊28at.com

即使是人工標(biāo)注的數(shù)據(jù)集,也存在數(shù)據(jù)量小、覆蓋領(lǐng)域不全面等問題n7l28資訊網(wǎng)——每日最新資訊28at.com

為了解決這些痛點(diǎn),團(tuán)隊(duì)從中文互聯(lián)網(wǎng)的各種知識(shí)源頭直接收集數(shù)據(jù),比如知乎、豆瓣、百科、小紅書等,經(jīng)過一系列嚴(yán)格的清洗和人工審核,打造成高質(zhì)量、多樣化的中文指令微調(diào)數(shù)據(jù)集 COIG-CQIA。n7l28資訊網(wǎng)——每日最新資訊28at.com

除了探索不同數(shù)據(jù)源的作用,團(tuán)隊(duì)還專門從中抽取出一個(gè)精華子集 CQIA-Subset。n7l28資訊網(wǎng)——每日最新資訊28at.com

在眾多數(shù)據(jù)來源中,弱智吧成了最特別的一個(gè)。n7l28資訊網(wǎng)——每日最新資訊28at.com

由 500 個(gè)點(diǎn)贊最高的帖子標(biāo)題 + 人工或 GPT-4 的回復(fù)組成指令微調(diào)數(shù)據(jù)集,經(jīng)過人工審核后,最終留下了 240 組指令-回復(fù)數(shù)據(jù)對。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

分別用各種數(shù)據(jù)集訓(xùn)練零一萬物 Yi 系列開源大模型,在 BELLE-Eval 測試集上使用 GPT-4 評分得到結(jié)果。n7l28資訊網(wǎng)——每日最新資訊28at.com

在規(guī)模較小的 Yi-6B 模型上,純?nèi)踔前砂姹究偡峙琶谌€不算太突出。n7l28資訊網(wǎng)——每日最新資訊28at.com

看來小模型還沒能領(lǐng)悟弱智的精髓。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

到了 Yi-34B,弱智吧版本表現(xiàn)就一騎絕塵了。n7l28資訊網(wǎng)——每日最新資訊28at.com

只有在改寫和數(shù)學(xué)任務(wù)上沒能取得最高分,但成績也比較靠前。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

另外,在安全評估上弱智吧版本也能排上第二。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

對于這類現(xiàn)象,研究人員在分析中也給出簡單猜測:n7l28資訊網(wǎng)——每日最新資訊28at.com

可能是弱智吧問題增強(qiáng)了 AI 的邏輯推理能力,從而使指令遵循任務(wù)受益。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)然弱智吧并不是這項(xiàng)研究的全部,它的真正貢獻(xiàn)在于為中文大模型開發(fā)提供了一個(gè)高質(zhì)量的指令微調(diào)數(shù)據(jù)集 COIG-CQIA。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

通過對各種中文互聯(lián)網(wǎng)數(shù)據(jù)源的探索,這項(xiàng)研究為構(gòu)建中文指令數(shù)據(jù)集提供了很多有益的啟示。比如社交媒體數(shù)據(jù)雖然開放多樣,但也存在不少有害信息風(fēng)險(xiǎn);而百科類數(shù)據(jù)專業(yè)性強(qiáng),但覆蓋面可能不夠廣。n7l28資訊網(wǎng)——每日最新資訊28at.com

弱智吧上大分

這項(xiàng)研究一發(fā),網(wǎng)友集體笑不活。除了“XSWL、思路開闊了”這樣的純圍觀,也有網(wǎng)友認(rèn)真討論起了弱智吧有如此奇效的原因。n7l28資訊網(wǎng)——每日最新資訊28at.com

大伙兒都比較認(rèn)可的一個(gè)原因是弱智吧題目的“異質(zhì)”。n7l28資訊網(wǎng)——每日最新資訊28at.com

像腦筋急轉(zhuǎn)彎,增加了指令多樣性,所以提升了模型最終性能:n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

通用數(shù)據(jù)集多半已經(jīng)在 pretrain 階段見過了,再訓(xùn)一遍只會(huì)加重 overfitting。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

另一個(gè)原因是弱智吧數(shù)據(jù)文本質(zhì)量很高,用詞準(zhǔn)確且簡潔。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

千言萬語匯成一句話:把弱智吧只當(dāng)簡單的段子合集真的是嚴(yán)重低估了它的價(jià)值!n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

雀食,要不此前弱智吧問題也經(jīng)常被大伙兒用來測試大模型呢。n7l28資訊網(wǎng)——每日最新資訊28at.com

事實(shí)上從 ChatGPT 誕生之初,弱智吧就深度參與了大模型的發(fā)展,可以算是這一波 AI 浪潮的重要見證者了。n7l28資訊網(wǎng)——每日最新資訊28at.com

一開始只是網(wǎng)友拿來拷打 AI,搞搞節(jié)目效果。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

后來大家發(fā)現(xiàn),弱智吧問題中充滿陷阱,剛好可以用來分辨 AI 能力高低。n7l28資訊網(wǎng)——每日最新資訊28at.com

還記得 23 年初那會(huì)兒,各家大模型第一版還不太能很好應(yīng)對這類問題,如 2023 年 3 月的文心一言:n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

后續(xù)版本也漸入佳境了,如 2023 年 8 月的文心一言:n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

直到今天,弱智吧問題都是每個(gè)新發(fā)布大模型都必須要過的一關(guān),被戲稱為弱智吧 Benchmark。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

▲秘塔寫作貓

n7l28資訊網(wǎng)——每日最新資訊28at.com

▲Inspo

再后來,AI 公司們自己也開始重視起來,如百度官方就搞過聯(lián)動(dòng)直播。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)初網(wǎng)友為了調(diào)戲大模型專門搜集的弱智吧問題測試集,沒想到有一天也能搖身一變,成了訓(xùn)練集。n7l28資訊網(wǎng)——每日最新資訊28at.com

n7l28資訊網(wǎng)——每日最新資訊28at.com

思路確實(shí)是被打開了~n7l28資訊網(wǎng)——每日最新資訊28at.com

論文地址:n7l28資訊網(wǎng)——每日最新資訊28at.com

https://arxiv.org/abs/2403.18058n7l28資訊網(wǎng)——每日最新資訊28at.com

參考鏈接:n7l28資訊網(wǎng)——每日最新資訊28at.com

[1]https://x.com/9hills/status/1775358963724554410n7l28資訊網(wǎng)——每日最新資訊28at.com

[2]https://zhuanlan.zhihu.com/p/690640864n7l28資訊網(wǎng)——每日最新資訊28at.com

[3]https://tieba.baidu.com/p/8964992247n7l28資訊網(wǎng)——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:夢晨 西風(fēng)n7l28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3906-0.html弱智吧竟成最佳中文 AI 訓(xùn)練數(shù)據(jù)?中科院等:8 項(xiàng)測試第一,遠(yuǎn)超知乎豆瓣小紅書

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 新動(dòng)態(tài):改善微調(diào) API,擴(kuò)展定制模型計(jì)劃

下一篇: 馬斯克:特斯拉大模型Grok 2.0版本的性能將好于ChatGPT-4

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 數(shù)字人的AB面:在元宇宙中過氣,在AIGC中重生

    來源:光錐智能作者:郝 鑫“29800元一年的虛擬主播,號稱24小時(shí)不停播,月入十幾萬,實(shí)際上卻是關(guān)鍵詞都不能回復(fù),播了半個(gè)月,直播間還因違規(guī)被快手封禁,最終投訴無門、退款無果。&
  • 虛擬人再升級,企業(yè)可以解放雙手了?

    來源:伯虎財(cái)經(jīng)今天想跟大家來嘮嘮AI,其實(shí)聊到這個(gè)話題很多人都不陌生了。在ChatGPT和AIGC大熱背后,還有一位低調(diào)的“大佬”——虛擬人。比如咱們熟知的虛
  • 元宇宙社交啫喱、希壤爆款迭出,騰訊慌了嗎?

    文 | 陳橋輝沒想到騰訊超級QQ秀的20周年歸來首秀,被一款名不見經(jīng)傳的產(chǎn)品搶了風(fēng)頭。1月15日,一款名為“啫喱”的社交App迅速在各個(gè)互聯(lián)網(wǎng)的社交圈內(nèi)火爆起來,引起
  • 高通成立歐洲XR實(shí)驗(yàn)室;ICICB計(jì)劃進(jìn)軍元宇宙......

    擴(kuò)展現(xiàn)實(shí)(XR)通過計(jì)算機(jī)將真實(shí)與虛擬相結(jié)合,打造了一個(gè)可人機(jī)交互的虛擬環(huán)境,將AR、VR、MR多種技術(shù)相融合,為體驗(yàn)者帶來了虛擬世界與現(xiàn)實(shí)世界之間無縫轉(zhuǎn)換的“沉浸
  • 頂流IP“冰墩墩”帶著中國元素NFT進(jìn)入全球視野

    一場被國際奧委會(huì)主席評價(jià)堪稱獨(dú)具匠心、非凡卓越的2022年北京冬季奧運(yùn)會(huì),在這個(gè)“雙奧之城”經(jīng)歷了16個(gè)令人難忘的精彩日夜,最終圓滿閉幕。讓我們印象深刻的不
  • 「國產(chǎn)良心」NFT嘲諷了誰?

    2月23日,一個(gè)名為「國產(chǎn)良心」的NFT項(xiàng)目被許多活躍的加密用戶注意到。該項(xiàng)目的官網(wǎng)風(fēng)格尤為「不正經(jīng)」,它絲毫沒有避諱自己的小作坊出身,還將「中國人不騙中國人
  • 知識(shí)產(chǎn)權(quán)可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點(diǎn):一些公司開始采取積極的方式來保護(hù)他們在元宇宙的知識(shí)產(chǎn)權(quán)。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識(shí)產(chǎn)權(quán)。Inside
  • 融資千萬美元的元宇宙平臺(tái)UGC到底是什么?

    據(jù)獲悉,全球化元宇宙社交平臺(tái)BUD Technologies, Inc.(以下簡稱“BUD”)宣布完成1500萬美元A+輪融資,本輪融資由啟明創(chuàng)投領(lǐng)投,老股東源碼資本、GGV紀(jì)源資本、云九資
  • 從概念到落地 Web3.0初具雛形

    加密資產(chǎn)熱潮催生出的鏈上應(yīng)用中,除了DeFi、NFT、鏈游GameFi等場景外,還有一個(gè)熱詞叫「Web3.0」。Web3.0的概念最早出現(xiàn)在2014年,由以太坊聯(lián)合創(chuàng)始人及波卡創(chuàng)建者
Top