AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 科技  > 知識百科

終于不瞎編了!AI學(xué)會“谷歌一下”,Q&A正確率達(dá)90%

來源: 責(zé)編: 時(shí)間:2023-08-07 16:30:02 258觀看
導(dǎo)讀 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。語言模型總是給出“驢唇不對馬嘴”的答案,已經(jīng)成為它最飽受詬病的問題之一?,F(xiàn)在,DeepMind想到了一

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。clh28資訊網(wǎng)——每日最新資訊28at.com

語言模型總是給出“驢唇不對馬嘴”的答案,已經(jīng)成為它最飽受詬病的問題之一。clh28資訊網(wǎng)——每日最新資訊28at.com

現(xiàn)在,DeepMind想到了一個(gè)解決辦法——clh28資訊網(wǎng)——每日最新資訊28at.com

讓模型像人類一樣,學(xué)會“谷歌一下”,回答問題同時(shí)還能給出論據(jù)。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

這個(gè)模型名叫GopherCite,當(dāng)你問它:clh28資訊網(wǎng)——每日最新資訊28at.com

GopherCite是如何找到論據(jù)來源的?clh28資訊網(wǎng)——每日最新資訊28at.com

它會回答:clh28資訊網(wǎng)——每日最新資訊28at.com

通過谷歌搜索檢索相關(guān)文檔。clh28資訊網(wǎng)——每日最新資訊28at.com

同時(shí)還給出了答案的依據(jù),援引自DeepMind發(fā)布這項(xiàng)研究的頁面。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

而且遇到實(shí)在不懂的問題,它還會說“I don’t know.”,不會強(qiáng)行給一個(gè)錯誤答案。clh28資訊網(wǎng)——每日最新資訊28at.com

訓(xùn)練結(jié)果顯示,該模型在自然問題數(shù)據(jù)集、ELI5數(shù)據(jù)集上的正確率分別可以達(dá)到90%、80%,接近人類水平。clh28資訊網(wǎng)——每日最新資訊28at.com

用強(qiáng)化學(xué)習(xí)訓(xùn)練AI查谷歌clh28資訊網(wǎng)——每日最新資訊28at.com

首先我們來看一下GopherCite的效果如何。clh28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)被問道:clh28資訊網(wǎng)——每日最新資訊28at.com

在Scooby Doo中,Scooby是什么動物?clh28資訊網(wǎng)——每日最新資訊28at.com

GopherCite回答道:clh28資訊網(wǎng)——每日最新資訊28at.com

一只大丹犬。clh28資訊網(wǎng)——每日最新資訊28at.com

摘自維基百科Scooby-Doo。這是周六早上播出的系列青少年動畫片,主角包括弗雷德·瓊斯等,以及一只名叫Scooby-Doo、會說話的大丹犬。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

不難看出,在學(xué)會找論據(jù)后,AI給出的回答靠譜多了。clh28資訊網(wǎng)——每日最新資訊28at.com

事實(shí)上,GopherCite的前輩——超大語言模型Gopher,此前回答問題時(shí)的表現(xiàn)就要差勁很多。clh28資訊網(wǎng)——每日最新資訊28at.com

Gopher是DeepMind在去年年底發(fā)布的NLP模型,包含2800億參數(shù)。clh28資訊網(wǎng)——每日最新資訊28at.com

它基于Transformer架構(gòu),在10.5TB大小的MassiveText語料庫上進(jìn)行訓(xùn)練。clh28資訊網(wǎng)——每日最新資訊28at.com

在這里,DeepMind舉了一個(gè)例子來說明。clh28資訊網(wǎng)——每日最新資訊28at.com

讓Gopher和GopherCite回答同一個(gè)問題:clh28資訊網(wǎng)——每日最新資訊28at.com

普萊西德湖一共舉辦過幾次冬奧會?clh28資訊網(wǎng)——每日最新資訊28at.com

Gopher回答(是錯的):clh28資訊網(wǎng)——每日最新資訊28at.com

普萊西德湖在1932年、1936年、1980年舉辦過冬奧會。clh28資訊網(wǎng)——每日最新資訊28at.com

但GopherCite就答對了:clh28資訊網(wǎng)——每日最新資訊28at.com

兩次。clh28資訊網(wǎng)——每日最新資訊28at.com

并給出了嚴(yán)謹(jǐn)?shù)睦碛桑?span style="display:none">clh28資訊網(wǎng)——每日最新資訊28at.com

援引自美國主辦奧運(yùn)會城市史。1932年、1980年在普萊西德湖舉辦過冬季奧運(yùn)會;1936年、1984年在洛杉磯舉辦過夏季奧運(yùn)會。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

那么GopherCite的具體工作原理是怎樣的呢?clh28資訊網(wǎng)——每日最新資訊28at.com

在Gopher的基礎(chǔ)上,研究人員開發(fā)了一種獎勵機(jī)制,也就是用上強(qiáng)化學(xué)習(xí)。clh28資訊網(wǎng)——每日最新資訊28at.com

在收到問題后,模型會訪問谷歌搜索的API來找到相關(guān)的網(wǎng)頁,獲取top-K結(jié)果。clh28資訊網(wǎng)——每日最新資訊28at.com

(top-K操作,即從分?jǐn)?shù)集合中找到k個(gè)最大或最小元素,是一個(gè)重要的機(jī)器學(xué)習(xí)模型組件,被廣泛用于信息檢索和數(shù)據(jù)挖掘中。)clh28資訊網(wǎng)——每日最新資訊28at.com

然后它會根據(jù)問題來生成一些答案,答案數(shù)量N會大于K。clh28資訊網(wǎng)——每日最新資訊28at.com

這些答案同時(shí)會帶有自己的證據(jù),即從網(wǎng)頁上搜索到的包含答案的文段。clh28資訊網(wǎng)——每日最新資訊28at.com

接下來,系統(tǒng)會對這些答案進(jìn)行打分,最終輸出得分最高的答案。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

在推理過程中,模型采樣會按照循環(huán)在文檔上不斷迭代,每個(gè)循環(huán)都會從單個(gè)文檔中盡可能多地顯示上下文內(nèi)容,然后對文本重新排序并返回給上一步。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

此外,這個(gè)模型還會計(jì)算最終生成答案的質(zhì)量,如果生成答案太差,它就會選擇不回答。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

這是源于紅牛的廣告語:“它會給你翅膀”。clh28資訊網(wǎng)——每日最新資訊28at.com

在ELI5Filtered數(shù)據(jù)集上回答70%的問題時(shí),正確率為80%左右。clh28資訊網(wǎng)——每日最新資訊28at.com

DeepMind表示這種訓(xùn)練模式和LaMDA有些類似。clh28資訊網(wǎng)——每日最新資訊28at.com

LaMDA是谷歌在去年I/O大會上發(fā)布的一個(gè)對話模型,它能夠在“聽懂”人類指令的基礎(chǔ)上,對答如流并保證邏輯、事實(shí)正確。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

不同的是,LaMDA有時(shí)會直接給人分享問題的相關(guān)鏈接,而GopherCite可以直接摘出相關(guān)論據(jù)文段。clh28資訊網(wǎng)——每日最新資訊28at.com

另外,OpenAI最近也開發(fā)了一個(gè)網(wǎng)頁版GPT (WebGPT),同樣也是用類似的方法來校正GPT-3。clh28資訊網(wǎng)——每日最新資訊28at.com

DeepMind表示,WebGPT是通過多次訪問網(wǎng)頁來組織答案,GopherCite則是側(cè)重于讀取長文段。clh28資訊網(wǎng)——每日最新資訊28at.com

還是會有失誤clh28資訊網(wǎng)——每日最新資訊28at.com

雖然懂得援引資料了,但是GopherCite有時(shí)還是會生搬硬套。clh28資訊網(wǎng)——每日最新資訊28at.com

比如當(dāng)你問它“喝了紅牛會怎么樣?”,它的回答是“翅膀”。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

這是源于紅牛的廣告語:“它會給你翅膀”。clh28資訊網(wǎng)——每日最新資訊28at.com

顯然讓它理解比喻還是有點(diǎn)困難……clh28資訊網(wǎng)——每日最新資訊28at.com

也有網(wǎng)友吐槽說,可能人類自己去谷歌搜索會更快。clh28資訊網(wǎng)——每日最新資訊28at.com

clh28資訊網(wǎng)——每日最新資訊28at.com

你覺得呢?clh28資訊網(wǎng)——每日最新資訊28at.com

 clh28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-119-2220-0.html終于不瞎編了!AI學(xué)會“谷歌一下”,Q&A正確率達(dá)90%

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 谷歌:性能不佳的微調(diào)模型不要扔,求一下平均權(quán)重就能提升性能

下一篇: 云計(jì)算開發(fā):Python3-List insert()方法詳解

標(biāo)簽:
  • 熱門焦點(diǎn)
Top