AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

整合海量公共數(shù)據(jù),谷歌開源 AI 統(tǒng)計(jì)學(xué)專家 DataGemma

來源: 責(zé)編: 時(shí)間:2024-10-06 09:27:05 66觀看
導(dǎo)讀 準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù)、時(shí)效性強(qiáng)的信息,一直是大語言模型產(chǎn)生幻覺的重災(zāi)區(qū)。知識是現(xiàn)成的,但學(xué)是不可能學(xué)的。并非此身惰怠,只因現(xiàn)實(shí)太多阻礙。對于這個(gè)問題,谷歌在近日推出了自己籌劃已久的大型數(shù)據(jù)庫 Data Commons,以

準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù)、時(shí)效性強(qiáng)的信息,一直是大語言模型產(chǎn)生幻覺的重災(zāi)區(qū)。SHX28資訊網(wǎng)——每日最新資訊28at.com

知識是現(xiàn)成的,但學(xué)是不可能學(xué)的。并非此身惰怠,只因現(xiàn)實(shí)太多阻礙。SHX28資訊網(wǎng)——每日最新資訊28at.com

對于這個(gè)問題,谷歌在近日推出了自己籌劃已久的大型數(shù)據(jù)庫 Data Commons,以及在此基礎(chǔ)上誕生的大模型 DataGemma。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

論文地址:https://docs.datacommons.org/papers/DataGemma-FullPaper.pdfSHX28資訊網(wǎng)——每日最新資訊28at.com

Data Commons 是一個(gè)龐大的開源公共統(tǒng)計(jì)數(shù)據(jù)存儲庫,包含來自聯(lián)合國(UN)、疾病控制與預(yù)防中心(CDC)、人口普查局、衛(wèi)生部、環(huán)境機(jī)構(gòu)、經(jīng)濟(jì)部門、非政府組織和學(xué)術(shù)機(jī)構(gòu)等可信來源的大量統(tǒng)計(jì)數(shù)據(jù)。SHX28資訊網(wǎng)——每日最新資訊28at.com

目前,整個(gè)語料庫包含超過 2500 億個(gè)數(shù)據(jù)點(diǎn)和超過 2.5 萬億個(gè)三元組。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)有了,模型要怎么處理?本文提出了一種將 LLM 橋接到數(shù)據(jù)的通用架構(gòu),并探討了需要解決的三個(gè)問題。SHX28資訊網(wǎng)——每日最新資訊28at.com

首先,LLM 必須學(xué)會在適當(dāng)?shù)臅r(shí)機(jī)選擇,是使用存儲在模型參數(shù)中的知識,還是從外部獲取信息。SHX28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)然了,關(guān)于何時(shí)查詢外部源這件事,需要 LLM 學(xué)到自己的參數(shù)里,這可以采用多種機(jī)制來實(shí)現(xiàn)。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

其次,需要決定應(yīng)該從哪個(gè)外部源查詢所需的信息,因?yàn)榭捎玫男畔⒃纯赡芎芏喽沂莿討B(tài)的。在本文中,作者直接使用單一外部信息源來包含大量數(shù)據(jù)源。SHX28資訊網(wǎng)——每日最新資訊28at.com

最后,一旦明確了需要哪些外部數(shù)據(jù),LLM 就需要生成一個(gè)或多個(gè)查詢來獲取這些數(shù)據(jù)。SHX28資訊網(wǎng)——每日最新資訊28at.com

一般來說,不同的來源會產(chǎn)生不同類型的數(shù)據(jù),如果 LLM 還要專門去學(xué)習(xí)各種 API 就有點(diǎn)麻煩了。因此,作者開發(fā)了用于外部數(shù)據(jù)和服務(wù)的單一通用 API。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

API 的靈感來自于 Robert McCool 在 1993 年設(shè)計(jì)的 URL 參數(shù)編碼接口,雖然簡單,卻經(jīng)受住了時(shí)間的考驗(yàn),是目前在網(wǎng)絡(luò)上最接近通用 API 的接口。SHX28資訊網(wǎng)——每日最新資訊28at.com

作者使用自然語言來表達(dá)查詢,返回的答案可以用 mime-type 來增強(qiáng),以允許非文本答案。SHX28資訊網(wǎng)——每日最新資訊28at.com

搞定了這些,一個(gè)能夠充分利用最新最全外部數(shù)據(jù)的「AI 統(tǒng)計(jì)學(xué)家」(或者叫統(tǒng)計(jì)學(xué)魔術(shù)師)就誕生了。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

DataGemma

對于 Data Commons 這么龐大的數(shù)據(jù)源,想要被 LLM 正常使用,需要面對一些現(xiàn)實(shí)的挑戰(zhàn):SHX28資訊網(wǎng)——每日最新資訊28at.com

1. 與統(tǒng)計(jì)事實(shí)相關(guān)的用戶查詢可能涉及一系列邏輯、算術(shù)或比較運(yùn)算。SHX28資訊網(wǎng)——每日最新資訊28at.com

比如「世界上排名前 5 的二氧化碳排放國是哪些國家?」;更復(fù)雜一點(diǎn)的比如「加利福尼亞州是世界上最大的經(jīng)濟(jì)體嗎?」(這里面暗含了所比較的實(shí)體 —— 加利福尼亞州與其他國家 / 地區(qū)相比,而不是美國各州);或者「煤發(fā)電量高的美國各州,慢性阻塞性肺病發(fā)病率也很高嗎?」(這涉及到實(shí)體和指標(biāo)之間的比較)。SHX28資訊網(wǎng)——每日最新資訊28at.com

2. 公共統(tǒng)計(jì)數(shù)據(jù)包含多種模式和格式,通常需要相當(dāng)多的背景上下文才能正確解釋。SHX28資訊網(wǎng)——每日最新資訊28at.com

之前的工作利用了兩種方法來緩解這些問題:使用工具和檢索增強(qiáng)生成(RAG)。SHX28資訊網(wǎng)——每日最新資訊28at.com

前一種方法會調(diào)整 LLM 來生成一種標(biāo)記語言,能夠?qū)⒆匀晃谋九c對外部工具的函數(shù)調(diào)用穿插在一起。為了對抗幻覺,工具可能會查詢數(shù)據(jù)庫或搜索引擎。SHX28資訊網(wǎng)——每日最新資訊28at.com

而在 RAG 中,輔助檢索系統(tǒng)從大型語料庫中識別與用戶查詢相關(guān)的背景知識,然后用這些知識來增強(qiáng)用戶的查詢。SHX28資訊網(wǎng)——每日最新資訊28at.com

本文作者以谷歌開源的 Gemma 和 Gemma-2 模型為基礎(chǔ),分別利用檢索交錯(cuò)生成(RIG)和 RAG 微調(diào)出兩個(gè)新的版本。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

開源模型:https://huggingface.co/collections/google/datagemma-release-66df7636084d2b150a4e6643SHX28資訊網(wǎng)——每日最新資訊28at.com

數(shù)據(jù)共享

Data Commons 的數(shù)據(jù)共享涉及兩項(xiàng)創(chuàng)新。SHX28資訊網(wǎng)——每日最新資訊28at.com

首先,研究人員花了數(shù)年時(shí)間訪問大量公開可用的數(shù)據(jù)集,追蹤數(shù)據(jù)背后的假設(shè),并使用 Schema.org(一種用于編碼結(jié)構(gòu)化數(shù)據(jù)的開放詞匯表)對它們進(jìn)行規(guī)范化,最終形成了一個(gè)包含所有數(shù)據(jù)的通用知識圖譜。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

其次,研究人員使用 LLM 創(chuàng)建一個(gè)自然語言界面,允許用戶用通用語言提出問題,并通過圖表等方式來探索龐大的數(shù)據(jù)庫。SHX28資訊網(wǎng)——每日最新資訊28at.com

需要明確的是,LLM 只是將查詢轉(zhuǎn)換為 Data Commons 中的詞匯表,不會與底層數(shù)據(jù)交互,也不會生成輸出,因此不必?fù)?dān)心出現(xiàn)幻覺之類的問題。SHX28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)前的方法是利用這個(gè)自然語言接口,教導(dǎo) LLM 何時(shí)以及如何與 Data Commons 的接口進(jìn)行通信。SHX28資訊網(wǎng)——每日最新資訊28at.com

對齊方面,作者采用 LIMA(一種指令調(diào)整和強(qiáng)化學(xué)習(xí)方法),遵循少即是多的原則,利用數(shù)量少但質(zhì)量很高的一組示例,使最終任務(wù)與用戶偏好保持一致。SHX28資訊網(wǎng)——每日最新資訊28at.com

RIG 與 RAG

接下來介紹將 LLM 與 Data Commons 連接的兩種不同方法:SHX28資訊網(wǎng)——每日最新資訊28at.com

RIGSHX28資訊網(wǎng)——每日最新資訊28at.com

檢索交錯(cuò)生成 (RIG),是一種受使用工具啟發(fā)的方法,將 LLM 進(jìn)行微調(diào)以生成自然語言數(shù)據(jù)共享查詢,然后,多模型管道將此查詢轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)查詢,用于從 Data Commons 數(shù)據(jù)庫檢索答案。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

如上圖所示,這里擴(kuò)展了 RIG 管道的步驟。首先是經(jīng)過微調(diào)以生成自然語言查詢的模型;接著是后處理器,將自然語言查詢轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)查詢;最后一個(gè)組件是查詢機(jī)制,從 Data Commons 檢索統(tǒng)計(jì)答案并使用 LLM 生成。SHX28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)向 LLM 提出統(tǒng)計(jì)查詢時(shí),通常會生成包含數(shù)字答案的文本(如下圖所示)。這時(shí)可以根據(jù)數(shù)字(LLM-SV)相關(guān)的上下文,在 Data Commons 數(shù)據(jù)庫中匹配最相關(guān)的值(DC-SV),作為事實(shí)檢查機(jī)制一起返回給用戶。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

研究人員選擇了大約 700 個(gè)用戶查詢(對應(yīng)不同的統(tǒng)計(jì)問題)。SHX28資訊網(wǎng)——每日最新資訊28at.com

對于每個(gè)問題,都會從基本模型中選擇帶有統(tǒng)計(jì)數(shù)據(jù)的答案(約 400 個(gè)),然后將這些響應(yīng)提供給功能更強(qiáng)大的 LLM(Gemini 1.5 Pro),指示它圍繞統(tǒng)計(jì)數(shù)據(jù)點(diǎn)引入自然語言數(shù)據(jù)共享調(diào)用。SHX28資訊網(wǎng)——每日最新資訊28at.com

所使用的提示包含三個(gè)示例作為指導(dǎo),要求注釋出統(tǒng)計(jì)值和單位,還要指示數(shù)據(jù)共享調(diào)用包括地名、指標(biāo)和日期等。最后會進(jìn)行人工審查,并手動重寫不符合要求的數(shù)據(jù)共享調(diào)用。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

為了評估單個(gè)測試查詢響應(yīng),這里需要子字符串級別的詳細(xì)反饋。研究人員采用了上圖所示的可視化工具。SHX28資訊網(wǎng)——每日最新資訊28at.com

人工評估人員能夠?yàn)g覽所有查詢,并檢查每個(gè)查詢響應(yīng)中的所有 Data Commons 調(diào)用,首先快速檢查是否存在任何明顯的事實(shí)不準(zhǔn)確之處,然后對響應(yīng)中存在的每項(xiàng)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行評估。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

上表顯示了 RIG 方法的事實(shí)準(zhǔn)確性指標(biāo)(Data Commons 中的統(tǒng)計(jì)數(shù)據(jù)與 101 個(gè)查詢中的 LLM 響應(yīng)進(jìn)行比較的情況)。總體而言,RIG 方法提高了真實(shí)性,從 5-17% 提高到約 58%。SHX28資訊網(wǎng)——每日最新資訊28at.com

RAGSHX28資訊網(wǎng)——每日最新資訊28at.com

RAG 管道同樣包含多個(gè)組件。首先,用戶查詢被傳遞到一個(gè)小型的、經(jīng)過微調(diào)的 LLM,它會生成與用戶查詢相關(guān)的自然語言查詢;然后,通過 Data Commons 的自然語言接口來獲取相關(guān)的表;最后,將原始用戶查詢和檢索到的表交給長上下文 LLM(Gemini 1.5 Pro)。SHX28資訊網(wǎng)——每日最新資訊28at.com

原始用戶查詢以及結(jié)果表可能會相當(dāng)長。例如,比較查詢可能包括來自美國所有 50 個(gè)州或全球 194 個(gè)國家的多個(gè)表的多年數(shù)據(jù)。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

在綜合查詢集中,平均輸入長度為 38,000 個(gè) token,最大輸入長度為 348,000 個(gè) token。由于輸入量很大,因此必須使用長上下文 LLM,用戶響應(yīng)如上圖所示。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

對于 RAG 方法,人類評估者評估 LLM 生成的細(xì)粒度問題及其相應(yīng)的數(shù)據(jù)共享響應(yīng)的質(zhì)量。首先驗(yàn)證是否生成了足夠且相關(guān)的問題來解決用戶查詢(上圖);然后評估每個(gè)單獨(dú)問題的質(zhì)量及其相應(yīng)的數(shù)據(jù)共享響應(yīng)(下圖)。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

下表的結(jié)果表明,LLM 在引用數(shù)字時(shí)通常是準(zhǔn)確的 (99%),當(dāng)根據(jù)這些說法進(jìn)行推論時(shí),準(zhǔn)確性會下降,在 6-20% 的時(shí)間內(nèi)得出錯(cuò)誤的推論。SHX28資訊網(wǎng)——每日最新資訊28at.com

SHX28資訊網(wǎng)——每日最新資訊28at.com

參考資料:SHX28資訊網(wǎng)——每日最新資訊28at.com

https://venturebeat.com/ai/datagemma-googles-open-ai-models-mitigate-hallucination-on-statistical-queries/SHX28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8033-0.html整合海量公共數(shù)據(jù),谷歌開源 AI 統(tǒng)計(jì)學(xué)專家 DataGemma

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: macOS 原生版 Perplexity 本月 15 日上線:AI 顛覆搜索體驗(yàn),重塑蘋果 Mac 用戶知識管理

下一篇: OpenAI 推出全新寫作、編碼工具 ChatGPT Canvas,將免費(fèi)開放

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 元宇宙終究沒火過兩年

    來源:傳播體操在ChatGPT快速破圈的同時(shí),元宇宙的熱度卻一瀉千里。雖然互聯(lián)網(wǎng)大廠們都沒有否認(rèn)元宇宙的長期想象力,但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個(gè)新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內(nèi)容~大家掌聲歡迎~~~本次更
  • 內(nèi)容行業(yè)大變天,爆款全靠AI?

    出品 | 微果醬(wjam123456)作者 | 陳出木題圖 | 文心一格 AI的發(fā)展之快出乎所有人的預(yù)料,似乎一夜之間便呼嘯而來。無論是資本的風(fēng)向標(biāo),抑或是生活工作的輔助、流量口,還是茶余飯
  • 沉寂3年,大模型激活小度天貓精靈?

    Tech星球(微信ID:tech618)文 | 何煦陽 沉寂了許久的智能音箱,在今年大模型橫空出世之后,又再次燃起了新的希望。 2月9日,小度宣布將融合文心一言,打造針對智能設(shè)備場景的AI模型&ldq
  • AI特效、虛擬人、數(shù)字盲盒,來看看元宇宙如何融合冬奧會!

    今天是冬奧會比賽的第12天,截至目前所累計(jì)的成績,中國代表團(tuán)已經(jīng)取得了冬奧歷史最佳戰(zhàn)績。全世界的人都在關(guān)注著這場盛事,為奧運(yùn)健兒吶喊助威。谷愛凌、徐夢桃、
  • 這個(gè)好萊塢影視制作公司涉足NFT,讓持有者在制作中發(fā)揮作用

    前米高梅首席執(zhí)行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個(gè)新的好萊塢工作室,提供 NFT,讓持有者在制作中發(fā)揮作用Electromagnetic Productions 創(chuàng)始
  • 頭像類NFTs的統(tǒng)治能持續(xù)多久?

    在過去的一兩年里,NFTs在互聯(lián)網(wǎng)世界中掀起了一場風(fēng)暴。今天,當(dāng)我們想到NFTs時(shí),我們主要想到的是那些充斥著我們的社交媒體屏幕的數(shù)字卡通--無聊猿、punks 和介于
  • 新聞業(yè)在元宇宙的現(xiàn)狀和未來

    “美聯(lián)社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因?yàn)樵撘曨l呈現(xiàn)了移民穿越地中海的苦
  • 這場虛擬發(fā)布會,當(dāng)面“造假”!

    英偉達(dá)去年4月份那場發(fā)布會,你曾看出什么不對勁的地方嗎?你品,你細(xì)品——在計(jì)算機(jī)圖形學(xué)頂會SIGGRAPH 2021上,英偉達(dá)通過一部紀(jì)錄片自曝:那場發(fā)布會內(nèi)藏玄機(jī)~你看到
Top