當前位置：首頁 > 元宇宙 > AI

谷歌推出 DataGemma：基于可信數(shù)據(jù)源提高 AI 準確度，減少幻覺

來源：責編：時間：2024-09-14 16:06:21 108觀看

導讀 9 月 13 日消息，科技媒體 maginative 昨日（9 月 12 日）發(fā)布博文，報道谷歌公司基于谷歌數(shù)據(jù)共享（Data Commons）中的真實世界統(tǒng)計數(shù)據(jù)，推出了開放權重 Gemma 模型的新版本 DataGemma。語言模型當前面臨的一大難題就是

9 月 13 日消息，科技媒體 maginative 昨日（9 月 12 日）發(fā)布博文，報道谷歌公司基于谷歌數(shù)據(jù)共享（Data Commons）中的真實世界統(tǒng)計數(shù)據(jù)，推出了開放權重 Gemma 模型的新版本 DataGemma。

語言模型當前面臨的一大難題就是幻覺（Hallucinations），尤其是大語言模型（LLMs）在處理數(shù)值或統(tǒng)計數(shù)據(jù)時，這一問題變得尤為棘手，因此精確性至關重要。

谷歌的 Data Commons 是一個存儲庫，匯集了來自聯(lián)合國和疾病控制與預防中心等可信組織收集的超過 2400 億個數(shù)據(jù)點。

通過利用這一龐大的統(tǒng)計數(shù)據(jù)集，基于 Gemini 的 DataGemma 能夠顯著提升模型準確性，確保其輸出基于真實可信的現(xiàn)實世界信息。

DataGemma 方法的核心在于兩種關鍵技術：檢索交錯生成（RIG）和檢索增強生成（RAG）。這兩種方法通過在生成過程中將模型基于現(xiàn)實世界數(shù)據(jù)，從而減少幻覺現(xiàn)象。

簡要介紹兩項技術如下：

RIG：

通過主動查詢可信來源，再生成回答的方式運作。在接收到提示詞之后，DataGemma 會識別查詢中的統(tǒng)計數(shù)據(jù)點，并從數(shù)據(jù)共享平臺獲取準確信息。

例如，若被問及“全球可再生能源的使用量是否有所增加？”，該模型會在回答中穿插實時統(tǒng)計數(shù)據(jù)，確保事實準確性。

RAG：

在生成回答之前，會從數(shù)據(jù)共享平臺檢索相關信息，進一步提升了回答的質量。借助其長上下文窗口（由 Gemini 1.5 Pro 實現(xiàn)），DataGemma 確保了回答的全面性，引入了表格和腳注以提供更深層次的上下文，從而減少了虛構內容的出現(xiàn)。

谷歌對 RIG 和 RAG 的研究尚處于初期階段，但初步成果令人鼓舞。通過將現(xiàn)實世界數(shù)據(jù)嵌入回復中，DataGemma 模型在處理數(shù)值事實和統(tǒng)計查詢方面展現(xiàn)出顯著提升。研究團隊已發(fā)表論文詳述其方法，強調這些技術如何幫助 LLMs 判斷何時依賴外部數(shù)據(jù)與內部參數(shù)。

本文鏈接：http://www.tebozhan.com/showinfo-45-7165-0.html谷歌推出 DataGemma：基于可信數(shù)據(jù)源提高 AI 準確度，減少幻覺

聲明：本網(wǎng)頁內容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：安卓和 iOS 版谷歌 Gemini AI 應用新增 Gems 及管理器

下一篇： OpenAI o1 模型登場：開啟 AI 通用復雜推理新篇章，模擬人類思考、處理問題

標簽：

熱門焦點

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

來源：首席商業(yè)評論2023年，最火的莫過于ChatGPT，席卷全球的同時也引發(fā)了生成式AI（人工智能）的投資熱潮。在美股，ChatGPT相關概念股飆漲，以AI算力龍頭英偉達為例，其股價年內一度累計上
數(shù)字人的新革命，BAT的“沖高”戰(zhàn)場

來源：劉曠ChatGPT橫空出世，讓人們看到了數(shù)字人的另一種可能，將ChatGPT與虛擬數(shù)字人融合，研發(fā)出更加智能化、擬人化的虛擬數(shù)字人成為數(shù)字人廠商的新命題、新方向。2月份，嶺南股份
Meta證實Quest 2無法實現(xiàn)全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發(fā)者文檔中發(fā)現(xiàn)了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環(huán)節(jié)中，Meta Reali
NFT Insider #47：YGG發(fā)布2021Q4社區(qū)報告，GameFi領域1月份獲超10億美元融資

引言：NFT Insider由WHALE社區(qū)、BeepCrypto聯(lián)合出品，濃縮每周NFT新聞，為大家?guī)黻P于NFT最全面、最新鮮、最有價值的訊息。每期周報將從NFT市場數(shù)據(jù)，藝術新聞類，游戲
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數(shù)字證券市場 tZERO 的所有權。根據(jù)公告，ICE 將成為 tZero 的“重要”少數(shù)股東，但
頭頂光環(huán)無數(shù)卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感覺可能與我一樣，這是一個讓人十分糾結的項目。之所以糾結，一方面他的團隊陣容強大，各種來自前英特爾、IBM、coinbase、fa
新聞業(yè)在元宇宙的現(xiàn)狀和未來

“美聯(lián)社有毛病吧，這真的過分了！”，一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一，之后取消了此次銷售，因為該視頻呈現(xiàn)了移民穿越地中海的苦
NFT高玩必備：NFT分析工具大盤點

NFT市場的火熱讓越來越多的投資者投身其中，但當前的 NFT 生態(tài)系統(tǒng)存在幾個問題卻困擾了大多數(shù)人，如難以準確評估 NFT 項目的資產價格、缺乏 NFT 市場動態(tài)信息、
全球十大元宇宙概念游戲

A股市場中，不少游戲公司早早搭上了元宇宙概念。舉例，中青寶宣稱將發(fā)布一款元宇宙概念的模擬經(jīng)營類游戲，盡管游戲尚在研發(fā)中，這一消息已經(jīng)讓中青寶的股價在51個交易

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

谷歌推出 DataGemma：基于可信數(shù)據(jù)源提高 AI 準確度，減少幻覺

ChatGPT訪問量增速下滑，AI真的是一場泡沫嗎？

數(shù)字人的新革命，BAT的“沖高”戰(zhàn)場

Meta證實Quest 2無法實現(xiàn)全身追蹤，未來將為虛擬化身配備“假腿”

NFT Insider #47：YGG發(fā)布2021Q4社區(qū)報告，GameFi領域1月份獲超10億美元融資

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

頭頂光環(huán)無數(shù)卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

新聞業(yè)在元宇宙的現(xiàn)狀和未來

NFT高玩必備：NFT分析工具大盤點

全球十大元宇宙概念游戲

最新推薦

在元宇宙賣酸奶，這波聯(lián)動燃爆了！

元宇宙里賣酸奶，好炸裂的操作！

音樂NFT平臺里的下一匹黑馬是誰？

NFT世界的藝術家名單

Ceramic：為Web3.0社交應用打造的中間件

爆發(fā)在即的Layer2賽道百花齊放，誰將是領跑者？

猜你喜歡

熱門推薦

相關資訊