當前位置：首頁 > 元宇宙 > AI

中國科大新成果入選 ICLR 2025：特定領域僅用 5% 訓練數據，知識準確率提升 14%

來源：責編：時間：2025-04-09 12:34:37 76觀看

導讀讓大語言模型更懂特定領域知識，有新招了！來自中國科學技術大學 MIRA 實驗室的王杰教授團隊提出了一個創新的框架 —— 知識圖譜驅動的監督微調（KG-SFT），該框架通過引入知識圖譜（KG）來提升大語言模型（LLMs）在特定領域的

讓大語言模型更懂特定領域知識，有新招了！

來自中國科學技術大學 MIRA 實驗室的王杰教授團隊提出了一個創新的框架 —— 知識圖譜驅動的監督微調（KG-SFT），該框架通過引入知識圖譜（KG）來提升大語言模型（LLMs）在特定領域的知識理解和處理能力。

實驗結果表明，其在多個領域和多種語言的數據集上取得了顯著的效果，成功入選 ICLR 2025。

截至目前，LLMs 在常識問答方面表現越來越出色，但它們對領域知識的理解和推理能力仍然有限。

由于難以深入理解專業領域問答背后所蘊含的復雜知識和邏輯關系，因此在面對這類問題時，往往無法準確地給出正確的答案和詳細的推理過程，這極大地限制了其在專業領域的應用價值。

尤其是在數據稀少和知識密集型的場景中，如何讓 LLMs 更好地理解和操縱知識，成為了研究的關鍵。

而中科大 MIRA 實驗室的這項工作即圍繞此展開。

KG-SFT 是如何工作的

KG-SFT 針對 LLMs 難以理解領域問答背后的知識和邏輯，導致推理能力弱的問題，提出基于知識圖譜增強的大語言模型監督微調技術。

KG-SFT 首先通過解析領域知識圖譜中的多條推理路徑，設計圖上推理路徑與文本推理過程的聯合生成機制。使 LLMs 在監督微調過程中，能夠同步輸出推理答案以及蘊含豐富領域知識和邏輯關系的推理過程，從而提升其對領域知識的理解與推理能力。

KG-SFT 框架的核心在于將知識圖譜與監督微調相結合，通過生成問答背后的邏輯嚴密的推理過程解釋來增強 LLMs 對知識和邏輯的理解。

該框架包含三個關鍵組件：

Extractor（提取器）

Generator（生成器）

Detector（檢測器）

1、Extractor：精準提取知識關聯

Extractor 首先對問答對（Q&A）中的實體進行識別，并從外部知識圖譜中提取相關的推理子圖。

這一步驟揭示了 Q&A 對背后的知識關聯和邏輯，為后續的解釋生成提供了基礎。

通過命名實體識別（NER）和多條推理路徑的檢索，Extractor 能夠有效地從大規模知識圖譜中獲取與問題相關的知識。

2、Generator：生成流暢的解釋

Generator 利用圖結構重要性評分算法（如 HITS 算法）對推理子圖中的實體和關系進行評分，選擇高分部分作為重要內容。

然后，使用大型語言模型（如 ChatGPT）生成流暢的解釋草稿。

這些解釋不僅邏輯清晰，而且能夠幫助 LLMs 更好地理解問題和答案之間的關系。

3、Detector：確保解釋的正確性

Detector 對生成的解釋草稿進行句子級別的知識沖突檢測，確保解釋的正確性。

通過自然語言推理（NLI）模型（如 DeBERTa）和重新引導機制，Detector 能夠標記并糾正可能存在的知識沖突，從而提高解釋的可靠性。

實驗結果及創新點

實驗結果表明，KG-SFT 在多個領域和語言設置中均取得了顯著的性能提升。

特別是在低數據醫學問答任務上，KG-SFT 在英語場景中僅使用 5% 的訓練數據就比傳統方法提高了近 14% 的準確率。

從創新之處來看，KG-SFT 不僅關注數據的數量，更注重數據的質量。

通過生成高質量的解釋，KG-SFT 幫助 LLMs 更好地理解和操縱知識，從而在特定領域實現更優的性能。

此外，KG-SFT 還可以作為插件式模塊與現有的數據增強方法結合使用，進一步提升性能。

在多領域數據集上的實驗結果進一步驗證了 KG-SFT 的廣泛適用性。

盡管在某些需要復雜推理的領域（如形式邏輯和專業會計）中表現稍遜，但整體性能依然具有較強的競爭力。

概括而言，KG-SFT 框架通過結合知識圖譜和 LLMs，有效地提升了監督微調數據的質量，從而顯著提高了 LLMs 在特定領域的性能。

這一方法不僅在低數據場景中表現出色，還展示了其作為插件式模塊與現有數據增強方法結合的潛力。

論文作者第一作者陳瀚鑄是中國科學技術大學 2021 級碩博連讀生，師從王杰教授，主要研究方向為大語言模型、知識圖譜和推理數據合成。

更多細節歡迎查閱原論文。

論文地址：

https://openreview.net/pdf?id=oMFOKjwaRS

本文來自微信公眾號：量子位（ID：QbitAI），作者：KG-SFT 團隊，原標題《中科大 ICLR2025：特定領域僅用 5% 訓練數據，知識準確率提升 14%》

本文鏈接：http://www.tebozhan.com/showinfo-45-12083-0.html中國科大新成果入選 ICLR 2025：特定領域僅用 5% 訓練數據，知識準確率提升 14%

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：大模型時代來臨，阿丘科技如何以AI檢測引領工業視覺新變革？

下一篇：微軟 AI 版《雷神之錘 2》遭噴：模糊、耗電，褻瀆開發者工作

標簽：

熱門焦點

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

保時捷又出超跑了，不過這次不是在現實世界，而是在虛擬世界。這款Vision Gran Turismo概念車，由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造，將于202
冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場熱度遠不及社交媒體所稱的那樣高。2月11日，獲得國際奧委會授權的2022冬奧會吉祥物冰墩墩相關NFT產品在nWayPlay上線
本周NFT領域重要資訊回顧

NFT在蘇富比拍賣是一波三折的嗎？其實不完全如此，但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時，美聯社因其最新的NFT銷售被推到了風口浪尖，而Opensea正面臨
量子計算在未來能否提高區塊鏈技術的效率

區塊鏈技術的主要成功之處在于對不透明的金融流程進行了去中心化的訪問量子計算機的內在目標是解決傳統計算機不可能解決的問題隨著區塊鏈技術的使用案例逐漸
NFT自動售貨機來啦！

“紐約市有一臺售賣 Solana NFT 的自動售貨機，用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT，無需使用加密貨幣。由于基于 Solana 鏈的 N
過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

Web 2.0 是由幾家“直男”大公司塑造的。接下來的Web3世界中，如果女性在創造性方面發揮更大的作用，可能會讓這個新時代更受歡迎、更安全和公平。當我們談論 Web3
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發，以保護用戶
又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

作者：董宇佳2月28日，智度股份在北京舉辦產品發布會，宣布其與國光電器聯手打造的國內首個藝術元宇宙社區——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
技術賦能，國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

作者:易明未來，Pet Meta數字寵物藏品將是鏈接全球數億愛寵人群與元宇宙世界獨一無二的身份象征。首家面向國內的寵物元宇宙平臺Pet Meta生長于“寵物經濟”快速

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

中國科大新成果入選 ICLR 2025：特定領域僅用 5% 訓練數據，知識準確率提升 14%

保時捷推出虛擬超跑，車企元宇宙營銷這么香？

冰墩墩NFT遇冷，價格跌80%，日成交僅3筆。

本周NFT領域重要資訊回顧

量子計算在未來能否提高區塊鏈技術的效率

NFT自動售貨機來啦！

過去女性在互聯網領域是半邊天，在Web3，將會是整片天！

元宇宙需要的5個重要安全功能

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

技術賦能，國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

最新推薦

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

AI大模型“戰火”燒到了教育領域

文心一言排名墊底，卻成為百度業績增長杠桿

這場虛擬人爭奪戰，互聯網巨頭下場先贏一半？

2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

2030年的元宇宙產業將會如何發展？

猜你喜歡

熱門推薦

相關資訊