AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

中國科大新成果入選 ICLR 2025:特定領域僅用 5% 訓練數據,知識準確率提升 14%

來源: 責編: 時間:2025-04-09 12:34:37 14觀看
導讀 讓大語言模型更懂特定領域知識,有新招了!來自中國科學技術大學 MIRA 實驗室的王杰教授團隊提出了一個創新的框架 —— 知識圖譜驅動的監督微調(KG-SFT),該框架通過引入知識圖譜(KG)來提升大語言模型(LLMs)在特定領域的

讓大語言模型更懂特定領域知識,有新招了!i9G28資訊網——每日最新資訊28at.com

來自中國科學技術大學 MIRA 實驗室的王杰教授團隊提出了一個創新的框架 —— 知識圖譜驅動的監督微調(KG-SFT),該框架通過引入知識圖譜(KG)來提升大語言模型(LLMs)在特定領域的知識理解和處理能力。i9G28資訊網——每日最新資訊28at.com

實驗結果表明,其在多個領域和多種語言的數據集上取得了顯著的效果,成功入選 ICLR 2025。i9G28資訊網——每日最新資訊28at.com

i9G28資訊網——每日最新資訊28at.com

截至目前,LLMs 在常識問答方面表現越來越出色,但它們對領域知識的理解和推理能力仍然有限。i9G28資訊網——每日最新資訊28at.com

由于難以深入理解專業領域問答背后所蘊含的復雜知識和邏輯關系,因此在面對這類問題時,往往無法準確地給出正確的答案和詳細的推理過程,這極大地限制了其在專業領域的應用價值。i9G28資訊網——每日最新資訊28at.com

尤其是在數據稀少和知識密集型的場景中,如何讓 LLMs 更好地理解和操縱知識,成為了研究的關鍵。i9G28資訊網——每日最新資訊28at.com

而中科大 MIRA 實驗室的這項工作即圍繞此展開。i9G28資訊網——每日最新資訊28at.com

KG-SFT 是如何工作的

KG-SFT 針對 LLMs 難以理解領域問答背后的知識和邏輯,導致推理能力弱的問題,提出基于知識圖譜增強的大語言模型監督微調技術。i9G28資訊網——每日最新資訊28at.com

KG-SFT 首先通過解析領域知識圖譜中的多條推理路徑,設計圖上推理路徑與文本推理過程的聯合生成機制。使 LLMs 在監督微調過程中,能夠同步輸出推理答案以及蘊含豐富領域知識和邏輯關系的推理過程,從而提升其對領域知識的理解與推理能力。i9G28資訊網——每日最新資訊28at.com

KG-SFT 框架的核心在于將知識圖譜與監督微調相結合,通過生成問答背后的邏輯嚴密的推理過程解釋來增強 LLMs 對知識和邏輯的理解。i9G28資訊網——每日最新資訊28at.com

該框架包含三個關鍵組件:i9G28資訊網——每日最新資訊28at.com

Extractor(提取器)i9G28資訊網——每日最新資訊28at.com

Generator(生成器)i9G28資訊網——每日最新資訊28at.com

Detector(檢測器)i9G28資訊網——每日最新資訊28at.com

i9G28資訊網——每日最新資訊28at.com

1、Extractor:精準提取知識關聯i9G28資訊網——每日最新資訊28at.com

Extractor 首先對問答對(Q&A)中的實體進行識別,并從外部知識圖譜中提取相關的推理子圖。i9G28資訊網——每日最新資訊28at.com

這一步驟揭示了 Q&A 對背后的知識關聯和邏輯,為后續的解釋生成提供了基礎。i9G28資訊網——每日最新資訊28at.com

通過命名實體識別(NER)和多條推理路徑的檢索,Extractor 能夠有效地從大規模知識圖譜中獲取與問題相關的知識。i9G28資訊網——每日最新資訊28at.com

2、Generator:生成流暢的解釋i9G28資訊網——每日最新資訊28at.com

Generator 利用圖結構重要性評分算法(如 HITS 算法)對推理子圖中的實體和關系進行評分,選擇高分部分作為重要內容。i9G28資訊網——每日最新資訊28at.com

然后,使用大型語言模型(如 ChatGPT)生成流暢的解釋草稿。i9G28資訊網——每日最新資訊28at.com

這些解釋不僅邏輯清晰,而且能夠幫助 LLMs 更好地理解問題和答案之間的關系。i9G28資訊網——每日最新資訊28at.com

3、Detector:確保解釋的正確性i9G28資訊網——每日最新資訊28at.com

Detector 對生成的解釋草稿進行句子級別的知識沖突檢測,確保解釋的正確性。i9G28資訊網——每日最新資訊28at.com

通過自然語言推理(NLI)模型(如 DeBERTa)和重新引導機制,Detector 能夠標記并糾正可能存在的知識沖突,從而提高解釋的可靠性。i9G28資訊網——每日最新資訊28at.com

實驗結果及創新點

實驗結果表明,KG-SFT 在多個領域和語言設置中均取得了顯著的性能提升。i9G28資訊網——每日最新資訊28at.com

特別是在低數據醫學問答任務上,KG-SFT 在英語場景中僅使用 5% 的訓練數據就比傳統方法提高了近 14% 的準確率。i9G28資訊網——每日最新資訊28at.com

i9G28資訊網——每日最新資訊28at.com

從創新之處來看,KG-SFT 不僅關注數據的數量,更注重數據的質量。i9G28資訊網——每日最新資訊28at.com

通過生成高質量的解釋,KG-SFT 幫助 LLMs 更好地理解和操縱知識,從而在特定領域實現更優的性能。i9G28資訊網——每日最新資訊28at.com

此外,KG-SFT 還可以作為插件式模塊與現有的數據增強方法結合使用,進一步提升性能。i9G28資訊網——每日最新資訊28at.com

i9G28資訊網——每日最新資訊28at.com

在多領域數據集上的實驗結果進一步驗證了 KG-SFT 的廣泛適用性。i9G28資訊網——每日最新資訊28at.com

盡管在某些需要復雜推理的領域(如形式邏輯和專業會計)中表現稍遜,但整體性能依然具有較強的競爭力。i9G28資訊網——每日最新資訊28at.com

i9G28資訊網——每日最新資訊28at.com

概括而言,KG-SFT 框架通過結合知識圖譜和 LLMs,有效地提升了監督微調數據的質量,從而顯著提高了 LLMs 在特定領域的性能。i9G28資訊網——每日最新資訊28at.com

這一方法不僅在低數據場景中表現出色,還展示了其作為插件式模塊與現有數據增強方法結合的潛力。i9G28資訊網——每日最新資訊28at.com

論文作者第一作者陳瀚鑄是中國科學技術大學 2021 級碩博連讀生,師從王杰教授,主要研究方向為大語言模型、知識圖譜和推理數據合成。i9G28資訊網——每日最新資訊28at.com

更多細節歡迎查閱原論文。i9G28資訊網——每日最新資訊28at.com

論文地址:i9G28資訊網——每日最新資訊28at.com

https://openreview.net/pdf?id=oMFOKjwaRSi9G28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:KG-SFT 團隊,原標題《中科大 ICLR2025:特定領域僅用 5% 訓練數據,知識準確率提升 14%》i9G28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-12083-0.html中國科大新成果入選 ICLR 2025:特定領域僅用 5% 訓練數據,知識準確率提升 14%

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 大模型時代來臨,阿丘科技如何以AI檢測引領工業視覺新變革?

下一篇: 微軟 AI 版《雷神之錘 2》遭噴:模糊、耗電,褻瀆開發者工作

標簽:
  • 熱門焦點
Top