當前位置：首頁 > 元宇宙 > AI

大模型“自動修 bug”能力將提升，豆包團隊開源首個多語言代碼修復基準 Multi-SWE-bench

來源：責編：時間：2025-04-13 08:41:48 13觀看

導讀 4 月 10 日消息，豆包大模型團隊今日通過官方公眾號宣布，首個多語言類 SWE 數據集 Multi-SWE-bench 現已正式開源，可用于評估和提升大模型“自動修 Bug”能力。在 SWE-bench 基礎上，Multi-SWE-bench 首次覆蓋 Pyth

4 月 10 日消息，豆包大模型團隊今日通過官方公眾號宣布，首個多語言類 SWE 數據集 Multi-SWE-bench 現已正式開源，可用于評估和提升大模型“自動修 Bug”能力。

在 SWE-bench 基礎上，Multi-SWE-bench 首次覆蓋 Python 之外的 7 種主流編程語言，是真正面向“全棧工程”的評測基準。其數據均來自 GitHub issue，歷時近一年構建，以盡可能準確測評和提高大模型高階編程智能水平。

Multi-SWE-bench 旨在推動自動編程技術從僅能解決單一語言（如 Python）和低復雜度的任務，朝著支持多語言、具備真實問題解決能力的通用型智能體邁進。

SWE-bench 是當前最具代表性的代碼修復評測基準，強調任務真實、難度高。它基于 GitHub issue，要求模型自動定位并修復 Bug，兼具跨文件修改、復雜語義推理與上下文理解等挑戰。

Multi-SWE-bench 旨在補全現有同類基準語言覆蓋方面的不足，系統性評估大模型在復雜開發環境下的“多語言泛化能力”，推動多語言軟件開發 Agent 的評估與研究，其主要特性如下：

首次覆蓋 7 種主流編程語言（包括 Java、Go、Rust、C、C++、TypeScript、JavaScript），構建多語言開發環境下的代碼修復任務，系統評估模型的跨語言適應與泛化能力；

引入任務難度分級機制，將問題劃分為簡單（Easy）、中等（Medium）和困難（Hard）三類，涵蓋從一行修改到多文件、多步驟、多語義依賴的開發挑戰；

1,632 個實例全部來源于真實開源倉庫，并經過統一的測試標準和專業開發者的審核篩選，確保每個樣本具備清晰的問題描述、正確的修復補丁以及可復現的運行測試環境。

附開源鏈接：

Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving：

論文鏈接：https://arxiv.org/ abs / 2504.02605

榜單鏈接：https://multi-swe-bench.github.io

代碼鏈接：https://github.com/ multi-swe-bench / multi-swe-bench

數據鏈接：https://huggingface.co/ datasets / ByteDance-Seed / Multi-SWE-bench

本文鏈接：http://www.tebozhan.com/showinfo-45-12213-0.html大模型“自動修 bug”能力將提升，豆包團隊開源首個多語言代碼修復基準 Multi-SWE-bench

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：優音通信雙獎加冕，智能通信創新引領行業未來！

下一篇：谷歌 Veo 2 升級可生成更具電影感視頻，文本、音頻 AI 同步升級

標簽：

熱門焦點

三院士三教授熱聊元宇宙&——AIGC，學術界怎么看？

來源：清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上，中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三大院士，還有清華
內容行業大變天，爆款全靠AI？

出品 | 微果醬（wjam123456）作者 | 陳出木題圖 | 文心一格 AI的發展之快出乎所有人的預料，似乎一夜之間便呼嘯而來。無論是資本的風向標，抑或是生活工作的輔助、流量口，還是茶余飯
不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

作者：中科基大數據元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規則，確保每個元宇宙的參與者通過這個規則都可以掙到錢，他們的利益都可以得到保
在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

Block-807DAO要么是定義虛擬未來、無領導組織的革命性概念，要么是充滿存在主義和自我毀滅挑戰的反烏托邦結構，取決于你在與誰交談。近幾個月來， DAO已經從Crypto
元宇宙風歸何處？

元宇宙持續大火，在過去一段時間內，其屢次登上熱點，吸引了一波又一波投資者。近期，在“2022中國·金魚嘴元宇宙生態賦能大會”上，南京建鄴區金魚嘴基金街區宣布計劃
趙長鵬預測SoicalFi為今年主要驅動力，新的機會在哪里？

作者：五火球教主前不久，趙長鵬在《財富》雜志印度版塊刊登評論。他表示：“DeFi 在 2021 年出現了快速創新，我們可能會在 2022 年看到蓬勃發展的興趣和創新，其中 Soc
這場虛擬發布會，當面“造假”！

英偉達去年4月份那場發布會，你曾看出什么不對勁的地方嗎？你品，你細品——在計算機圖形學頂會SIGGRAPH 2021上，英偉達通過一部紀錄片自曝：那場發布會內藏玄機~你看到

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

大模型“自動修 bug”能力將提升，豆包團隊開源首個多語言代碼修復基準 Multi-SWE-bench

三院士三教授熱聊元宇宙&——AIGC，學術界怎么看？

內容行業大變天，爆款全靠AI？

10億基金，李彥宏呼喚下一個AI獨角獸

不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

DAO登上了歷史舞臺，但是主流準備好采用DAO了嗎？

元宇宙風歸何處？

趙長鵬預測SoicalFi為今年主要驅動力，新的機會在哪里？

這場虛擬發布會，當面“造假”！

最新推薦

《蜘蛛俠》火了，超級英雄就該這么演

英特爾首款加密芯片將于今年上市｜國際動態

餐桌上怎么變出元宇宙？

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

猜你喜歡

熱門推薦

相關資訊