當(dāng)前位置：首頁 > 科技 > 軟件

豆包大模型開源Multi-SWE-bench，多語言“自動(dòng)修Bug”能力能否更上一層樓？

來源：責(zé)編：時(shí)間：2025-04-11 07:51:39 18觀看

導(dǎo)讀字節(jié)跳動(dòng)旗下的豆包大模型團(tuán)隊(duì)近日傳來重要消息，他們正式推出了首個(gè)多語言軟件錯(cuò)誤修正（SWE）數(shù)據(jù)集——Multi-SWE-bench。這一創(chuàng)新工具旨在評(píng)估和提升大型語言模型在自動(dòng)修復(fù)代碼錯(cuò)誤方面的能力。Multi-SWE-bench是在原

字節(jié)跳動(dòng)旗下的豆包大模型團(tuán)隊(duì)近日傳來重要消息，他們正式推出了首個(gè)多語言軟件錯(cuò)誤修正（SWE）數(shù)據(jù)集——Multi-SWE-bench。這一創(chuàng)新工具旨在評(píng)估和提升大型語言模型在自動(dòng)修復(fù)代碼錯(cuò)誤方面的能力。

Multi-SWE-bench是在原有SWE-bench的基礎(chǔ)上拓展而來，其最大亮點(diǎn)在于覆蓋了除Python外的七種主流編程語言，包括Java、Go、Rust、C、C++、Type以及再次提及的Java（此處原文可能有誤，或?yàn)槠渌Z言，如Typescript，但為保持原文信息完整性，按原文轉(zhuǎn)述）。這一數(shù)據(jù)集真正實(shí)現(xiàn)了面向“全棧工程”的評(píng)測基準(zhǔn)，為開發(fā)者提供了更為全面的評(píng)估工具。

據(jù)悉，Multi-SWE-bench共包含1632個(gè)實(shí)例，這些實(shí)例均源自GitHub上的issue，且經(jīng)過嚴(yán)格的測試標(biāo)準(zhǔn)和專業(yè)開發(fā)者的精心篩選。每個(gè)樣本都確保了問題描述的清晰性、修復(fù)補(bǔ)丁的正確性以及可復(fù)現(xiàn)的運(yùn)行測試環(huán)境，從而保證了數(shù)據(jù)集的高質(zhì)量。

豆包大模型團(tuán)隊(duì)表示，他們希望Multi-SWE-bench能夠成為大型語言模型在多種主流編程語言與真實(shí)代碼環(huán)境中的系統(tǒng)性評(píng)測基準(zhǔn)。這一工具將推動(dòng)自動(dòng)編程能力向更加實(shí)用、更加工程化的方向發(fā)展，為開發(fā)者帶來實(shí)質(zhì)性的幫助。

與以往主要聚焦于Python單語言任務(wù)的數(shù)據(jù)集相比，Multi-SWE-bench更加貼近現(xiàn)實(shí)中的多語言開發(fā)場景。它不僅能夠更準(zhǔn)確地反映當(dāng)前模型在“自動(dòng)化軟件工程”方向上的實(shí)際能力邊界，還為開發(fā)者提供了更為全面、更為實(shí)用的評(píng)測工具。

本文鏈接：http://www.tebozhan.com/showinfo-26-143201-0.html豆包大模型開源Multi-SWE-bench，多語言“自動(dòng)修Bug”能力能否更上一層樓？

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：追風(fēng)者Evolv S2機(jī)箱曝光：延續(xù)X2三面玻璃設(shè)計(jì)，更小更精致

下一篇：一加13T粉色新配色曝光，首發(fā)珊瑚絨玻璃工藝手感如何？

標(biāo)簽：

熱門焦點(diǎn)

8月總票房已突破10億！《封神》第一：口碑已經(jīng)成了

8月5日消息，據(jù)燈塔專業(yè)版數(shù)據(jù)，截至8月5日9時(shí)35分，8月總票房（含預(yù)售）已突破10億。其中，《封神》以大比分的優(yōu)勢領(lǐng)先。根據(jù)官方消息，目前該片總票房已經(jīng)超過14.
K6：面向開發(fā)人員的現(xiàn)代負(fù)載測試工具

K6 是一個(gè)開源負(fù)載測試工具，可以輕松編寫、運(yùn)行和分析性能測試。它建立在 Go 和 JavaScript 之上，它被設(shè)計(jì)為功能強(qiáng)大、可擴(kuò)展且易于使用。k6 可用于測試各種應(yīng)用程序，包括 Web
簽約井川里予、何丹彤，單視頻點(diǎn)贊近千萬，MCN黑馬永恒文希快速崛起！

來源：視聽觀察永恒文希傳媒作為一家MCN公司，說起它的名字來，可能大家會(huì)覺得有點(diǎn)兒陌生，但是說出來下面一串的名字之后，或許大家就會(huì)感到震驚，原來這么多網(wǎng)紅，都簽約這家公司了。根
一條抖音4億人圍觀 ! 這家MCN比無憂傳媒還野

作者：Hiu 來源：互聯(lián)網(wǎng)品牌官01 擦邊少女空降熱搜，幕后推手曝光被網(wǎng)友譽(yù)為“純欲天花板”的女網(wǎng)紅井川里予，近期因?yàn)橐唤M哥特風(fēng)照片登上熱搜，引發(fā)了一場互聯(lián)網(wǎng)世界關(guān)于
三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

2023年7月26日，三星電子正式發(fā)布了Galaxy Z Flip5與Galaxy Z Fold5。除此之外，Galaxy Tab S9系列平板電腦以及三星Galaxy Watch6系列智能手表也同期
iQOO 11S評(píng)測：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

【Techweb評(píng)測】去年底，iQOO推出了“電競旗艦”iQOO 11系列，作為一款性能強(qiáng)機(jī)，該機(jī)不僅全球首發(fā)2K 144Hz E6全感屏，搭載了第二代驍龍8平臺(tái)及144Hz電競
2299元起！iQOO Pad開啟預(yù)售：性能最強(qiáng)天璣平板

5月23日，iQOO如期舉行了新品發(fā)布會(huì)，除了首發(fā)安卓最強(qiáng)旗艦處理器的iQOO Neo8系列新機(jī)外，還在發(fā)布會(huì)上推出了旗下首款平板電腦——iQOO Pad，其搭載了天璣
引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

7月25日，OPPO正式發(fā)布K系列新品—— OPPO K11 。此次 K11 在中端手機(jī)市場長期被忽視的影像板塊發(fā)力，突破性地搭載索尼 IMX890 旗艦大底主攝，支持 OIS
最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

2022年1月份在國際消費(fèi)電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現(xiàn)在已經(jīng)可以購買了，這款筆記本電腦被譽(yù)為世界上最薄的 14 英寸游戲筆

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

豆包大模型開源Multi-SWE-bench，多語言“自動(dòng)修Bug”能力能否更上一層樓？

8月總票房已突破10億！《封神》第一：口碑已經(jīng)成了

K6：面向開發(fā)人員的現(xiàn)代負(fù)載測試工具

簽約井川里予、何丹彤，單視頻點(diǎn)贊近千萬，MCN黑馬永恒文希快速崛起！

一條抖音4億人圍觀 ! 這家MCN比無憂傳媒還野

三星推出Galaxy Tab S9系列平板電腦以及Galaxy Watch6系列智能手表

iQOO 11S評(píng)測：行業(yè)唯一的200W標(biāo)準(zhǔn)版旗艦

2299元起！iQOO Pad開啟預(yù)售：性能最強(qiáng)天璣平板

引領(lǐng)旗艦級(jí)影像能力向中端機(jī)普及 OPPO K11 系列發(fā)布 1799 元起

最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊