隨著技術的飛速發展,特別是通用大模型性能的顯著提升以及推理算力成本的急劇下降,垂直領域的大模型正迎來前所未有的發展機遇。在這波浪潮中,代碼大模型尤為引人注目,不僅吸引了市場的廣泛關注,更成為資本競相追逐的焦點。
根據Gartner發布的《2024年全球IT支出預測》報告,全球軟件開發人力成本正以年均7-9%的速度增長,預計到2024年,全球軟件相關支出將達到1.2萬億美元,其中人力成本占比高達50%,即6000億美元。而在中國,互聯網巨頭們在軟件開發方面的人力成本壓力更為顯著,部分公司的薪酬及相關支出年增幅已接近15%。
然而,與日益增長的軟件開發需求相比,全球軟件工程師的缺口卻在持續擴大。有數據顯示,未來十年內,這一缺口可能達到數千萬之巨,成為制約各行各業數字化轉型的關鍵因素。在此背景下,代碼大模型憑借其獨特的優勢,成為了少數具備明確商業化條件和付費意愿的垂直行業大模型之一。
Cursor作為海外知名的AI編程產品,僅用21個月便實現了1億美元的ARR,成為歷史上增長最快的SaaS產品之一,估值更是高達100億美元。Gartner還預測,到2026年,AI將自動化全球30%的編碼任務,這意味著代碼大模型市場將是一個“看得見”的千億美元級大蛋糕。
不僅海外市場如火如荼,國內通用大模型廠商也紛紛涉足代碼大模型領域。阿里的通義靈碼、騰訊的騰訊云AI代碼助手、華為的Code Arts、字節跳動的豆包Mars Code以及百度的文心快碼等,都在這場激烈的競爭中嶄露頭角。京東、訊飛、昆侖萬維、DeepSeek、智譜等多家通用大模型廠商也都在積極布局這一領域。
在眾多參與者中,aiXcoder以其深厚的積淀和卓越的模型性能脫穎而出。依托北大軟件工程研究所60余年的積累,aiXcoder團隊從多篇全球頂級會議論文的奠基,到全球首個十億級和百億級參數的國產代碼大模型aiXcoder的發布,再到國內諸多大廠頭部客戶的實踐落地,實現了從實驗室理論到產業價值的閉環突破。
aiXcoder-7B模型更是其最新力作。該模型在多個評測集的評測結果中超越了同級別參數規模的眾多開源模型,如Qwen2.5-Coder-7B、DeepSeekCoder-7B、CodeLlama-7B等。在代碼生成與補全效果上,aiXcoder-7B均達到了SOTA評價(即當前最佳)。
今年年初,aiXcoder(北京硅心科技有限公司)成功完成了A++輪融資,由中關村發展集團旗下中關村資本和中關村協同創新基金共同參投。至此,該公司已累計獲得4輪融資,吸引了伽利略資本、高瓴創投、彬復資本、清流資本、三七互娛等多家頂級風險投資機構的青睞。
近日,aiXcoder的商業合伙人兼總裁劉德欣在接受訪談時,深入探討了當前代碼大模型行業面臨的技術瓶頸和未來趨勢。他表示,通用大模型雖然強大,但由于其構建和訓練方式基于自然語言而非編程語言,因此在處理代碼時存在一定的局限性。代碼相比自然語言具有更強的上下文依賴性和結構性,這要求模型必須能夠精準地理解程序語言的結構和語義。
針對這一問題,aiXcoder-7B采用了結構化Span的形式構建模型,并創新性地提出了“結構化填充中間目標(SFIM)”的訓練方法。通過解析代碼語法樹節點,選取完整的代碼邏輯單元作為訓練跨度,有效避免了隨機選段造成的不完整情況,從而大幅提升了模型訓練效果。實驗表明,SFIM顯著提升了生成代碼的簡潔性和結構合理性。
除了模型性能外,企業在私域大模型落地過程中還關注多個要素。劉德欣總結了企業領域大模型落地的四大原則:掌握模型自治權、實現模型層的高解耦、建立可復用的數據框架以及始終關注業務。這些原則不僅為企業提供了落地大模型的指導思路,也為aiXcoder等服務商提供了與客戶合作的基礎框架。
面對大廠在代碼大模型領域的激烈競爭,aiXcoder憑借其垂直領域的深耕、與客戶的合作伙伴關系以及積極開展與大廠的合作等策略,保持了強勁的市場競爭力。劉德欣表示,aiXcoder將繼續在軟件工程和智能化這兩個垂直領域做更深的技術融合,并保持技術層面的持續領跑。
aiXcoder還創新推出了內置MCP功能的軟件開發Agent,正在內測中。該Agent不僅支持企業私有化部署和針對性適配企業已有的開源大模型,還具備強大的環境適配能力,支持企業在不影響現有代碼架構的前提下快速接入企業私有化工具鏈。同時,aiXcoder Agent功能計劃在插件端免費開放,使用門檻低,將有力推動AI Coding行業的發展。
本文鏈接:http://www.tebozhan.com/showinfo-45-12466-0.html代碼大模型爆發:aiXcoder等如何引領軟件開發新紀元?
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com