在人工智能技術的浪潮中,AI已從早期的感知與生成階段,大步邁入Agentic AI的新紀元。這一階段的AI正逐漸展現出端到端的自主決策與執行能力,深入到各個生產環節的核心。
火山引擎總裁譚待在近期的FORCE LINK AI創新巡展·杭州站活動中,分享了火山引擎在AI模型、Agent工具以及云基礎設施方面的最新進展。這些進展旨在幫助企業以更高效、更經濟的方式構建和部署Agent應用。
火山引擎發布了豆包1.5·深度思考模型,并對豆包·文生圖模型3.0和豆包·視覺理解模型進行了升級。還推出了面向Agent服務的OS Agent解決方案,以及GUI Agent大模型——豆包1.5·UI-TARS模型。同時,針對大規模推理需求,火山引擎還發布了AI云原生·ServingKit推理套件。
據統計,截至2025年3月底,豆包大模型的日均tokens調用量已超過12.7萬億,這一數字是2024年12月的三倍,更是其發布之初的106倍。IDC的報告顯示,2024年中國公有云大模型調用量大幅增長,火山引擎憑借46.4%的市場份額,位居中國市場首位。
深度思考模型能夠模擬人類的思維過程,對復雜問題進行精準分析和邏輯推導。新發布的豆包1.5·深度思考模型在數學、代碼、科學等專業領域表現出色,已達到或接近全球領先水平。同時,在創意寫作等非推理任務中,該模型也展現出強大的泛化能力,適用于多種復雜場景。
為了提升模型的通用性,火山引擎優化了數據處理策略,將可驗證數據與創意性數據進行融合處理。通過采用創新的雙軌獎勵機制,大規模強化學習技術得以有效優化,兼顧了“對錯分明”和“見仁見智”的任務。
豆包1.5·深度思考模型采用MoE架構,總參數達到200B,但激活參數僅為20B,具有顯著的成本優勢。該模型在提供高并發承載能力的同時,實現了20毫秒的極低延遲。豆包APP基于豆包1.5·深度思考模型進行了定向訓練,能夠“邊想邊搜”,解決了生活生產中的具體問題。
例如,在推薦露營裝備時,豆包1.5·深度思考模型能夠綜合考慮溫度、天氣、預算、便攜性和安全性等多個因素,經過多輪搜索和思考,給出細致周到的推薦方案。同時,該模型還具備視覺理解能力,能夠基于所見畫面進行思考,使思考更加立體。
此次升級的豆包·文生圖模型3.0在文字排版、圖像生成效果以及高清圖片生成方面均有顯著提升。該模型可廣泛應用于影視、海報、繪畫、玩偶設計等營銷、電商和設計場景,為用戶帶來更好的視覺體驗。
在最新的文生圖領域權威榜單Artificial Analysis競技場中,豆包·文生圖3.0模型超越了眾多主流模型,排名全球領先。同時,新版本的豆包·視覺理解模型在視覺定位和視頻理解能力上也有大幅提升,可應用于線下門店巡檢、GUI agent、機器人訓練、自動駕駛訓練以及安防、家庭看護等商業化場景。
火山引擎還發布了OS Agent解決方案,該方案通過火山引擎veFaaS平臺對豆包大模型能力進行封裝,讓企業和開發者能夠輕松構建輕量級的Code use和Browser use。同時,針對任務相對復雜的Computer Use和Mobile Use Agent,可以通過ECS或云手機等調用豆包1.5·UI-TARS模型,實現精準的感知、自主推理和行動。
為了支持大規模的推理需求,火山引擎推出了ServingKit推理套件,幫助企業實現模型的快速部署、推理優化和運維可觀測。該套件可在極短時間內完成大模型的下載和預熱,以及推理引擎的加載。同時,通過優化算子、AI網關和VKE編排調度,可以大幅度降低GPU消耗,提高資源利用率。
火山引擎還發布了國內首個AI IDE——Trae。這款AI原生的集成開發環境工具可以讓開發者和AI進行更智能的協作,實現軟件開發的交付化、智能化和協作化。未來,AI Agent將在“應用Agent”和“OS Agent”兩個方向上并行發展,為企業和開發者帶來更多創新和機遇。
本文鏈接:http://www.tebozhan.com/showinfo-45-12378-0.html火山引擎豆包1.5深度思考模型:高效能、低延遲,引領AI新紀元
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com