在近日于中關村論壇年會“未來人工智能先鋒論壇”上,北京智源人工智能研究院院長王仲遠揭曉了兩項重要技術成果:跨本體具身大小腦協作框架RoboOS與開源具身大腦RoboBrain。這兩項技術的發布,標志著智源研究院在推動單機智能向群體智能轉變方面邁出了關鍵一步。
RoboOS與RoboBrain的亮相,旨在解決當前具身智能面臨的種種挑戰,如數據短缺、模型能力弱、落地應用難以及硬件不成熟等問題。據王仲遠介紹,具身智能的發展仍處于早期階段,要實現端到端的完全成熟,還需要海量的數據支持,預計這一進程至少需要5年至10年的時間。
RoboBrain作為開源具身大腦,由基座模型、A-LoRA模塊和T-LoRA模塊三部分組成。它能夠解讀人類指令和視覺圖像,生成基于實時圖像反饋的行動計劃,并預測每一步的軌跡及可操作區域。在AGD20K測試集上,RoboBrain的表現超越了當時的開源模型Qwen2-VL,展現出了卓越的指令理解和物體屬性識別能力。
與此同時,RoboOS框架則基于“大腦-小腦”分層架構,通過模塊化設計、智能任務管理和跨本體協作,為機器人提供了高效、靈活、可擴展的底層支持。在RoboOS的架構下,RoboBrain的復雜場景感知與決策能力能夠與小腦技能庫的高效執行能力深度結合,確保協作框架在長周期、高動態任務中的穩定運行。目前,RoboOS已支持多種不同類型的具身本體,包括松靈雙臂、睿爾曼單/雙臂、智元人形、宇樹人形等。
王仲遠表示,開源RoboBrain和RoboOS的目的在于推動具身智能的跨本體協作與規模化應用。他強調,雖然當前具身智能的發展仍處于早期階段,但智源研究院對于其長期發展持樂觀態度。他比喻說,就像10年前人們看待無人駕駛技術一樣,現在看具身智能也需要長遠的眼光。
為了促進整個行業的發展,智源研究院將所有研究工作和成果進行了開源開放。王仲遠表示,他們希望與本體廠商、應用廠商等合作伙伴一起協作,共同推動具身智能行業更好、更快的發展。同時,智源研究院還在積極建設具身智能創新平臺,聯合高校院所和產業鏈上下游企業,重點開展數據、模型、場景驗證等研究。
智源研發的FlagScale作為底層支撐框架,也在此次發布會上亮相。它支持大模型在多設備間的并行推理與多任務協同調度,能夠無縫集成視覺語言模型、軌跡生成模塊、感知識別等子系統,全面釋放具身大模型的系統潛力。
隨著RoboOS與RoboBrain的發布,智源研究院在具身智能領域的研究和應用邁出了重要一步。這兩項技術的開源開放,將為具身智能的跨本體協作與規模化應用提供有力支持,推動人工智能技術的進一步發展和普及。
本文鏈接:http://www.tebozhan.com/showinfo-45-11711-0.html智源研究院發布RoboOS與RoboBrain,加速具身智能場景應用
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 生數科技Vidu Q1大模型發布:視頻動作行為,皆可精準調控
下一篇: 阿里AI轉型:是實至名歸還是半路出家?