AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 科技  > 數(shù)碼

VLA模型:具身智能的突破與挑戰(zhàn)

來源: 責(zé)編: 時間:2025-06-04 08:03:22 27觀看
導(dǎo)讀在具身智能領(lǐng)域,視覺-語言-動作模型(VLA)作為一種新興范式,正逐漸嶄露頭角。該模型通過整合視覺信息、語言指令和行動決策,顯著提升了機(jī)器人對復(fù)雜環(huán)境的理解和適應(yīng)能力,為機(jī)器人從單一任務(wù)執(zhí)行向多樣化場景自主決策的轉(zhuǎn)變

在具身智能領(lǐng)域,視覺-語言-動作模型(VLA)作為一種新興范式,正逐漸嶄露頭角。該模型通過整合視覺信息、語言指令和行動決策,顯著提升了機(jī)器人對復(fù)雜環(huán)境的理解和適應(yīng)能力,為機(jī)器人從單一任務(wù)執(zhí)行向多樣化場景自主決策的轉(zhuǎn)變提供了強(qiáng)大支持。VLA因此成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。EJK28資訊網(wǎng)——每日最新資訊28at.com

近期,雷峰網(wǎng)與AI科技評論GAIR Live品牌聯(lián)合舉辦了一場線上圓桌沙龍,主題為“具身智能之VLA的實踐與突破”。此次沙龍由北京大學(xué)計算機(jī)學(xué)院助理教授仉尚航主持,并邀請了清華大學(xué)交叉信息院的助理教授高陽、趙行,以及北京大學(xué)人工智能研究院的助理教授楊耀東,共同探討VLA的最新進(jìn)展和未來方向。EJK28資訊網(wǎng)——每日最新資訊28at.com

EJK28資訊網(wǎng)——每日最新資訊28at.com

沙龍上,仉尚航首先引導(dǎo)討論了VLA的定義、起源及其與其他相關(guān)模型的區(qū)別。隨后,各位嘉賓深入分析了VLA的技術(shù)路線和新成果,探討了不同技術(shù)路線的優(yōu)缺點(diǎn),并圍繞機(jī)器人常見任務(wù),剖析了核心技術(shù)瓶頸和主流輸出范式。還討論了強(qiáng)化學(xué)習(xí)與VLA的結(jié)合、泛化能力的提升、異構(gòu)數(shù)據(jù)的利用以及協(xié)同訓(xùn)練等議題。EJK28資訊網(wǎng)——每日最新資訊28at.com

高陽指出,推理與數(shù)據(jù)是當(dāng)前VLA面臨的兩大核心挑戰(zhàn)。盡管已有不少研究探索了VLA與推理的結(jié)合路徑,但尚未找到最優(yōu)方案。同時,VLA的數(shù)據(jù)量級遠(yuǎn)不及訓(xùn)練大語言模型(VLM)的數(shù)據(jù),且多樣性嚴(yán)重不足,這限制了模型的能力提升。趙行表示,VLA在實際應(yīng)用中的系統(tǒng)運(yùn)行頻率單一化問題,以及高低頻自適應(yīng)閉環(huán)系統(tǒng)的設(shè)計,仍是未解決的課題。楊耀東則提到,當(dāng)前VLA訓(xùn)練存在割裂問題,大腦(VLM)和小腦(底層策略模型)多分開訓(xùn)練,缺乏端到端訓(xùn)練及類似人類大小腦的雙向交互。EJK28資訊網(wǎng)——每日最新資訊28at.com

在討論VLA的前世今生時,高陽回顧了VLA的起源和發(fā)展,指出其源于大模型的技術(shù)變革。楊耀東則從大模型視角和行為動作決策控制視角闡述了VLA的重要性。趙行則分享了GPT-4發(fā)布對其研究方向的啟發(fā),以及VLA在解決長尾問題上的潛力。EJK28資訊網(wǎng)——每日最新資訊28at.com

對于VLA的技術(shù)路線和最新進(jìn)展,高陽提到了架構(gòu)與數(shù)據(jù)兩方面的進(jìn)展,并強(qiáng)調(diào)了數(shù)據(jù)多樣性的重要性。楊耀東從模型架構(gòu)角度分類了VLA,并探討了行為動作空間的表征方式。趙行則關(guān)注雙系統(tǒng)設(shè)計,并介紹了不同團(tuán)隊在VLA方面的研究成果。EJK28資訊網(wǎng)——每日最新資訊28at.com

在探討VLA的核心技術(shù)瓶頸時,高陽強(qiáng)調(diào)推理和數(shù)據(jù)的挑戰(zhàn),趙行提到高低頻自適應(yīng)閉環(huán)系統(tǒng)的設(shè)計難題,楊耀東則指出端到端訓(xùn)練和測試時計算閉環(huán)的缺乏。對于強(qiáng)化學(xué)習(xí)與VLA的結(jié)合,嘉賓們一致認(rèn)為這是VLA發(fā)展的必由之路,但仍面臨許多未解問題。EJK28資訊網(wǎng)——每日最新資訊28at.com

在數(shù)據(jù)使用方面,高陽強(qiáng)調(diào)數(shù)據(jù)的多樣性比絕對數(shù)量更重要,并介紹了千尋智能如何利用互聯(lián)網(wǎng)數(shù)據(jù)優(yōu)化VLA模型。楊耀東則提出,互聯(lián)網(wǎng)數(shù)據(jù)雖然豐富,但信噪比低,且對具體任務(wù)的適用性有限。趙行則認(rèn)為,仿真數(shù)據(jù)可以作為真實數(shù)據(jù)的補(bǔ)充,通過技術(shù)手段縮小sim to real gap。EJK28資訊網(wǎng)——每日最新資訊28at.com

對于VLA的泛化能力,嘉賓們提出了多種提升策略,包括利用大量互聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行聯(lián)合訓(xùn)練、創(chuàng)新模型架構(gòu)、實現(xiàn)具身認(rèn)知等。在探討VLA與本體構(gòu)型設(shè)計的關(guān)系時,嘉賓們認(rèn)為VLA模型與機(jī)器人本體沒有必然綁定,但硬件局限和VLA能力需相互匹配。EJK28資訊網(wǎng)——每日最新資訊28at.com

最后,關(guān)于VLA是否能完成長程任務(wù),嘉賓們持不同觀點(diǎn)。高陽認(rèn)為,先通過VLM拆解任務(wù)再由VLA執(zhí)行是更實際的方法。楊耀東則強(qiáng)調(diào)VLA具備完成長程任務(wù)的潛力,并指出需賦予模型推理能力和測試時計算閉環(huán)。趙行則提出,需先定義和評測推理能力,再探索VLA在長程任務(wù)中的應(yīng)用。EJK28資訊網(wǎng)——每日最新資訊28at.com

在落地場景方面,嘉賓們一致認(rèn)為工業(yè)場景是VLA最先落地的選擇,但也提到了商業(yè)領(lǐng)域和ToBC模式等新場景的可能性。EJK28資訊網(wǎng)——每日最新資訊28at.com

此次圓桌沙龍為觀眾帶來了VLA領(lǐng)域的深入洞察和前沿思考,對于推動VLA技術(shù)的發(fā)展和應(yīng)用具有重要意義。EJK28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-24-155818-0.htmlVLA模型:具身智能的突破與挑戰(zhàn)

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 賽力斯5月銷量穩(wěn)健增長,鴻蒙智行全系交付再創(chuàng)新高!

下一篇: 雷軍透露:小米汽車工廠試用機(jī)器人,汽車芯片即將面世

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 不容錯過的MSBuild技巧,必備用法詳解和實踐指南

    一、MSBuild簡介MSBuild是一種基于XML的構(gòu)建引擎,用于在.NET Framework和.NET Core應(yīng)用程序中自動化構(gòu)建過程。它是Visual Studio的構(gòu)建引擎,可在命令行或其他構(gòu)建工具中使用
  • Flowable工作流引擎的科普與實踐

    一.引言當(dāng)我們在日常工作和業(yè)務(wù)中需要進(jìn)行各種審批流程時,可能會面臨一系列技術(shù)和業(yè)務(wù)上的挑戰(zhàn)。手動處理這些審批流程可能會導(dǎo)致開發(fā)成本的增加以及業(yè)務(wù)復(fù)雜度的上升。在這
  • 10天營收超1億美元,《星鐵》比《原神》差在哪?

    來源:伯虎財經(jīng)作者:陳平安即便你沒玩過《原神》,你一定聽說過的它的大名。恨它的人把《原神》開服那天稱作是中國游戲史上最黑暗的一天,有粉絲因為索尼在PS平臺上線《原神》,怒而
  • 自律,給不了Keep自由!

    來源 | 互聯(lián)網(wǎng)品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • “又被陳思誠騙了”

    作者|張思齊 出品|眾面(ID:ZhongMian_ZM)如今的國產(chǎn)懸疑電影,成了陳思誠的天下。最近大爆電影《消失的她》票房突破30億斷層奪魁暑期檔,陳思誠再度風(fēng)頭無兩。你可以說陳思誠的
  • 攜眾多高端產(chǎn)品亮相ChinaJoy,小米帶來一場科技與人文的視聽盛宴

    7月28日,全球數(shù)字娛樂領(lǐng)域最具知名度與影響力的年度盛會中國國際數(shù)碼互動娛樂展覽會(簡稱ChinaJoy)在上海新國際博覽中心盛大開幕。作為全球領(lǐng)先的科
  • 三星電子Q2營收60萬億韓元 存儲業(yè)務(wù)營收同比仍下滑超過50%

    7月27日消息,據(jù)外媒報道,從三星電子所發(fā)布的財報來看,他們主要利潤來源的存儲芯片業(yè)務(wù)在今年二季度仍不樂觀,營收同比仍在大幅下滑,所在的設(shè)備解決方案
  • 蘋果公司要求三星和LG Display生產(chǎn)「無邊框」OLED iPhone顯示屏

    據(jù) The Elec 報道,蘋果已要求其供應(yīng)商為未來的 iPhone 型號開發(fā)「無邊框」OLED 顯示面板。蘋果顯然已要求三星和 LG Display 開發(fā)新的 OLED 顯示面
  • 世界人工智能大會國際日開幕式活動在世博展覽館開啟

    30日上午,世界人工智能大會國際日開幕式活動在世博展覽館開啟,聚集國際城市代表、重量級院士專家、國際創(chuàng)新企業(yè)代表,共同打造人工智能交流平臺。上海市副市
Top