在科技日新月異的當下,機器人領域的發展令人矚目。舞臺上翩翩起舞的機器人、格斗賽場上靈活翻轉的機器人身影,已不再是新鮮事。然而,在這股“技術炫風”背后,一個核心問題亟待解答:具身智能如何才能真正融入我們的生產和生活?目前面臨哪些技術障礙?哪些技能才是最具實際應用價值的?
近期,在為期兩天的2025北京智源大會上,多位行業領袖就此展開了深入探討。智源研究院理事長黃鐵軍、北京人形機器人創新中心總經理熊友軍、宇樹科技CEO王興興、Physical Intelligence聯合創始人兼CEO Karol Hausman、北京大學助理教授及銀河通用創始人兼CTO王鶴、穹徹智能聯合創始人盧策吾等,共同聚焦具身智能的現實挑戰與未來趨勢。
宇樹科技CEO王興興和Physical Intelligence的Karol Hausman認為,盡管機器人比賽更多被視為技術展示窗口,有助于提升公眾認知和產業關注度,但其本質仍是邁向實用化的重要步驟。王興興指出,人形機器人在實用性上雖未全面突破,但通過表演、比賽等形式展示全身動作能力,有助于市場教育和科普,同時具備一定的商業價值。他強調,這些“炫技”表演是通往真正實用化階段的中間橋梁。
王興興進一步解釋,他們希望通過參與這些活動,展示技術成果,并進行商業化拓展。他堅信,當AI技術,尤其是具身智能技術發展到一定階段時,家用機器人不僅能跳舞、參加格斗賽,更能勝任家務、工廠作業等多種任務。他坦言,目前讓人形機器人立即進入家庭和工廠還不太現實,但這些活動為技術落地提供了寶貴的實踐機會。
北京大學助理教授王鶴及穹徹智能聯合創始人盧策吾則提出,未來機器人比賽應從觀賞性向實用性轉變,聚焦實際應用場景,通過“生產力比賽”推動核心技能的形成與優化。他們認為,“移動抓取與放置”是最具突破潛力的通用任務,既適用于藥房、倉儲等多種場景,又是實現具身智能商業化的關鍵。
盧策吾強調,力反饋和對物理世界的深度理解,對于機器人應對真實復雜環境至關重要。他提出,在視覺語言行動模型(VLA)框架內引入物理世界知識,尤其是力反饋等多模態信息,能夠提升模型對復雜任務的應對能力和系統魯棒性。
在具身智能的發展路徑上,VLA逐漸成為行業共識。Karol Hausman認為,VLA是通往通用智能的重要基石,能夠從多源數據中學習并轉化為具體行動。他致力于構建一個通用模型,以跨平臺控制不同機器人完成多種任務。他指出,當前挑戰在于提升算法效率與模型穩定性,尤其是在陌生環境中的泛化能力。
王鶴同樣視VLA為核心技術路徑,但更強調其實用導向。他提出,應優先突破如“移動抓取與放置”等核心技能,并在端到端模型中融入合成數據訓練,以提高效率和落地性。他認為,目前具身智能在學術研究與產業應用之間存在差距,需要觸覺和力反饋等數據來提升魯棒性和成功率。
盧策吾則提出“數字基因”理念,結合高精度仿真數據與物理反饋,以模擬人類的下意識操作行為。他指出,仿真與真實世界的融合是提升系統表現的關鍵。同時,他也提到,人形機器人硬件的標準化和通用性對具身智能算法發展和落地有顯著影響,數據瓶頸部分原因正是由于機器人硬件平臺缺乏統一性。
對于未來通用機器人的形態,王興興表示,他不堅持一定要做人形機器人。他認為,人形機器人因人類數據可用性而具備訓練優勢,但長遠看應根據任務需求發展多樣化形態。他甚至指出,輪子底盤在實現移動方面也是“非常實用的”選擇。他預測,在通用人工智能(AGI)出現后,機器人的形態將會多樣化。
而北京人形機器人創新中心總經理熊友軍則堅定看好人形機器人。他指出,人形機器人在市場容量、自然交互和人類環境適配性方面具有長期競爭力。盡管短期內面臨成本與技術門檻,但未來潛力巨大。他的團隊正致力于提升人形機器人的能力。
智源研究院理事長黃鐵軍從宏觀視角指出,全面媲美人類的AGI(包括具身)仍需數十年。在未來5-10年,具身智能更可能專注于幫助人類完成危險或體力活。他強調,具身機器人的最終使命是超越人類,探索人類無法到達的未知領域。
本文鏈接:http://www.tebozhan.com/showinfo-45-13633-0.html具身智能未來何在?行業大佬激辯:機器人“能干活”方顯真功夫
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com