當前位置：首頁 > 元宇宙 > AI

斯坦福團隊新作：喊話就能指導機器人，任務成功率暴增，網友：特斯拉搞快點

來源：責編：時間：2024-04-11 08:56:29 140觀看

導讀斯坦福的 ALOHA 家務機器人團隊，發布了最新研究成果 ——項目名為 Yell At Your Robot（簡稱 YAY），有了它，機器人的“翻車”動作，只要喊句話就能糾正了！而且機器人可以隨著人類的喊話動態提升動作水平、即時調整策略，

斯坦福的 ALOHA 家務機器人團隊，發布了最新研究成果 ——

項目名為 Yell At Your Robot（簡稱 YAY），有了它，機器人的“翻車”動作，只要喊句話就能糾正了！

而且機器人可以隨著人類的喊話動態提升動作水平、即時調整策略，并根據反饋持續自我改進。

比如在這個場景中，機器人沒能完成系統設定的“把海綿放入袋子”的任務。

這時研究者直接朝它喊話，“用海綿把袋子撐得再開一些”，之后就一下子成功了。

而且，這些糾正的指令還會被系統記錄下來，成為訓練數據，用于進一步提高機器人的后續表現。

有網友看了說，既然已經能朝著機器人喊話了，那汽車是不是也快點安排上，還在線點名特斯拉和其自動駕駛軟件總監 Ashok Elluswamy。

成果發布后，前谷歌機器人高級研究員 Eric Jang，前 DeepMind 研究員、斯坦福客座教授 Karol Hausman 等一眾大佬也紛紛表示了肯定和贊許。

那么，用喊話調整的機器人，都能實現什么樣的動作呢？

喊話就能發號施令

利用 YAY 技術調教后，機器人以更高的成功率挑戰了物品裝袋、水果混合和洗盤子這三項復雜任務。

這三種任務的特點是都需要兩只手分別完成不同的動作，其中一只手要穩定地拿住容器并根據需要調整姿態，另一只手則需要準確定位目標位置并完成指令，而且過程中還涉及海綿這種軟性物體，拿捏的力度也是一門學問。

以打包裝袋這個任務為例，機器人在全自主執行的過程中會遇到各種各樣的困難，但通過喊話就能見招拆招。

只見機器人在將裝袋的過程中不小心把海綿掉落了下來，然后便無法再次撿起。

這時，開發者直接朝它喊話，口令就是簡單的“往我這邊挪一挪，然后往左”。

當按照指令做出動作后，第一次還是沒成功，但機器人記住了“往左”這個指令，再次左移之后便成功把海綿撿起來了。

但緊接著就出現了新的困難 —— 袋子的口被卡住了。

這時只要告訴它再把袋子打開一點點，機器人就“心領神會”，調整出了一系列后續動作，并最終成功完成任務。

而且不只是能糾正錯誤，任務的細節也能通過喊話實時調整，比如在裝糖的任務中，開發者覺得機器人拿的糖有點多了，只要喊出“少一點”，機器人就會將一部分糖果倒回盒子。

進一步地，人類發出的這些指令還會被系統記錄并用作微調，以提高機器人的后續表現。

比如在刷盤子這項任務中，經過微調之后的機器人清潔力度更強，范圍也變大了。

統計數據表明，機器人在經歷這種微調之后，平均任務成功率提高了 20%，如果繼續加入喊話指令還能繼續提高。

而且這樣的指令-微調過程可以迭代進行，每迭代一次機器人的表現都能有所提升。

那么，YAY 具體是如何實現的呢？

人類教誨“銘記在心”

架構上，整個 YAY 系統主要由高級策略和低級策略這兩個部分組成。

其中高級策略負責生成指導低級策略的語言指令，低級策略則用于執行具體動作。

具體來說，高級策略將攝像頭捕捉到的視覺信息編碼，與相關知識結合，然后由 Transformer 生成包含當前動作描述、未來動作預測等內容的指令。

而低級策略接收到語言指令后，會解析這些指令中的關鍵詞，并映射到機器人關節的目標位置或運動軌跡。

同時，YAY 系統引入了實時的語言糾正機制，人類的口頭命令優先級最高 —— 經識別后，直接傳遞給低級策略用于執行。

且在這個過程中命令會被系統記錄并用于微調高級策略 —— 通過學習人類提供的糾正性反饋，逐漸減少對即時口頭糾正的依賴，從而提高長期任務的自主成功率。

在完成基礎訓練并已經在真實環境中部署后，系統仍然可以繼續收集指令信息，不斷地從反饋中學習并進行自我改進。

作者簡介

本項目的第一作者是斯坦福大學的學生研究員 Lucy X. Shi，2019 年畢業于人大附中后進入南加州大學就讀計算機科學專業。

其間，Lucy 曾到英偉達實習研究多模態大模型，并曾與知名 AI 學者 Jim Fan 博士合作。

她的論文曾連續兩年被機器人頂會 CoRL 收錄，還入選過 NeurIPS，本人還被 DeepMind 邀請發表過演講。

Lucy 的導師 Chelsea Finn 是斯坦福計算機科學和電氣工程系助理教授，谷歌學術論文引用數超 4.7 萬，此前還在 Google Brain 工作過一段時間。

包括本項目在內，在 ALOHA 團隊發表的一系列論文當中，Finn 總是作為通訊作者出現。

此外，ALOHA 團隊的 Tony Z. Zhao、Sergey Levine 等研究人員，也是本文的共同作者。

論文地址：

https://arxiv.org/abs/2403.12910

本文來自微信公眾號：量子位（ID：QbitAI），作者：克雷西

本文鏈接：http://www.tebozhan.com/showinfo-45-3930-0.html斯坦福團隊新作：喊話就能指導機器人，任務成功率暴增，網友：特斯拉搞快點

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：阿里通義千問開源 320 億參數模型，已實現 7 款大語言模型全開源

下一篇：百度文心一言上線新功能，可快速定制自己的 AI 聲音

標簽：

熱門焦點

文心一言排名墊底，卻成為百度業績增長杠桿

文/侯煜編輯/羅卿知識增強大預言模式文心一言發布后，百度公司熱度大幅提升，文心一言到底能為百度的業績帶來多大的增益成為業內關注焦點。近日，百度（NASDAQ：BIDU/09888.HK）公布了
“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現嗎？

作者| 赤木瓶子如何終結“曇花一現”的命運，是潮流社交產品的長期命題，如今，在元宇宙浪潮的洗禮下，這一命題正在迎來新的可能性。近段時間，一款名為“啫喱”的社交A
Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

今日熱點：迪士尼任命新高管負責元宇宙業務；iFixit成為Valve Index VR頭顯和Steam Deck首家零件銷售商；Niantic與索尼達成合作，將為AR游戲《Ingress》帶來音頻體驗；V
8個最適合藝術家發行NFT的交易市場

近年來，加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術家和藝術鑒賞家的
Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

今日熱點：Meta展示AI系統Builder Bot；招聘信息顯示Meta正在探索具有蜂窩連接功能的VR/AR頭顯；英國VR工作室Coatsink Games正在為PSVR 2開發新游戲；VR節奏射擊游戲
「國產良心」NFT嘲諷了誰？

2月23日，一個名為「國產良心」的NFT項目被許多活躍的加密用戶注意到。該項目的官網風格尤為「不正經」，它絲毫沒有避諱自己的小作坊出身，還將「中國人不騙中國人
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當前數字景觀
HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態鏈AR眼鏡廠商

今日熱點：HTC Vive正式推出元宇宙平臺Viverse；騰訊投資小米生態鏈AR眼鏡廠商北京蜂巢科技；面部追蹤和眼動追蹤是Quest下一版本的“重點”；索尼PSVR 2將推遲至2023
爆發在即的Layer2賽道百花齊放，誰將是領跑者？

還記得幾年前最早我們提起ETH擴容，首先想到就是Layer2，而Layer2里，首先想到的是閃電網絡，狀態通道，Plasma…然后折騰了幾年，發現并沒有什么用，許多項目方和資本也等不

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

斯坦福團隊新作：喊話就能指導機器人，任務成功率暴增，網友：特斯拉搞快點

文心一言排名墊底，卻成為百度業績增長杠桿

“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現嗎？

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

8個最適合藝術家發行NFT的交易市場

Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

「國產良心」NFT嘲諷了誰？

元宇宙存在的意義和價值

HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態鏈AR眼鏡廠商

爆發在即的Layer2賽道百花齊放，誰將是領跑者？

最新推薦

關于年度熱詞NFT，除了錢，我們還可以聊點啥？

搭上“谷愛凌”，“柳夜熙們”站上風口？

完美世界被元宇宙“拒之門外”

下一個黃金賽道？NFT的碎片化!

初探元宇宙

售出6930萬美元的NFT已經過去一年，NFT如今是否已成為主流？

猜你喜歡

熱門推薦

相關資訊