波士頓動(dòng)力也搞端到端AI了!
這次升級(jí),Atlas不僅可以聽(tīng)懂自然語(yǔ)言指令,還可以自主規(guī)劃動(dòng)作和處理意外。
只見(jiàn)小哥故意合上蓋子,機(jī)器人仍能識(shí)別并打開(kāi)箱子。
故意挪動(dòng)箱子位置,它也能精確識(shí)別到變化。
即使附近有遺漏的裝置,它也能發(fā)現(xiàn),并準(zhǔn)確放入箱子內(nèi)。
據(jù)介紹,此次更新由波士頓動(dòng)力與豐田研究院聯(lián)手推出,基于大型行為模型(LBM),帶來(lái)了Atlas的全新版本——Atlas MTS。
新成果一出,網(wǎng)友們紛紛叫好,光是官方在YouTube發(fā)布的視頻觀看人數(shù)就突破十萬(wàn),點(diǎn)贊超一萬(wàn)。
另有一批網(wǎng)友則欣慰的表示,膝蓋可以彎曲了,那背部就不會(huì)受傷了。
哇哦,點(diǎn)贊數(shù)2.4K說(shuō)明大家都很關(guān)心機(jī)器人身體健康嘛~
除此之外,關(guān)于全新能力具體實(shí)現(xiàn),官方發(fā)布了詳細(xì)報(bào)告。
給Atlas裝上大腦
報(bào)告指出,端到端的語(yǔ)言條件策略能讓機(jī)器人充分發(fā)揮自身優(yōu)勢(shì),實(shí)現(xiàn)行走、精確放置雙腳、蹲下、轉(zhuǎn)移重心,同時(shí)避免自身碰撞。
這種策略構(gòu)建過(guò)程分為以下4個(gè)步驟:
收集具身行為數(shù)據(jù);
處理、標(biāo)注和整理數(shù)據(jù);
訓(xùn)練神經(jīng)網(wǎng)絡(luò);
利用測(cè)試任務(wù)評(píng)估該策略。
更值得關(guān)注的是,此次大型行為模型采用4.5億參數(shù)的擴(kuò)散Transformer模型,并結(jié)合流匹配目標(biāo),能將包括30Hz圖像、人體感覺(jué)和自然語(yǔ)言指令等輸入信息轉(zhuǎn)化為控制Atlas活動(dòng)的動(dòng)作指令。
說(shuō)簡(jiǎn)單點(diǎn),Transformer像“全局之眼”, 把控整體架構(gòu)和動(dòng)作細(xì)節(jié)的關(guān)聯(lián)。擴(kuò)散是細(xì)化步驟,將模糊指令轉(zhuǎn)化為精準(zhǔn)動(dòng)作。流匹配損失則是真實(shí)參照,讓動(dòng)作既貼合現(xiàn)實(shí),又能靈活適應(yīng)不同場(chǎng)景。
在此過(guò)程中,波士頓動(dòng)力關(guān)鍵的是將Atlas的模型預(yù)測(cè)控制器與VR界面結(jié)合,從而覆蓋從手指級(jí)精細(xì)操作到全身伸展、移動(dòng)等各類任務(wù)需求。
這使得遠(yuǎn)程操作員能夠充分發(fā)揮機(jī)器人的性能,將自身動(dòng)作和感知與機(jī)器人的狀態(tài)保持同步。
除此之外,此次升級(jí)值得關(guān)注的是,Atlas能自主處理意外情況。
當(dāng)出現(xiàn)問(wèn)題時(shí),比如零件掉在地上或箱蓋未關(guān)閉,Atlas都能智能地做出反應(yīng)。
這簡(jiǎn)直就是給Atlas裝上大腦!
不僅如此,官方還稱只要是人能演示的動(dòng)作,Atlas都可以學(xué)習(xí)它,包括但不限于系繩子、折疊椅子和翻輪胎等。
不得不說(shuō),這學(xué)習(xí)能力真的驚到我了。
告別液壓,電驅(qū)機(jī)器人更適合AI
說(shuō)起波士頓動(dòng)力機(jī)器人,那不得不提一下Atlas液壓版。
此版本在2024年4月已退役,且在24小時(shí)內(nèi)發(fā)布全電動(dòng)版本。
畢竟液壓系統(tǒng)不僅成本高,響應(yīng)慢,還難以與AI系統(tǒng)集成。
相比之下,電機(jī)驅(qū)動(dòng)更精確、能耗低,且天然適配AI學(xué)習(xí)框架。
自波士頓動(dòng)力轉(zhuǎn)向電驅(qū)動(dòng)以來(lái),他們也是不斷推出新動(dòng)作。
去年8月,Atlas在RSS(機(jī)器人頂會(huì))上大秀俯臥撐(當(dāng)時(shí)還是沒(méi)有手指的,也可以稱為拳臥撐)。
動(dòng)作那是相當(dāng)標(biāo)準(zhǔn)~
過(guò)了兩個(gè)月,它就可以進(jìn)廠打工了,只需告訴Atlas前后搬運(yùn)的位置坐標(biāo),它就能全自動(dòng)分裝物件。
而在今年5月份,波士頓動(dòng)力再次升級(jí),讓機(jī)器人具備3D空間感知和實(shí)時(shí)物體追蹤能力,可以自主執(zhí)行更復(fù)雜的工業(yè)任務(wù)。
此次的大型行為模型(LBM),也意味著它正擁抱全新的技術(shù)方向。
看完液壓轉(zhuǎn)電驅(qū)的波士頓,再來(lái)了解一下國(guó)內(nèi)一直采用電驅(qū)的宇樹(shù)。
從四足機(jī)器狗Go系列,到人形機(jī)器人H1、G1、R1,宇樹(shù)始終延續(xù)著“小而美”的電驅(qū)哲學(xué),用更快的迭代速度,逐漸在全球打響了名號(hào)。
現(xiàn)在,180“芭蕾舞者”都出來(lái)了。
未來(lái),隨著電驅(qū)技術(shù)與AI算法的不斷融合,電驅(qū)機(jī)器人的時(shí)代才將真正到來(lái)。
本文鏈接:http://www.tebozhan.com/showinfo-17-178021-0.html波士頓動(dòng)力機(jī)器人終于有腦子了!人類故意使絆子也不怕
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 牛市越漲 心里越慌
下一篇: 阿里通義新一代語(yǔ)音模型Fun-ASR再進(jìn)化 垂直領(lǐng)域識(shí)別準(zhǔn)確率提升超15%