3 月 12 日消息,北京時間今晚,谷歌 DeepMind 推出兩款新型 AI 模型,旨在幫助機器人完成更多現實世界中的任務。
其中一款名為 Gemini Robotics,是一款視覺語言行動模型,能夠使機器人在沒有進行過專門訓練的情況下理解新的情境。
Gemini Robotics 基于谷歌最新版本的 AI 旗艦模型 ——Gemini 2.0。谷歌 DeepMind 機器人部門高級總監 Carolina Parada 曾表示,Gemini Robotics 依托 Gemini 的多模態世界理解能力,通過加入物理行動的新模態,將其應用到現實世界中。
該模型在谷歌 DeepMind 認為構建高效機器人所需的三大核心領域取得了進展:通用性、互動性和靈活性。除了能夠應對新的情境外,Gemini Robotics 在與人類及環境的互動上表現更好,且能夠執行更精確的物理操作,比如折紙或打開瓶蓋。
另一款則是 Gemini Robotics-ER(具象推理)模型,公司稱其為一種先進的視覺語言模型,能夠“理解復雜且動態的世界”。
Parada 進一步解釋道,當你在裝便當盒時,桌上的物品擺放位置和如何操作是你必須考慮的內容。Gemini Robotics-ER 正是為此類推理任務而設計,機器人專家可通過該模型與現有的低級控制系統對接,開啟由 Gemini Robotics-ER 驅動的新功能。
谷歌 DeepMind 的研究員 Vikas Sindhwani 表示,公司正在開發一種“分層安全策略”,并稱 Gemini Robotics-ER 模型已被訓練用于評估在特定情況下某個動作是否安全。公司還發布了新的基準和框架,推動 AI 領域的安全研究。據了解,去年,谷歌 DeepMind 推出了“機器人憲法”,這是一套受艾薩克?阿西莫夫啟發的機器人行為規范。
據外媒 The Verge,谷歌 DeepMind 與 Apptronik 合作,共同致力于“打造下一代人形機器人”。此外,谷歌還向包括 Agile Robots、Agility Robotics、波士頓動力和 Enchanted Tools 在內的“受信任的測試者”開放了 Gemini Robotics-ER 模型。Parada 表示:“我們專注于打造能夠理解物理世界并在其中行動的智能,我們非常期待將這一技術應用于多個領域和多種表現形式。”
本文鏈接:http://www.tebozhan.com/showinfo-45-11487-0.html谷歌 DeepMind 推出新 AI 模型,機器人未經訓練也能執行現實任務
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com