4 月 1 日消息,亞馬遜于當地時間周一正式發布了其通用人工智能智能體(AI agent) ——Nova Act。該智能體具備操控網絡瀏覽器并自主執行簡單網絡任務的能力。與此同時,亞馬遜還推出了配套的 Nova Act 軟件開發工具包(SDK),旨在幫助開發者利用 Nova Act 構建智能體應用原型。
據了解,Nova Act 由亞馬遜新近在舊金山成立的 AGI(通用人工智能)實驗室研發,該技術未來也將為備受期待的生成式 AI 增強版語音助手 Alexa + 提供關鍵功能支持。不過,亞馬遜方面表示,今日起開放的版本為“研究預覽版”,功能尚待完善。
開發者可以通過新設立的專屬網站 nova.amazon.com 獲取 Nova Act 工具包,該網站同時也是亞馬遜展示其旗下各類 Nova 基礎模型的平臺。
Nova Act 的推出標志著亞馬遜正式加入 AI 智能體技術的競爭行列,意在憑借自研的通用 AI 智能體技術,與 OpenAI 的 Operator 和 Anthropic 的 Computer Use 等產品展開競爭。當前,多家領先科技公司普遍認為,能夠代替用戶瀏覽網頁、執行任務的 AI 智能體將極大提升現有 AI 聊天機器人的實用性。盡管亞馬遜并非首家開發此類技術的公司,但憑借其龐大的 Alexa 用戶基礎,Nova Act 未來可能擁有最廣泛的應用潛力。
亞馬遜介紹稱,開發者使用 Nova Act SDK,將能夠為用戶自動化處理一些基礎性網絡操作,例如從餐飲品牌 Sweetgreen 訂購沙拉或是在線上預訂餐廳晚餐。該工具包提供了一系列工具,使 AI 智能體能夠瀏覽網頁、填寫表單、在日歷上選擇日期等。
在性能方面,亞馬遜聲稱,在公司內部的多項測試中,Nova Act 的表現優于來自 OpenAI 和 Anthropic 的同類智能體。以衡量 AI 智能體與屏幕文本交互能力的 ScreenSpot Web Text 測試為例,Nova Act 得分高達 94%,超過了 OpenAI 的 CUA(88%)和 Anthropic 的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亞馬遜并未公布 Nova Act 在如 WebVoyager 等行業更常用的智能體評估基準上的測試結果。
Nova Act 是亞馬遜上述 AGI 實驗室對外發布的首個公開產品。該實驗室由前 OpenAI 研究員 David Luan 和 Pieter Abbeel 共同領導。這兩位專家在去年被亞馬遜聘用以主導其 AI 智能體研發工作之前,分別創立了 AI 初創公司 Adept 和 Covariant。
對于一個以 AGI 為目標的實驗室為何會開發訂購沙拉的 AI 智能體,Luan 在接受 TechCrunch 采訪時解釋道,他將智能體視為構建超智能 AI 系統的關鍵一步。他將 AGI 定義為“一個能夠幫助你在計算機上完成人類所能做的任何事情的 AI 系統”。Luan 還表示,其團隊設計的 Nova Act SDK 旨在可靠地自動化執行簡短、簡單的任務,并為開發者提供了精確定義何時需要人類介入智能體工作流程的工具。他希望借此幫助開發者創建更可靠的智能體應用,即使這些應用不一定是完全自主運行的。
目前,來自 OpenAI、谷歌和 Anthropic 等公司的早期 AI 智能體普遍面臨跨不同領域應用時可靠性不足的重大挑戰。根據 TechCrunch 等媒體的測試,這些系統往往運行緩慢,難以長時間獨立工作,且容易犯下人類通常不會犯的錯誤。亞馬遜是否已經找到了克服這些難題的有效方法,還是其 Nova Act 智能體也將受困于同樣的缺陷,市場將拭目以待。
本文鏈接:http://www.tebozhan.com/showinfo-45-11901-0.html亞馬遜推出 Nova Act:可操控網頁瀏覽器的 AI 智能體
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com