AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

阿里巴巴開源自主搜索 AI 智能體 WebAgent

來源: 責編: 時間:2025-06-02 11:05:28 44觀看
導讀 5 月 30 日消息,阿里巴巴昨日在 Github 上開源了其創(chuàng)新的自主搜索 AI Agent——WebAgent,具備端到端的自主信息檢索與多步推理能力,能夠像人類一樣在網(wǎng)絡環(huán)境中主動感知、決策和行動。例如,當用戶想了解某個特定

5 月 30 日消息,阿里巴巴昨日在 Github 上開源了其創(chuàng)新的自主搜索 AI Agent——WebAgent,具備端到端的自主信息檢索與多步推理能力,能夠像人類一樣在網(wǎng)絡環(huán)境中主動感知、決策和行動。LN228資訊網(wǎng)——每日最新資訊28at.com

例如,當用戶想了解某個特定領域的最新研究成果時,WebAgent 能夠主動搜索多個學術數(shù)據(jù)庫,篩選出最相關的文獻,并根據(jù)用戶的需求進行深入分析和總結。LN228資訊網(wǎng)——每日最新資訊28at.com

據(jù)介紹,WebAgent 不僅能識別文獻中的關鍵信息,還能通過多步推理將不同文獻中的觀點進行整合,最終為用戶提供一份全面且精準的研究報告。LN228資訊網(wǎng)——每日最新資訊28at.com

LN228資訊網(wǎng)——每日最新資訊28at.com

阿里巴巴 WebAgent 分為 WebDancer 和 WebWalker,前者是一種端到端智能體訓練框架,旨在增強基于網(wǎng)絡的 AI 智能體的多步驟信息搜索能力;后者則屬于“Web 遍歷中的 LLM 基準測試”。LN228資訊網(wǎng)——每日最新資訊28at.com

LN228資訊網(wǎng)——每日最新資訊28at.com

Web Agents 上的性能:LN228資訊網(wǎng)——每日最新資訊28at.com

LN228資訊網(wǎng)——每日最新資訊28at.com

WebDancer 的框架一共由 4 大塊組成,從數(shù)據(jù)構建到訓練優(yōu)化,逐步打造出能夠自主完成復雜信息檢索任務的智能體。LN228資訊網(wǎng)——每日最新資訊28at.com

瀏覽數(shù)據(jù)構建是整個框架的起點。在現(xiàn)實世界中,高質量的訓練數(shù)據(jù)是智能體能夠有效學習和泛化的關鍵。WebDancer 通過兩種創(chuàng)新的數(shù)據(jù)合成方法來解決傳統(tǒng)數(shù)據(jù)集的局限性。LN228資訊網(wǎng)——每日最新資訊28at.com

為了確保生成的軌跡既有效又連貫,WebDancer 采用了短推理和長推理兩種方法。短推理利用大模型直接生成簡潔的推理路徑,而長推理則通過推理模型逐步構建復雜的推理過程。LN228資訊網(wǎng)——每日最新資訊28at.com

在數(shù)據(jù)準備完成后,WebDancer 進入監(jiān)督微調(SFT)階段。這一階段的目標是通過高質量的軌跡數(shù)據(jù)對智能體進行初始化訓練,使其能夠適應信息檢索任務的格式和環(huán)境要求。LN228資訊網(wǎng)——每日最新資訊28at.com

在 SFT 過程中,WebDancer 將軌跡中的思考、行動和觀察內容分別標記,并計算損失函數(shù),以優(yōu)化模型的參數(shù)。為了提高模型的魯棒性,WebDancer 在計算損失時排除了外部反饋的影響,確保模型能夠專注于自主決策過程。這一階段的訓練為智能體提供了強大的初始能力,使其能夠在后續(xù)的強化學習階段更好地適應復雜的任務環(huán)境。LN228資訊網(wǎng)——每日最新資訊28at.com

強化學習(RL)階段是 WebDancer 框架的關鍵環(huán)節(jié)。在這一階段,智能體通過與環(huán)境的交互,學習如何在復雜的任務中做出最優(yōu)決策。WebDancer 采用了 DAPO 算法,這是一種專門針對智能體訓練設計的強化學習算法。LN228資訊網(wǎng)——每日最新資訊28at.com

DAPO 算法通過動態(tài)采樣機制,有效利用未充分利用的 QA 對,提高數(shù)據(jù)效率和策略的魯棒性。在 RL 過程中,智能體通過多次嘗試和反饋,逐步優(yōu)化其決策策略,最終實現(xiàn)高效的多步推理和信息檢索能力。LN228資訊網(wǎng)——每日最新資訊28at.com

附 WebAgent 官方地址:LN228資訊網(wǎng)——每日最新資訊28at.com

Github:https://github.com/Alibaba-NLP/WebAgentLN228資訊網(wǎng)——每日最新資訊28at.com

WebDancer論文:https://arxiv.org/ pdf/2505.22648LN228資訊網(wǎng)——每日最新資訊28at.com

WebWalker論文:https://arxiv.org/ pdf/2501.07572LN228資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-13298-0.html阿里巴巴開源自主搜索 AI 智能體 WebAgent

聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI“電老虎”:2025 年底預估占全球數(shù)據(jù)中心近 50% 用電量,首超加密貨幣挖礦

下一篇: OpenAI o3 AI 推理模型成關鍵“偵探”,發(fā)現(xiàn) Linux 內核高危漏洞

標簽:
  • 熱門焦點
  • AI網(wǎng)紅能年賺百萬,普通人的新機會來了?

    來源|運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年 ,數(shù)字人成為了當紅的“流量話題”和“商業(yè)機會"。不管是 AI 孫燕姿走紅網(wǎng)絡,還是 AI 數(shù)字
  • 《從營銷AIGC化到AIGC營銷化》報告發(fā)布

    來源:清元宇宙7月2日上午,清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中,清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
  • 刷完一場元宇宙世界杯音樂盛典,我爽了

    作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了?三刷都不嫌多的那種。按照慣例,每逢年底,直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
  • 中國銀保監(jiān)管委提示:謹慎投資,勿做接盤俠

    中國銀保監(jiān)管委,發(fā)布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • 新款英特爾芯片將使NFT鑄造變得更加方便

    科技巨頭和微處理器制造商英特爾(Intel)正在發(fā)布一款適用于 NFT 鑄造和挖礦的新芯片。新產(chǎn)品專注于效率、易操作性和可持續(xù)性,該公司的戰(zhàn)略是從加密興起與 NFT爆
  • 從虛擬餐廳到虛擬時裝秀,行業(yè)巨頭掀起元宇宙商標注冊潮

    自從 Facebook 更名為 Meta 后,關于元宇宙的討論愈發(fā)激烈,這一詞匯也越來越多的出現(xiàn)在我們的視野里。這是一個非常有趣的話題。伴隨著爭論,有些人認為是馬克·扎
  • 2021年中國元宇宙行業(yè)用戶行為分析熱點報告

    元宇宙網(wǎng)絡熱度高漲,中國網(wǎng)民對虛擬生態(tài)興趣濃厚。艾媒咨詢數(shù)據(jù)顯示,超六成的網(wǎng)民對“元宇宙”了解程度較高,在元宇宙較基礎的游戲領域,超九成的人對VR游戲更感興
  • 與元宇宙美少女藝術家的對話

    我最近宣布了我自己的NFT項目,這是我已經(jīng)工作了幾個月的事情。由于我之前只是一個收藏家,擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
  • 新聞業(yè)在元宇宙的現(xiàn)狀和未來

    “美聯(lián)社有毛病吧,這真的過分了!”,一位媒體編輯在推特中憤怒地表示。這是針對一款視頻NFT的批評言論之一,之后取消了此次銷售,因為該視頻呈現(xiàn)了移民穿越地中海的苦
Top