在人工智能領(lǐng)域,Manus智能體的出現(xiàn)引發(fā)了廣泛的討論與關(guān)注。Manus憑借其獨(dú)特的定位,成功將智能體概念從抽象推向具體,盡管業(yè)界對(duì)其技術(shù)創(chuàng)新的質(zhì)疑聲不斷,認(rèn)為Manus更多是現(xiàn)有技術(shù)的融合而非底層創(chuàng)新。
在AI智能體推理與決策研討會(huì)(AIR 2025)上,來(lái)自倫敦大學(xué)學(xué)院、新加坡南洋理工大學(xué)、Weco AI、Google DeepMind、meta、華為、阿里等多位學(xué)術(shù)界和工業(yè)界的研究人員圍繞強(qiáng)化學(xué)習(xí)、推理決策、AI智能體展開(kāi)了深入討論。這些討論不僅揭示了智能體技術(shù)的最新進(jìn)展,也探討了未來(lái)可能的發(fā)展方向。
新加坡南洋理工大學(xué)的安波教授在研討會(huì)上分享了團(tuán)隊(duì)在智能體技術(shù)上的最新成果。他詳細(xì)闡述了從基于強(qiáng)化學(xué)習(xí)的智能體到由大型語(yǔ)言模型驅(qū)動(dòng)的智能體的演變過(guò)程,并介紹了Q*算法。該算法通過(guò)多步驟推理進(jìn)行審慎規(guī)劃,并在學(xué)習(xí)Q值模型的過(guò)程中,采用離線強(qiáng)化學(xué)習(xí)、最佳回滾軌跡獎(jiǎng)勵(lì)以及與更強(qiáng)大LLM共同完成的軌跡獎(jiǎng)勵(lì)三個(gè)關(guān)鍵步驟。
初創(chuàng)公司W(wǎng)eco AI的CTO Yuxiang則介紹了AIDE,一個(gè)由人工智能驅(qū)動(dòng)的Agent,能夠處理完整的機(jī)器和工程任務(wù)。Yuxiang將機(jī)器學(xué)習(xí)和工程視為代碼優(yōu)化問(wèn)題,將整個(gè)過(guò)程形式化為在解空間中的樹(shù)搜索。AIDE能夠在任何大語(yǔ)言模型編寫的代碼空間中進(jìn)行搜索,從而找到最優(yōu)解。
倫敦大學(xué)學(xué)院的宋研討論了強(qiáng)化學(xué)習(xí)在大型語(yǔ)言模型推理中的作用,并指出DeepSeek模型在強(qiáng)化學(xué)習(xí)階段學(xué)會(huì)了自我糾正。這一現(xiàn)象表明,大型語(yǔ)言模型在基礎(chǔ)模型已具備自我糾正能力的基礎(chǔ)上,通過(guò)強(qiáng)化學(xué)習(xí)可以進(jìn)一步提升其性能。
Google DeepMind的研究員馮熙棟則提出了一種新的理念,即將強(qiáng)化學(xué)習(xí)的組成部分用自然語(yǔ)言描述出來(lái)。他嘗試將策略、值函數(shù)、貝爾曼方程等傳統(tǒng)強(qiáng)化學(xué)習(xí)概念映射到自然語(yǔ)言表示空間中,從而重新定義強(qiáng)化學(xué)習(xí)。
在研討會(huì)上,來(lái)自華為倫敦的邵坤介紹了面向通用型GUI Agent的模型和優(yōu)化方法。他展示了GUI Agent在不同任務(wù)中的表現(xiàn),并討論了如何通過(guò)生成模型、Agent系統(tǒng)、微調(diào)和評(píng)估等方法來(lái)提升GUI Agent的性能和效率。
阿里通義千問(wèn)的林俊旸則分享了Qwen大模型在數(shù)據(jù)量、模型規(guī)模和上下文長(zhǎng)度擴(kuò)展方面的最新進(jìn)展。他透露,Qwen 2.5版本的數(shù)據(jù)量已擴(kuò)展到18T,并計(jì)劃使用更多token進(jìn)行訓(xùn)練。同時(shí),Qwen在模型規(guī)模和上下文長(zhǎng)度擴(kuò)展方面也取得了顯著進(jìn)展,能夠處理更長(zhǎng)的文本和更復(fù)雜的任務(wù)。
這些研究成果不僅展示了AI智能體技術(shù)的最新進(jìn)展,也為未來(lái)智能體技術(shù)的發(fā)展提供了重要參考。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的不斷拓展,AI智能體將在更多領(lǐng)域發(fā)揮重要作用。
本文鏈接:http://www.tebozhan.com/showinfo-26-142885-0.htmlAI智能體新紀(jì)元:AIR 2025研討會(huì)探索技術(shù)前沿與未來(lái)趨勢(shì)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 國(guó)產(chǎn)超大直徑盾構(gòu)機(jī)“江海號(hào)”啟動(dòng)!世界最長(zhǎng)水下公路隧道開(kāi)掘