AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

微軟推出 XOT 方法,提升語言模型推理能力

來源: 責(zé)編: 時(shí)間:2023-11-18 17:05:07 318觀看
導(dǎo)讀 11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經(jīng)網(wǎng)絡(luò),來增強(qiáng) AI 模型推理能力。微軟和佐治亞理工學(xué)院、華東師范大學(xué)合作開發(fā)了該算

11 月 15 日消息,微軟近日推出了名為“Everything of Thought”(XOT)的方法,靈感來自谷歌 DeepMind 的 AlphaZero,利用緊湊的神經(jīng)網(wǎng)絡(luò),來增強(qiáng) AI 模型推理能力。25B28資訊網(wǎng)——每日最新資訊28at.com

25B28資訊網(wǎng)——每日最新資訊28at.com

25B28資訊網(wǎng)——每日最新資訊28at.com

25B28資訊網(wǎng)——每日最新資訊28at.com

微軟和佐治亞理工學(xué)院、華東師范大學(xué)合作開發(fā)了該算法,整合了強(qiáng)化學(xué)習(xí)(reinforcement learning)和蒙特卡洛樹搜索 (MCTS) 能力,在復(fù)雜決策環(huán)境中,進(jìn)一步提高解決問題的有效性。25B28資訊網(wǎng)——每日最新資訊28at.com

注:微軟研究團(tuán)隊(duì)表示 XOT 方法可以讓語言模型擴(kuò)展到不熟悉的問題上,在 Game of 24、8-Puzzle 和 Pocket Cube 嚴(yán)苛測試中提升明顯。結(jié)果表明,XOT 明顯優(yōu)于其他方法,甚至解決了其他方法失敗的問題。但是,XOT 并沒有達(dá)到 100% 的可靠性。25B28資訊網(wǎng)——每日最新資訊28at.com

25B28資訊網(wǎng)——每日最新資訊28at.com

XOT 框架包括以下關(guān)鍵步驟:25B28資訊網(wǎng)——每日最新資訊28at.com

預(yù)訓(xùn)練階段:MCTS 模塊在特定任務(wù)上進(jìn)行預(yù)訓(xùn)練,以學(xué)習(xí)有關(guān)有效思維搜索的領(lǐng)域知識(shí)。輕量級(jí)策略和價(jià)值網(wǎng)絡(luò)指導(dǎo)搜索。思想搜索: 在推理過程中,預(yù)訓(xùn)練的 MCTS 模塊使用策略 / 價(jià)值網(wǎng)絡(luò)來有效地探索和生成 LLM 的思想軌跡。25B28資訊網(wǎng)——每日最新資訊28at.com

思想修正:LLM 審查 MCTS 的思想并識(shí)別任何錯(cuò)誤。修正的想法是通過額外的 MCTS 模擬產(chǎn)生的。25B28資訊網(wǎng)——每日最新資訊28at.com

LLM 推理: 將修改后的想法提供給 LLM 解決問題的最終提示。25B28資訊網(wǎng)——每日最新資訊28at.com

在此附上論文 [PDF] 地址,感興趣的用戶可以深入閱讀。25B28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-2566-0.html微軟推出 XOT 方法,提升語言模型推理能力

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: DeepMind 大模型登 Science:1 分鐘預(yù)測 10 天天氣數(shù)據(jù),90% 指標(biāo)超越人類最強(qiáng)模型

下一篇: 消息稱滴滴組建大模型團(tuán)隊(duì),將落地部分個(gè)人出行和企業(yè)差旅場景

標(biāo)簽:
  • 熱門焦點(diǎn)

相關(guān)資訊

    SQL Error: select * from ***_ecms_news11 where id in(,189,88,169,63,22) limit 6
Top