當(dāng)前位置：首頁 > 元宇宙 > AI

微軟推出 XOT 方法，提升語言模型推理能力

來源：責(zé)編：時(shí)間：2023-11-18 17:05:07 318觀看

導(dǎo)讀 11 月 15 日消息，微軟近日推出了名為“Everything of Thought”（XOT）的方法，靈感來自谷歌 DeepMind 的 AlphaZero，利用緊湊的神經(jīng)網(wǎng)絡(luò)，來增強(qiáng) AI 模型推理能力。微軟和佐治亞理工學(xué)院、華東師范大學(xué)合作開發(fā)了該算

11 月 15 日消息，微軟近日推出了名為“Everything of Thought”（XOT）的方法，靈感來自谷歌 DeepMind 的 AlphaZero，利用緊湊的神經(jīng)網(wǎng)絡(luò)，來增強(qiáng) AI 模型推理能力。

微軟和佐治亞理工學(xué)院、華東師范大學(xué)合作開發(fā)了該算法，整合了強(qiáng)化學(xué)習(xí)（reinforcement learning）和蒙特卡洛樹搜索（MCTS）能力，在復(fù)雜決策環(huán)境中，進(jìn)一步提高解決問題的有效性。

注：微軟研究團(tuán)隊(duì)表示 XOT 方法可以讓語言模型擴(kuò)展到不熟悉的問題上，在 Game of 24、8-Puzzle 和 Pocket Cube 嚴(yán)苛測試中提升明顯。結(jié)果表明，XOT 明顯優(yōu)于其他方法，甚至解決了其他方法失敗的問題。但是，XOT 并沒有達(dá)到 100% 的可靠性。

XOT 框架包括以下關(guān)鍵步驟:

預(yù)訓(xùn)練階段：MCTS 模塊在特定任務(wù)上進(jìn)行預(yù)訓(xùn)練，以學(xué)習(xí)有關(guān)有效思維搜索的領(lǐng)域知識(shí)。輕量級(jí)策略和價(jià)值網(wǎng)絡(luò)指導(dǎo)搜索。思想搜索: 在推理過程中，預(yù)訓(xùn)練的 MCTS 模塊使用策略 / 價(jià)值網(wǎng)絡(luò)來有效地探索和生成 LLM 的思想軌跡。

思想修正：LLM 審查 MCTS 的思想并識(shí)別任何錯(cuò)誤。修正的想法是通過額外的 MCTS 模擬產(chǎn)生的。

LLM 推理: 將修改后的想法提供給 LLM 解決問題的最終提示。

在此附上論文 [PDF] 地址，感興趣的用戶可以深入閱讀。

本文鏈接：http://www.tebozhan.com/showinfo-45-2566-0.html微軟推出 XOT 方法，提升語言模型推理能力

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： DeepMind 大模型登 Science：1 分鐘預(yù)測 10 天天氣數(shù)據(jù)，90% 指標(biāo)超越人類最強(qiáng)模型

下一篇：消息稱滴滴組建大模型團(tuán)隊(duì)，將落地部分個(gè)人出行和企業(yè)差旅場景

標(biāo)簽：

熱門焦點(diǎn)

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會(huì)來了？

來源｜運(yùn)營研究社作者 | 張知白編輯 | 楊佩汶設(shè)計(jì) | 晏談夢潔2023 年，數(shù)字人成為了當(dāng)紅的“流量話題”和“商業(yè)機(jī)會(huì)"。不管是 AI 孫燕姿走紅網(wǎng)絡(luò)，還是 AI 數(shù)字
元宇宙是投資中國的第五次重大機(jī)遇

作者為凱思博投資董事長導(dǎo)語：投資邏輯要來自于人性在社會(huì)發(fā)展過程中的普遍規(guī)律，由第一性原理出發(fā)找出重大的投資機(jī)會(huì)來。1978年的改革開放到今天，中國總共經(jīng)歷了
中文在線的“元宇宙”故事，資本聽膩了？

被譽(yù)為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國移動(dòng)通信聯(lián)合會(huì)元宇宙產(chǎn)業(yè)委員會(huì)揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價(jià)值？

在剛剛結(jié)束不久的2021年江蘇衛(wèi)視跨年演唱會(huì)上，虛擬鄧麗君與歌手周深同臺(tái)聯(lián)唱，實(shí)現(xiàn)了跨時(shí)代合作，而這還不只是“鄧麗君”，嗶哩嗶哩、東方衛(wèi)視等多家跨年晚會(huì)都出現(xiàn)
冰墩墩還能火多久？

作者：田巧云題圖源自北京2022年冬奧會(huì)官方微博如果要問2022年的開年明星是誰，冰墩墩當(dāng)仁不讓。幾乎所有人都被那個(gè)抖雪的動(dòng)作實(shí)力圈粉。在社交媒體的助推，以及日
從NFT頂級(jí)公鏈到Web3.0基礎(chǔ)設(shè)施：帶你了解不一樣的Flow

對(duì)于大部分年輕人來說，剛剛過去的春節(jié)有一個(gè)詞語突然成為了品牌宣傳的流行語，作為從NFT中衍生出來的“數(shù)字藏品”一時(shí)間獲得了不少品牌青睞，他們紛紛推出自己的數(shù)
韓國建立元宇宙生態(tài)系統(tǒng)，智度股份發(fā)布元宇宙社區(qū)Meta彼岸

財(cái)聯(lián)社|區(qū)塊鏈日?qǐng)?bào)28日訊今日《元宇宙新鮮事》有：杭州第十三次黨代會(huì)報(bào)告指出抓緊布局元宇宙等未來產(chǎn)業(yè)；韓國科學(xué)信息通信技術(shù)部宣布投資1.85億美元建立元宇宙
為什么元宇宙將永遠(yuǎn)改變體育和你的生活？

自從Facebook更名為Meta以來，Metaverse這個(gè)詞已經(jīng)被大家所熟知。但是當(dāng)Metaverse仍然被許多人視為一個(gè)虛擬的平行世界時(shí)，一些項(xiàng)目已經(jīng)顯示出Metaverse將如何永遠(yuǎn)
元宇宙不完全是想出來的，而是實(shí)打?qū)嵶龀鰜淼?/a>

沈陽強(qiáng)調(diào)，元宇宙不完全是想出來的，而是靠實(shí)打?qū)嵶龀鰜淼模换ヂ?lián)網(wǎng)向三維化升級(jí)是已經(jīng)明確的大方向，這意味著大量的資金和技術(shù)會(huì)持續(xù)涌入。跨入2022年，元宇宙并沒有“

元宇宙終究沒火過兩年

時(shí)尚領(lǐng)域進(jìn)軍元宇宙，2022年會(huì)帶來哪些顛覆性的全新體驗(yàn)？

2022年最具關(guān)注的9個(gè)頭像NFT項(xiàng)目

NFT教育要從娃娃抓起！這些青少年藝術(shù)家已經(jīng)賺取了幾千萬美金

NFTs正迎來數(shù)十億美元的繁榮--NFT零工經(jīng)濟(jì)從業(yè)者開始暴賺

虛擬偶像行業(yè)的商用價(jià)值逐漸凸顯，IP生態(tài)圈也逐漸成型

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

微軟推出 XOT 方法，提升語言模型推理能力

AI網(wǎng)紅能年賺百萬，普通人的新機(jī)會(huì)來了？

元宇宙是投資中國的第五次重大機(jī)遇

中文在線的“元宇宙”故事，資本聽膩了？

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價(jià)值？

冰墩墩還能火多久？

從NFT頂級(jí)公鏈到Web3.0基礎(chǔ)設(shè)施：帶你了解不一樣的Flow

韓國建立元宇宙生態(tài)系統(tǒng)，智度股份發(fā)布元宇宙社區(qū)Meta彼岸

為什么元宇宙將永遠(yuǎn)改變體育和你的生活？

元宇宙不完全是想出來的，而是實(shí)打?qū)嵶龀鰜淼?/a>

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊