當(dāng)前位置：首頁 > 元宇宙 > AI

被曝裁員、清空社交賬號后，Manus 首度發(fā)布技術(shù)博客總結(jié)經(jīng)驗教訓(xùn)

來源：責(zé)編：時間：2025-07-22 10:58:35 28觀看

導(dǎo)讀 7 月 19 日消息，前段時間，報道了 AI 智能體平臺 Manus 被曝裁員、清空國內(nèi)多平臺賬號等消息。北京時間今天早些時候，Manus 聯(lián)合創(chuàng)始人季逸超通過官方博客發(fā)布了上千字的技術(shù)解析長文，復(fù)盤公司從今年年初爆火至今

7 月 19 日消息，前段時間，報道了 AI 智能體平臺 Manus 被曝裁員、清空國內(nèi)多平臺賬號等消息。北京時間今天早些時候，Manus 聯(lián)合創(chuàng)始人季逸超通過官方博客發(fā)布了上千字的技術(shù)解析長文，復(fù)盤公司從今年年初爆火至今歷經(jīng)“起起落落”的開發(fā)思路與教訓(xùn)。

今年 3 月，由國內(nèi) Monica 團隊研發(fā)推出的 Manus 在海外社交平臺推出，Manus 號稱是全球首款通用智能體（Agent），可獨立解決復(fù)雜任務(wù)。在通用 AI 助手基準(zhǔn)測試 GAIA 的全部難度級別中的評分甚至遠遠超越 OpenAI 的 DeepResearch。Manus 放出的演示視頻中展現(xiàn)出的驚艷表現(xiàn)，瞬間引爆用戶熱情，但是 Manus 僅限邀請體驗，渴望第一時間體驗 Manus 的用戶在海內(nèi)外各大社區(qū)平臺紛紛留言“求邀請碼”，這也讓 Manus 一炮而紅，刷屏社交平臺。

附博客文章大意如下：

在 Manus 項目的最初階段，我和我的團隊面臨著一個關(guān)鍵的決定：我們應(yīng)該使用開源基礎(chǔ)來訓(xùn)練一個端到端的 Agentic 模型，還是在前沿模型的上下文學(xué)習(xí)能力之上構(gòu)建一個 Agent？

回想我在 NLP 領(lǐng)域的第一個十年，我們沒有這種選擇的余地。在遙遠的 BERT 時代（是的，已經(jīng)七年了），模型必須經(jīng)過微調(diào)和評估，才能轉(zhuǎn)移到新的任務(wù)。即使與今天的 LLMs 相比，當(dāng)時的模型非常小，但這個過程通常每次迭代都需要幾周時間。對于快速發(fā)展的應(yīng)用，尤其是在達到 PMF 之前，如此緩慢的反饋循環(huán)是不可接受的。這是我上次創(chuàng)業(yè)時的一個慘痛教訓(xùn)，當(dāng)時我從頭開始訓(xùn)練模型，用于開放信息提取和語義搜索。后來出現(xiàn)了 GPT-3 和 Flan-T5，我的內(nèi)部模型一夜之間變得無關(guān)緊要。具有諷刺意味的是，這些模型標(biāo)志著上下文學(xué)習(xí)的開始，以及一條全新的前進道路。

那次來之不易的教訓(xùn)讓我們明確了選擇：Manus 將押注于上下文工程。這使我們能夠在幾個小時內(nèi)交付改進，而不是幾周，并使我們的產(chǎn)品與底層模型正交：如果模型進步是漲潮，我們希望 Manus 成為船，而不是卡在海底的柱子。

盡管如此，上下文工程的結(jié)果遠非簡單。這是一門實驗科學(xué) —— 我們已經(jīng)重建了四次 Agent 框架，每次都是在發(fā)現(xiàn)塑造上下文的更好方法之后。我們親切地將這種架構(gòu)搜索、提示調(diào)整和經(jīng)驗猜測的手動過程稱為“隨機梯度下降”。它并不優(yōu)雅，但它有效。

這篇文章分享了我們通過自己的“SGD”達到的局部最優(yōu)解。如果您正在構(gòu)建自己的 AI Agent，我希望這些原則能幫助您更快地收斂。

圍繞 KV 緩存進行設(shè)計

如果我必須選擇一個指標(biāo)，我會認為 KV 緩存命中率是生產(chǎn)階段 AI Agent 最重要的指標(biāo)。它直接影響延遲和成本。要理解為什么，讓我們看看一個典型的 Agent 是如何運作的：

在收到用戶輸入后，Agent 會通過一系列工具的使用來完成任務(wù)。在每次迭代中，模型都會根據(jù)當(dāng)前上下文從預(yù)定義的動作空間中選擇一個動作。然后，該動作在環(huán)境（例如，Manus 的虛擬機沙箱）中執(zhí)行，以產(chǎn)生一個觀察結(jié)果。動作和觀察結(jié)果被附加到上下文中，形成下一次迭代的輸入。這個循環(huán)一直持續(xù)到任務(wù)完成。

正如你可以想象的那樣，上下文隨著每一步的進行而增長，而輸出 —— 通常是一個結(jié)構(gòu)化的函數(shù)調(diào)用 —— 則相對較短。這使得與聊天機器人相比，Agent 中的預(yù)填充和解碼之間的比例高度傾斜。例如，在 Manus 中，平均輸入與輸出的 token 比例約為 100:1。

幸運的是，具有相同前綴的上下文可以利用 KV 緩存，從而大大減少首個令牌生成時間 (TTFT) 和推理成本 —— 無論您使用的是自托管模型還是調(diào)用推理 API。而且我們說的不是小幅節(jié)省：例如，使用 Claude Sonnet，緩存的輸入令牌成本為 0.30 美元 / 百萬令牌，而未緩存的令牌成本為 3 美元 / 百萬令牌 —— 相差 10 倍。

從上下文工程的角度來看，提高 KV 緩存命中率涉及以下幾個關(guān)鍵實踐：

1. 保持提示前綴的穩(wěn)定。由于 LLMs 的自回歸特性，即使是單個令牌的差異也會使從該令牌開始的緩存失效。一個常見的錯誤是在系統(tǒng)提示的開頭包含一個時間戳 —— 尤其是精確到秒的時間戳。當(dāng)然，它可以讓模型告訴你當(dāng)前時間，但它也會扼殺你的緩存命中率。

2. 使你的上下文僅追加。避免修改之前的操作或觀察。確保你的序列化是確定性的。許多編程語言和庫不保證在序列化 JSON 對象時保持穩(wěn)定的鍵順序，這可能會悄無聲息地破壞緩存。

3. 在需要時顯式標(biāo)記緩存斷點。某些模型提供商或推理框架不支持自動增量前綴緩存，而是需要手動在上下文中插入緩存斷點。在分配這些斷點時，請考慮潛在的緩存過期，并且至少要確保斷點包含系統(tǒng)提示的結(jié)尾。

此外，如果您使用 vLLM 等框架自行托管模型，請確保已啟用前綴 / 提示緩存，并且您正在使用會話 ID 等技術(shù)來跨分布式工作器一致地路由請求。

屏蔽，不要移除

隨著您的 Agent 承擔(dān)更多的能力，其行動空間自然會變得更加復(fù)雜 —— 簡單來說，工具的數(shù)量會爆炸式增長。最近 MCP 的流行只會火上澆油。如果您允許用戶配置工具，請相信我：不可避免地會有人將數(shù)百個神秘工具插入到您精心策劃的行動空間中。因此，模型更有可能選擇錯誤的行動或采取效率低下的路徑。簡而言之，您全副武裝的 Agent 變得更笨了。

一個很自然的反應(yīng)是設(shè)計一個動態(tài)動作空間 —— 也許可以使用類似 RAG 的方法按需加載工具。我們在 Manus 中也嘗試過。但我們的實驗表明了一個明確的規(guī)則：除非絕對必要，否則避免在迭代過程中動態(tài)添加或刪除工具。這主要有兩個原因：

1. 在大多數(shù) LLMs 中，工具定義在序列化后位于上下文的前面，通常在系統(tǒng)提示之前或之后。因此，任何更改都將使所有后續(xù)操作和觀察的 KV 緩存失效。

2. 當(dāng)之前的操作和觀察仍然引用當(dāng)前上下文中不再定義的工具時，模型會感到困惑。如果沒有約束解碼，這通常會導(dǎo)致模式?jīng)_突或幻覺動作。

為了解決這個問題，同時仍然改進動作選擇，Manus 使用上下文感知的狀態(tài)機來管理工具的可用性。它不是刪除工具，而是在解碼期間屏蔽 token logits，以防止（或強制）基于當(dāng)前上下文選擇某些動作。

在實踐中，大多數(shù)模型提供商和推理框架都支持某種形式的響應(yīng)預(yù)填充，這允許您在不修改工具定義的情況下約束動作空間。通常有三種函數(shù)調(diào)用模式（我們將使用 NousResearch 的 Hermes 格式作為示例）：

自動 – 模型可以選擇是否調(diào)用函數(shù)。通過僅預(yù)填充回復(fù)前綴來實現(xiàn)：<|im_start|>assistant

必需 – 模型必須調(diào)用一個函數(shù)，但選擇不受約束。通過預(yù)填充到工具調(diào)用令牌來實現(xiàn)：<|im_start|>assistant<tool_call>

指定 – 模型必須從特定子集中調(diào)用一個函數(shù)。通過預(yù)填充到函數(shù)名稱的開頭來實現(xiàn)：<|im_start|>assistant<tool_call>{"name": “browser_

通過這種方式，我們通過直接屏蔽令牌 logits 來約束動作選擇。例如，當(dāng)用戶提供新的輸入時，Manus 必須立即回復(fù)，而不是采取行動。我們還特意設(shè)計了具有一致前綴的動作名稱 —— 例如，所有與瀏覽器相關(guān)的工具都以 browser_ 開頭，而命令行工具以 shell_ 開頭。這使我們能夠輕松地強制 Agent 僅從給定狀態(tài)下的特定工具組中進行選擇，而無需使用有狀態(tài)的 logits 處理器。

這些設(shè)計有助于確保 Manus Agent 循環(huán)保持穩(wěn)定 —— 即使在模型驅(qū)動的架構(gòu)下也是如此。

將文件系統(tǒng)用作上下文

現(xiàn)代前沿 LLMs 現(xiàn)在提供 128K 令牌或更多的上下文窗口。但在實際的 Agent 場景中，這通常是不夠的，有時甚至是一種負擔(dān)。有三個常見的痛點：

1.觀察結(jié)果可能非常龐大，尤其是在智能體與非結(jié)構(gòu)化數(shù)據(jù)（如網(wǎng)頁或 PDF）交互時。很容易超出上下文限制。

2.即使窗口在技術(shù)上支持，模型性能也往往會隨著上下文長度的增加而下降。

3.即使使用前綴緩存，長輸入也很昂貴。您仍然需要付費傳輸和預(yù)填充每個令牌。

為了解決這個問題，許多智能體系統(tǒng)都實現(xiàn)了上下文截斷或壓縮策略。但過度激進的壓縮不可避免地會導(dǎo)致信息丟失。問題是根本性的：智能體本質(zhì)上必須根據(jù)所有先前的狀態(tài)來預(yù)測下一個動作 —— 而且您無法可靠地預(yù)測哪個觀察結(jié)果可能在十步之后變得至關(guān)重要。從邏輯角度來看，任何不可逆的壓縮都帶有風(fēng)險。

這就是為什么我們將文件系統(tǒng)視為 Manus 中的終極上下文：大小不受限制，本質(zhì)上是持久的，并且可以直接由 Agent 操作。模型學(xué)習(xí)按需寫入和讀取文件 —— 不僅將文件系統(tǒng)用作存儲，還用作結(jié)構(gòu)化的外部化內(nèi)存。

我們的壓縮策略始終被設(shè)計為可恢復(fù)的。例如，只要保留 URL，網(wǎng)頁的內(nèi)容就可以從上下文中刪除；如果文檔的路徑在沙箱中仍然可用，則可以省略文檔的內(nèi)容。這使得 Manus 能夠在不永久丟失信息的情況下縮短上下文長度。

在開發(fā)此功能時，我發(fā)現(xiàn)自己想象著狀態(tài)空間模型（SSM）如何在 Agent 環(huán)境中有效工作。與 Transformer 不同，SSM 缺乏完全的注意力，并且難以處理長期的向后依賴關(guān)系。但是，如果他們能夠掌握基于文件的內(nèi)存 —— 將長期狀態(tài)外部化而不是將其保存在上下文中 —— 那么它們的速度和效率可能會開啟一類新的 Agent。Agent SSM 可能是神經(jīng)圖靈機的真正繼承者。

通過背誦來操縱注意力

如果你使用過 Manus，你可能已經(jīng)注意到一些奇怪的現(xiàn)象：在處理復(fù)雜的任務(wù)時，它傾向于創(chuàng)建一個 todo.md 文件，并在任務(wù)進行過程中逐步更新它，勾選已完成的項目。

這不僅僅是可愛的行為，而是一種有意的操縱注意力的機制。

Manus 中的一個典型任務(wù)平均需要大約 50 個工具調(diào)用。這是一個很長的循環(huán) —— 而且由于 Manus 依賴 LLMs 進行決策，因此它很容易偏離主題或忘記早期的目標(biāo)，尤其是在長上下文或復(fù)雜的任務(wù)中。

通過不斷重寫待辦事項列表，Manus 會將它的目標(biāo)復(fù)述到上下文的末尾。這會將全局計劃推送到模型的近期注意力范圍內(nèi)，避免“迷失在中間”的問題，并減少目標(biāo)錯位。實際上，它是在使用自然語言來使其自身的注意力偏向于任務(wù)目標(biāo) —— 而無需特殊的架構(gòu)更改。

保留錯誤信息

智能體會犯錯。這不是漏洞，而是現(xiàn)實。語言模型會產(chǎn)生幻覺，環(huán)境會返回錯誤，外部工具會運行異常，意想不到的極端情況也總是會出現(xiàn)。在多步驟任務(wù)中，失敗不是例外，而是循環(huán)的一部分。

然而，一種常見的沖動是隱藏這些錯誤：清理痕跡，重試操作，或者重置模型的狀態(tài)，并將其交給神奇的“溫度”。這感覺更安全，更可控。但這是有代價的：消除失敗會移除證據(jù)。沒有證據(jù)，模型就無法適應(yīng)。

根據(jù)我們的經(jīng)驗，改進智能體行為最有效的方法之一出奇地簡單：將錯誤的轉(zhuǎn)彎留在上下文中。當(dāng)模型看到失敗的操作 —— 以及由此產(chǎn)生的觀察或堆棧跟蹤 —— 它會隱式地更新其內(nèi)部信念。這會使其先驗概率偏離類似的操作，從而減少重復(fù)相同錯誤的可能性。事實上，我們認為錯誤恢復(fù)是真正智能體行為最清晰的指標(biāo)之一。然而，它在大多數(shù)學(xué)術(shù)工作和公共基準(zhǔn)測試中仍然代表性不足，這些工作和測試通常側(cè)重于理想條件下的任務(wù)成功。

別被速殺了

少樣本提示是提高 LLM 輸出的常用技術(shù)。但在 Agent 系統(tǒng)中，它可能會以微妙的方式適得其反。

語言模型是優(yōu)秀的模仿者；它們模仿上下文中行為的模式。如果你的上下文充滿了相似的過去行動-觀察對，模型就會傾向于遵循該模式，即使它不再是最優(yōu)的。

這在涉及重復(fù)決策或行動的任務(wù)中可能很危險。例如，當(dāng)使用 Manus 幫助審查一批 20 份簡歷時，Agent 通常會陷入一種節(jié)奏 —— 重復(fù)類似的操作，僅僅是因為它在上下文中看到了這些操作。這會導(dǎo)致漂移、過度概括，有時甚至?xí)霈F(xiàn)幻覺。

解決方法是增加多樣性。Manus 在行動和觀察中引入少量結(jié)構(gòu)化的變化 —— 不同的序列化模板、不同的措辭、順序或格式上的細微噪聲。這種受控的隨機性有助于打破模式并調(diào)整模型的注意力。換句話說，不要用少量樣本把自己逼入困境。你的上下文越統(tǒng)一，你的 Agent 就越脆弱。

結(jié)論

上下文工程仍然是一門新興的科學(xué) —— 但對于 Agent 系統(tǒng)來說，它已經(jīng)至關(guān)重要。模型可能變得更強大、更快、更便宜，但再多的原始能力也無法取代對記憶、環(huán)境和反饋的需求。你如何塑造上下文最終決定了你的 Agent 的行為方式：它運行的速度、它恢復(fù)的程度以及它的擴展程度。

在 Manus，我們通過反復(fù)的重寫、死胡同以及數(shù)百萬用戶的真實世界測試中吸取了這些教訓(xùn)。我們在這里分享的都不是普遍真理 —— 但這些是對我們有效的模式。如果它們能幫助你避免哪怕一次痛苦的迭代，那么這篇文章就完成了它的使命。

能動的未來將通過一個個場景構(gòu)建。好好設(shè)計它們。

本文鏈接：http://www.tebozhan.com/showinfo-45-14721-0.html被曝裁員、清空社交賬號后，Manus 首度發(fā)布技術(shù)博客總結(jié)經(jīng)驗教訓(xùn)

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：因被 AI 生成的虛假漏洞報告轟炸，開源網(wǎng)絡(luò)工具 cURL 考慮停止提供安全賞金

下一篇： 2025 中國聯(lián)通合作伙伴大會舉行，高通侯明娟:AI 正從“看得見”邁向“用得上、用得起”

標(biāo)簽：

熱門焦點

元宇宙是投資中國的第五次重大機遇

作者為凱思博投資董事長導(dǎo)語：投資邏輯要來自于人性在社會發(fā)展過程中的普遍規(guī)律，由第一性原理出發(fā)找出重大的投資機會來。1978年的改革開放到今天，中國總共經(jīng)歷了
時尚領(lǐng)域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

想象一個你的數(shù)字身份與現(xiàn)實身份同樣重要的世界。想象一個你需要為虛擬自我準(zhǔn)備資產(chǎn)和物資的地方——你需要金錢（Crypto）、房屋（可能建在Minecraft上）和衣物。隨著
星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數(shù)字資產(chǎn)交易服務(wù)。據(jù)悉，DBS于2021年初開設(shè)了機構(gòu)數(shù)字資產(chǎn)交易平臺，全
中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告（2021）

區(qū)塊鏈?zhǔn)羌夹g(shù)整合創(chuàng)新、金融創(chuàng)新、組織方式創(chuàng)新、產(chǎn)業(yè)應(yīng)用創(chuàng)新的多維度創(chuàng)新，以服務(wù)實體經(jīng)濟、政務(wù)民生以及公共服務(wù)等領(lǐng)域為落腳點，以期實現(xiàn)整個地區(qū)和產(chǎn)業(yè)的資
紐約街頭出現(xiàn)NFT自動販賣機

一家初創(chuàng)公司宣布在紐約市開放一臺NFT自動售貨機，允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺名為Neon，上個月完成了一輪300萬美元的種子募捐
參加元宇宙里的招聘會是什么樣一種體驗？

求職者可以在活動中走動，就像他們在現(xiàn)實生活中一樣。長話短說看亮點：招聘公司Hirect為Y-combinator支持的初創(chuàng)公司舉辦了一場元宇宙招聘會。這里有一個大廳、一
這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發(fā)揮作用

前米高梅首席執(zhí)行官Roger Birnbaum和AOL的接班人Mark Kimsey成立了一個新的好萊塢工作室，提供 NFT，讓持有者在制作中發(fā)揮作用Electromagnetic Productions 創(chuàng)始
如何在元宇宙中建立品牌忠誠度

Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點？他們都投資于元宇宙的房地產(chǎn)。除了我們在屏幕上看到的二維世界--手機、筆記本電腦、臺式機或iPad--他們決
音樂家如何利用NFTs來提高歌迷參與度

"音樂是一種語言，不以特定的文字說話。它用情感說話，如果它在骨子里，它就在骨子里。" - Keith Richards音樂激勵著我們，使我們流淚，使我們充滿狂喜，并撫慰我們的靈魂

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

被曝裁員、清空社交賬號后，Manus 首度發(fā)布技術(shù)博客總結(jié)經(jīng)驗教訓(xùn)

元宇宙是投資中國的第五次重大機遇

時尚領(lǐng)域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告（2021）

紐約街頭出現(xiàn)NFT自動販賣機

參加元宇宙里的招聘會是什么樣一種體驗？

這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發(fā)揮作用

如何在元宇宙中建立品牌忠誠度

音樂家如何利用NFTs來提高歌迷參與度

最新推薦

搶先推出“元宇宙”飲料，可口可樂贏麻了

超級碗的加密時刻：是主流信號還是“網(wǎng)絡(luò)超級碗2.0”？

中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告（2021）

藝術(shù)創(chuàng)作者能否永久收取版稅？

MR——元宇宙平臺的下一代入口

元宇宙不完全是想出來的，而是實打?qū)嵶龀鰜淼?/a>

猜你喜歡

熱門推薦

相關(guān)資訊