<ul id="qq00w"></ul><ul id="qq00w"></ul>

<ul id="qq00w"></ul>

當前位置：首頁 > 元宇宙 > AI

字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節公開，4 月 17 日開放接口

來源：責編：時間：2025-04-16 07:19:36 83觀看

導讀 4 月 14 日消息，從豆包大模型團隊獲悉，字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節今日公開，該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗。該模型在數學、編程、科學推理等專業領域及創意寫作

4 月 14 日消息，從豆包大模型團隊獲悉，字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節今日公開，該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗。

該模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出，同時，模型采用 MoE 架構，總參數 200B，激活參數為 20B，具備顯著的推理成本優勢，單位推理成本相比 DeepSeek R1 降低 50%。

技術報告鏈接：https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

模型各方面具體表現：

專業領域：數學推理（AIME 2024 得分 86.7，追平 OpenAI o3-mini-high）、編程競賽（Codeforces pass@8 達 55.0%，接近 Gemini 2.5 Pro）、科學推理（GPQA 得分 77.3%，接近 o3-mini-high），均達到或接近業界第一梯隊水平。

通用任務：人類評估表現超 DeepSeek R1 8%，覆蓋多場景需求。

成本優勢：單位推理成本相比 DeepSeek R1 降低 50%，實現性能與效率的平衡。

數據體系：融合可驗證與創意性數據

針對推理與生成任務的不同需求，團隊優化了數據處理策略：

可驗證數據（如數學、代碼題）：通過百萬級數據三重清洗（人工篩選 → 模型過濾 → 多模型驗證），保留 10 萬道高難度題目；設計答案整數化改造、離線沙箱驗證等機制，確保模型輸出真實推理過程；

非可驗證數據（如創意寫作）：基于豆包 1.5 Pro 訓練集，剔除低價值樣本，采用兩兩對比獎勵法，優化生成質量；

全新評測基準：構建了超難數學數據集 BeyondAIME（100 道無答案題干題目），解決現有測試區分度不足問題。

獎勵模型：雙軌體系校準訓練方向

團隊提出雙軌獎勵機制，兼顧“對錯分明”與“見仁見智”任務：

可驗證任務：開發了兩代驗證器（Seed-Verifier → Seed-Thinking-Verifier），從字符匹配升級為推理步驟逐行對比（訓練 / 測試集準確率超 99%），杜絕模型“獎勵欺騙”；

非可驗證任務：引入 pairwise 對比訓練，通過千萬次“AB 測試”，捕捉人類對創意、情感等的隱性偏好，避免“眾口難調”；

雙軌融合：針對混合場景設計協調機制，硬指標（對錯）與軟偏好（優劣）互補，支撐全場景訓練。

訓練方法：“監督精調 + 強化學習”雙階段優化

Seed-Thinking-v1.5 采用“打基礎 + 磨能力”的全鏈路訓練：

監督精調（SFT）：基于 40 萬高質量實例（30 萬可驗證 +10 萬非可驗證數據），結合人工與模型協同篩選，構建長思考鏈數據集，確保模型“像人類一樣思考”；

強化學習（RL）：通過三重數據引擎（可驗證 / 通用 / 混合數據）、算法創新（價值預訓練、解耦 GAE 等）以及在線數據適配技術，解決訓練不穩定、長鏈推理斷層等問題，動態調整數據分布以保持最佳訓練狀態。

訓練框架：支撐 20B MoE 的底層架構

為應對20BMoE（總參數 200B）的復雜訓練需求，團隊優化了底層架構：

HybridFlow 編程模型：支持算法快速探索與分布式并行運行；

流式推理系統（SRS）：通過“流式推理”技術解耦模型演進與異步推理，將訓練速度提升 3 倍，萬億參數下穩定性達 95%；

三層并行架構：結合張量 / 專家 / 序列并行，動態均衡負載，基于 KARP 算法優化 GPU 算力利用率。

本文鏈接：http://www.tebozhan.com/showinfo-45-12277-0.html字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節公開，4 月 17 日開放接口

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI CEO 奧爾特曼：DeepSeek 并未影響 GPT 的增長，將推更好的開源模型

下一篇：我國團隊研發，全球首個基因挖掘大模型 SYMPLEX 問世

標簽：

熱門焦點

錯過了BRC20還有eths,eth銘文協議

來源：三頭鳥NFT大家好，我是鳥哥，了解鳥哥的人都知道鳥哥擅擼空投，說實話擼毛雖然回報大但周期還是有點長的，所以除了擼毛我們自己也在研究早期項目，打新，比如BRC20協議ordi當時就有
刷完一場元宇宙世界杯音樂盛典，我爽了

作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了？三刷都不嫌多的那種。按照慣例，每逢年底，直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

上周的元宇宙和明星圈因為一則“林俊杰在推特上宣布持有Decentraland元宇宙虛擬地塊”的新聞而備受關注，該新聞一方面在娛樂圈引起了吃瓜群眾的好奇，另一方面在
韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙。【
8個最適合藝術家發行NFT的交易市場

近年來，加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術家和藝術鑒賞家的
元宇宙“概念股”集體崩塌，背后究竟發生了什么？

近期，Roblox和Meta公布了第四季度的財務報告，在財報發布一日后，股價大跌。作為市值一度超過1萬億美元的世界第六大公司Meta，股價大跌4%，市值降至5650億美元，甚至跌出
利用元宇宙平臺10天收入160萬，風口還是虎口？

美國Meta平臺有限公司，也就是原來的臉書公司，9日宣布，公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
虛擬人的3大紀律和6種品牌孵化模式

作者：陳格雷（老小格）及團隊虛擬人很熱，我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點，整理出6種最主要的品牌虛擬人模式，后面一一介紹。

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節公開，4 月 17 日開放接口

錯過了BRC20還有eths,eth銘文協議

刷完一場元宇宙世界杯音樂盛典，我爽了

林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

8個最適合藝術家發行NFT的交易市場

元宇宙“概念股”集體崩塌，背后究竟發生了什么？

利用元宇宙平臺10天收入160萬，風口還是虎口？

虛擬人的3大紀律和6種品牌孵化模式

最新推薦

影響元宇宙土地價格的五個因素

Web 3如何改變傳統HR

Interface正大光明的“跑路”，社區成員贊格局大

對諷刺無動于衷，Nori將碳市場放在區塊鏈上

虛擬鄧麗君后，數字人賽道開啟3.0時代

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

猜你喜歡

熱門推薦

相關資訊