當前位置：首頁 > 元宇宙 > AI

智譜發布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

來源：責編：時間：2025-04-17 06:44:23 88觀看

導讀 4 月 15 日消息，智譜昨日（4 月 14 日）發布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 億參數，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。該系列模型共有 GLM-4

4 月 15 日消息，智譜昨日（4 月 14 日）發布博文，宣布推出新一代 GLM-4-32B-0414 系列模型，320 億參數，效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列，且支持非常友好的本地部署特性。

該系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。

GLM-4-32B-Base-0414

在預訓練階段，該模型采用 15T 高質量數據，其中包含大量推理類的合成數據，這為后續的強化學習擴展打下了基礎。

在后訓練階段，除了針對對話場景進行了人類偏好對齊外，團隊還通過拒絕采樣和強化學習等技術強化了模型在指令遵循、工程代碼、函數調用方面的效果，加強了智能體任務所需的原子能力。

GLM-4-32B-0414 在工程代碼、Artifacts 生成、函數調用、搜索問答及報告等方面都取得了不錯的效果，部分 Benchmark 甚至可以媲美更大規模的 GPT-4o、DeepSeek-V3-0324（671B）等模型。

GLM-Z1-32B-0414

該模型是具有深度思考能力的推理模型，在 GLM-4-32B-0414 的基礎上，通過冷啟動和擴展強化學習，以及在數學、代碼和邏輯等任務上對模型的進一步訓練得到的。

相對于基礎模型，GLM-Z1-32B-0414 顯著提升了數理能力和解決復雜任務的能力。在訓練的過程中，該團隊還引入了基于堆棧排序反饋的通用強化學習，進一步增強了模型的通用能力。

GLM-Z1-Rumination-32B-0414

該模型是具有沉思能力的深度推理模型（對標 Open AI 的 Deep Research）。

沉思模型通過更長時間的深度思考來解決更開放和復雜的問題（例如：撰寫兩個城市 AI 發展對比情況，以及未來的發展規劃），結合搜索工具處理復雜任務，并經過利用多種規則型獎勵來指導和擴展端到端強化學習訓練得到。

GLM-Z1-9B-0414

這是一個開源 9B 小尺寸模型，在數學推理和通用任務中依然展現出極為優秀的能力，其整體表現已處于同尺寸開源模型中的領先水平。

測試結果

GLM-4 系列在多項基準測試中表現優異。例如，在 IFEval 指令遵循測試中得分 87.6；在 TAU-Bench 任務自動化測試中，零售場景得分 68.7，航空場景得分 51.2；在 SimpleQA 搜索增強問答測試中得分 88.1。

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代碼修復方面，GLM-4 在 SWE-bench 測試中的成功率達 33.8%。采用 MIT 許可的 GLM-4 降低了計算成本，為研究和企業提供了高性能 AI 解決方案。

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

附上參考地址

GLM-4-0414 系列模型

THUDM Releases GLM 4: A 32B Parameter Model Competing Head-to-Head with GPT-4o and DeepSeek-V3

本文鏈接：http://www.tebozhan.com/showinfo-45-12317-0.html智譜發布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：人工智能開發平臺 Hugging Face 收購 Pollen Robotics，進軍人形機器人市場

下一篇：真·質之選：北京現代OE四驅，讓安全與舒適超越配置堆砌

標簽：

熱門焦點

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

想象一個你的數字身份與現實身份同樣重要的世界。想象一個你需要為虛擬自我準備資產和物資的地方——你需要金錢（Crypto）、房屋（可能建在Minecraft上）和衣物。隨著
元宇宙將會如何塑造未來的工作方式？

科幻小說家尼爾·斯蒂芬森 (Neal Stephenson) 在1992年就創造了“元宇宙”一詞，但事實上，在Facebook將其更名為Meta以反映其將這一科幻愿景變為現實的戰略重點之
江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

《元宇宙新鮮事》有：江西將探索成立元宇宙聯盟，支持南昌規劃建設元宇宙試驗區；韓國金融監督局將加強對NFT和元宇宙的監管；任天堂社長表示暫時不打算加入元宇宙。【
“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報未達預期致盤后股價暴跌15.28%；YouTube宣布進軍區塊鏈和元宇宙；摩根大通成為首家進入元宇宙的銀行。【中
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數字證券市場 tZERO 的所有權。根據公告，ICE 將成為 tZero 的“重要”少數股東，但
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術語，流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率，流動性最強的資產是現金本身。現在讓我們試著從流動性的角
元宇宙收割了誰

作者：曉宇資本將元宇宙看作下一代互聯網的門票，畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里，先是號稱元宇宙第一股的沙盒游戲Roblox盛裝
冬奧會數字收藏品升溫，市場再現“一墩難求”

根據公開信息顯示，國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售，總數為500個，每個99美元，每人限購5個。此外，不同的奧運徽章數字藏
從概念到落地 Web3.0初具雛形

加密資產熱潮催生出的鏈上應用中，除了DeFi、NFT、鏈游GameFi等場景外，還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年，由以太坊聯合創始人及波卡創建者

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

智譜發布新一代開源 AI 模型 GLM-4-32B-0414 系列，效果比肩 GPT 系列和 DeepSeek-V3 R1

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

元宇宙將會如何塑造未來的工作方式？

江西將探索成立元宇宙聯盟，韓國將加強對NFT和元宇宙的監管

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

解決NFT流動性問題：一文了解Floor DAO

元宇宙收割了誰

冬奧會數字收藏品升溫，市場再現“一墩難求”

從概念到落地 Web3.0初具雛形

最新推薦

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

時尚領域進軍元宇宙，2022年會帶來哪些顛覆性的全新體驗？

如何對一款 NFT 項目進行價值評估？

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

元宇宙需要的5個重要安全功能

趙長鵬預測SoicalFi為今年主要驅動力，新的機會在哪里？

猜你喜歡

熱門推薦

相關資訊