AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

智譜發(fā)布新一代開源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 R1

來源: 責編: 時間:2025-04-17 06:44:23 8觀看
導讀 4 月 15 日消息,智譜昨日(4 月 14 日)發(fā)布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 億參數(shù),效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。該系列模型共有 GLM-4

4 月 15 日消息,智譜昨日(4 月 14 日)發(fā)布博文,宣布推出新一代 GLM-4-32B-0414 系列模型,320 億參數(shù),效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3 / R1 系列,且支持非常友好的本地部署特性。yPg28資訊網(wǎng)——每日最新資訊28at.com

該系列模型共有 GLM-4-32B-Base-0414、GLM-Z1-32B-0414、GLM-Z1-Rumination-32B-0414 和 GLM-Z1-9B-0414 四款模型。yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-4-32B-Base-0414yPg28資訊網(wǎng)——每日最新資訊28at.com

在預訓練階段,該模型采用 15T 高質(zhì)量數(shù)據(jù),其中包含大量推理類的合成數(shù)據(jù),這為后續(xù)的強化學習擴展打下了基礎。yPg28資訊網(wǎng)——每日最新資訊28at.com

yPg28資訊網(wǎng)——每日最新資訊28at.com

在后訓練階段,除了針對對話場景進行了人類偏好對齊外,團隊還通過拒絕采樣和強化學習等技術(shù)強化了模型在指令遵循、工程代碼、函數(shù)調(diào)用方面的效果,加強了智能體任務所需的原子能力。yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-4-32B-0414 在工程代碼、Artifacts 生成、函數(shù)調(diào)用、搜索問答及報告等方面都取得了不錯的效果,部分 Benchmark 甚至可以媲美更大規(guī)模的 GPT-4o、DeepSeek-V3-0324(671B)等模型。yPg28資訊網(wǎng)——每日最新資訊28at.com

yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-Z1-32B-0414yPg28資訊網(wǎng)——每日最新資訊28at.com

該模型是具有深度思考能力的推理模型,在 GLM-4-32B-0414 的基礎上,通過冷啟動和擴展強化學習,以及在數(shù)學、代碼和邏輯等任務上對模型的進一步訓練得到的。yPg28資訊網(wǎng)——每日最新資訊28at.com

yPg28資訊網(wǎng)——每日最新資訊28at.com

相對于基礎模型,GLM-Z1-32B-0414 顯著提升了數(shù)理能力和解決復雜任務的能力。在訓練的過程中,該團隊還引入了基于堆棧排序反饋的通用強化學習,進一步增強了模型的通用能力。yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-Z1-Rumination-32B-0414yPg28資訊網(wǎng)——每日最新資訊28at.com

該模型是具有沉思能力的深度推理模型(對標 Open AI 的 Deep Research)。yPg28資訊網(wǎng)——每日最新資訊28at.com

沉思模型通過更長時間的深度思考來解決更開放和復雜的問題(例如:撰寫兩個城市 AI 發(fā)展對比情況,以及未來的發(fā)展規(guī)劃),結(jié)合搜索工具處理復雜任務,并經(jīng)過利用多種規(guī)則型獎勵來指導和擴展端到端強化學習訓練得到。yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-Z1-9B-0414yPg28資訊網(wǎng)——每日最新資訊28at.com

這是一個開源 9B 小尺寸模型,在數(shù)學推理和通用任務中依然展現(xiàn)出極為優(yōu)秀的能力,其整體表現(xiàn)已處于同尺寸開源模型中的領先水平。yPg28資訊網(wǎng)——每日最新資訊28at.com

yPg28資訊網(wǎng)——每日最新資訊28at.com

測試結(jié)果yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-4 系列在多項基準測試中表現(xiàn)優(yōu)異。例如,在 IFEval 指令遵循測試中得分 87.6;在 TAU-Bench 任務自動化測試中,零售場景得分 68.7,航空場景得分 51.2;在 SimpleQA 搜索增強問答測試中得分 88.1。yPg28資訊網(wǎng)——每日最新資訊28at.com

模型IFEvalBFCL-v3 (Overall)BFCL-v3 (MultiTurn)TAU-Bench (Retail)TAU-Bench (Airline)SimpleQAHotpotQAQwen2.5-Max85.650.930.558.322.079.052.8GPT-4o-112081.969.641.062.846.082.863.9DeepSeek-V3-032483.466.235.860.732.482.654.6DeepSeek-R184.357.512.433.037.383.963.1GLM-4-32B-041487.669.641.568.751.288.163.8

代碼修復方面,GLM-4 在 SWE-bench 測試中的成功率達 33.8%。采用 MIT 許可的 GLM-4 降低了計算成本,為研究和企業(yè)提供了高性能 AI 解決方案。yPg28資訊網(wǎng)——每日最新資訊28at.com

模型框架SWE-bench VerifiedSWE-bench Verified miniGLM-4-32B-0414Moatless[1]33.838.0GLM-4-32B-0414Agentless[2]30.734.0GLM-4-32B-0414OpenHands[3]27.228.0

附上參考地址yPg28資訊網(wǎng)——每日最新資訊28at.com

GLM-4-0414 系列模型yPg28資訊網(wǎng)——每日最新資訊28at.com

THUDM Releases GLM 4: A 32B Parameter Model Competing Head-to-Head with GPT-4o and DeepSeek-V3yPg28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-12317-0.html智譜發(fā)布新一代開源 AI 模型 GLM-4-32B-0414 系列,效果比肩 GPT 系列和 DeepSeek-V3 R1

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 人工智能開發(fā)平臺 Hugging Face 收購 Pollen Robotics,進軍人形機器人市場

下一篇: 真·質(zhì)之選:北京現(xiàn)代OE四驅(qū),讓安全與舒適超越配置堆砌

標簽:
  • 熱門焦點
  • 10億基金,李彥宏呼喚下一個AI獨角獸

    ©?深響原創(chuàng) · 作者|何文 AI太熱了。 在海外,OpenAI估值已超270億美元、英偉達市值破萬億、微軟把GPT整合進了全線產(chǎn)品。在國內(nèi),百度、阿里、華為、商湯等大公司,以及
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內(nèi)卷”的當下,一眾虛擬人卻“內(nèi)卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業(yè)的虛擬人夏語冰登上央視節(jié)目《對話》,湖南
  • 《刀劍神域》VR展開幕;《Puzzling Places》發(fā)布第二個付費DLC

    今日熱點:《刀劍神域:Ex-Chronicle Online Edition》VR展開幕;虛擬活動平臺EventX再獲800萬美元B輪融資;VR射擊游戲《Outlier》確認將于3月17日登陸Steam平臺等。
  • Shiba Inu布局元宇宙 走出Meme局限

    以「狗狗幣殺手」成名的Shiba Inu(SHIB)在人們的印象中始終有著濃厚的Meme(模因惡搞)烙印,但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區(qū)后,Shiba Inu
  • Interface正大光明的“跑路”,社區(qū)成員贊格局大

    今日凌晨,一個廣泛受社區(qū)期待的潛力藍籌項目Interfaces突然發(fā)文宣布項目停止運營,后續(xù)也不會有鑄造NFT系列的活動。這對社區(qū)來說就是一重磅炸彈,大多數(shù)人完全不明
  • 元宇宙收割了誰

    作者:曉宇資本將元宇宙看作下一代互聯(lián)網(wǎng)的門票,畫大餅、割韭菜就成了一大選項。2021年被稱為元宇宙元年。在這一年里,先是號稱元宇宙第一股的沙盒游戲Roblox盛裝
  • 虛擬人的3大紀律和6種品牌孵化模式

    作者:陳格雷(老小格)及團隊虛擬人很熱,我們最近廣泛收集和研究了、各種消費品牌企業(yè)在虛擬人開發(fā)上的一些主要特點,整理出6種最主要的品牌虛擬人模式,后面一一介紹。
  • NFT行業(yè)周報:NBA巨星勒布朗·詹姆斯申請NFT相關商標

    1. “無聊猿”BAYC交易總額突破14億美元3月10日,據(jù)DappRader最新數(shù)據(jù)顯示,“無聊猿”Bored Ape Yacht Club(BAYC)交易總額已突破14億美元,創(chuàng)下歷史新高,本文撰寫時為
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發(fā)布一款元宇宙概念的模擬經(jīng)營類游戲,盡管游戲尚在研發(fā)中,這一消息已經(jīng)讓中青寶的股價在51個交易
Top