當前位置：首頁 > 元宇宙 > AI

智譜獲浦東創投、張江集團 10 億元戰略投資，開源發布新一代通用視覺語言模型 GLM-4.1V-Thinking

來源：責編：時間：2025-07-04 12:12:26 36觀看

導讀 7 月 2 日消息，今天上午，智譜開放平臺產業生態大會在上海浦東張江科學會堂舉辦，開源發布新一代通用視覺語言模型 GLM-4.1V-Thinking。在智譜開放平臺產業生態大會上，智譜宣布浦東創投集團和張江集團對智譜總額 10

7 月 2 日消息，今天上午，智譜開放平臺產業生態大會在上海浦東張江科學會堂舉辦，開源發布新一代通用視覺語言模型 GLM-4.1V-Thinking。

在智譜開放平臺產業生態大會上，智譜宣布浦東創投集團和張江集團對智譜總額 10 億元的戰略投資，并于近期完成首筆交割。同時，三方還啟動了一項合作，共同建設人工智能新型基礎設施。

智譜今日正式發布并開源視覺語言大模型 GLM-4.1V-Thinking，這是一款支持圖像、視頻、文檔等多模態輸入的通用推理型大模型，專為復雜認知任務設計。

從官方獲悉，它在 GLM-4V 架構基礎上引入“思維鏈推理機制（Chain-of-Thought Reasoning）”，采用“課程采樣強化學習策略（RLCS）”，系統性提升模型跨模態因果推理能力與穩定性。

其輕量版 GLM-4.1V-9B-Thinking 模型參數控制在 10B 級別，在兼顧部署效率的同時實現性能突破。該模型在 MMStar、MMMU-Pro、ChartQAPro、OSWorld 等 28 項權威評測中，有 23 項達成 10B 級模型的最佳成績，其中 18 項更是持平或超越參數量高達 72B 的 Qwen-2.5-VL，充分展現了小體積模型的極限性能潛力。

據官方介紹，該模型特別在以下任務中表現卓越，展示出高度的通用性與穩健性：

圖文理解（Image General）：精準識別并綜合分析圖像與文本信息；

數學與科學推理（Math & Science）：支持持復雜題解、多步演繹與公式理解；

視頻理解（Video）：具備時序分析與事件邏輯建模能力；

GUI 與網頁智能體任務（UI2Code、Agent）：理解界面結構，輔助自動化操作；

視覺錨定與實體定位（Grounding）：語言與圖像區域精準對齊，提升人機交互可控性。

目前，GLM-4.1V-9B-Thinking 已在 Hugging Face 與魔搭社區同步開源。包含兩個模型，分別是 GLM-4.1V-9B-Base 基座模型，希望能夠幫助更多研究者探索視覺語言模型的能力邊界作；GLM-4.1V-9B-Thinking，具備深度思考和推理能力的模型，正常使用和體驗，均為這一模型。

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

智譜獲浦東創投、張江集團 10 億元戰略投資，開源發布新一代通用視覺語言模型 GLM-4.1V-Thinking

B端難做：留給魔琺科技的時間不多了

從科幻走進現實，元宇宙概念逐漸清晰

2022年最具關注的9個頭像NFT項目

2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

NFT 技術將傳世之作帶入博物館

獨立故事片“Calladita”將使用 NFT 籌集資金

元宇宙+劇本殺：“在異世界里當演員”

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

最新推薦

中國虛擬數字人如何橫向拓展市場需求，探索發展場景?

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

星展銀行(DBS)計劃推出零售數字資產交易服務

2022年6款最佳的NFT稀有度查詢工具

餐桌上怎么變出元宇宙？

小眾有趣NFT藝術作品欣賞（1）

猜你喜歡

熱門推薦

相關資訊