當前位置：首頁 > 元宇宙 > AI

面壁智能開源“小鋼炮”MiniCPM-S AI 模型，主打高效低能耗

來源：責編：時間：2024-07-09 06:57:29 117觀看

導讀 7 月 5 日消息，今天的 2024 世界人工智能大會（WAIC 2024）期間，面壁智能聯合創始人、首席科學家劉知遠宣布，開源主打高效低能耗的新一代“面壁小鋼炮”MiniCPM-S 模型，同時發布助力開發者一鍵打造大模型 SuperApp 的

7 月 5 日消息，今天的 2024 世界人工智能大會（WAIC 2024）期間，面壁智能聯合創始人、首席科學家劉知遠宣布，開源主打高效低能耗的新一代“面壁小鋼炮”MiniCPM-S 模型，同時發布助力開發者一鍵打造大模型 SuperApp 的全棧工具集 MobileCPM。

據介紹，面壁 2024 年發布了具備 GPT-3 同等性能但參數僅為 24 億的 MiniCPM-2.4B，知識密度提高了約 86 倍。面壁方面更稱，這“并不是極限”—— 其持續優化 Scaling Law 使模型知識密度不斷提升，可不斷訓練出計算更加高效、表現更強（參數規模降低，數值位寬降低，結構更加高效）的基礎大模型。

而此次開源的 MiniCPM-S 采用“稀疏激活”在同等參數下減少大模型的推理能耗，稀疏度越高，每個詞元（token）激活的神經元越少，大模型的推理成本和能耗就越少。

MiniCPM-S 1.2B 采用了高度稀疏架構，通過將激活函數替換為 ReLU 及通過帶漸進約束的稀疏感知訓練，巧妙地解決了此前主流大模型在稀疏激活上面臨的困境。

官方還表示，和同規模的稠密模型 MiniCPM 1.2B 相比，MiniCPM-S 1.2 具備如下特征：

Sparse-高稀疏低能耗：在 FFN 層實現了高達 87.89% 平均稀疏度，推理算力下降 84%；

Speed-神仙推理：更少計算，迅疾響應。純CPU環境下，結合 Powerinfer 推理框架，推理解碼速度提升約 2.8 倍；

Strong-無損強大性能：更少計算量，無損下游任務性能。

MiniCPM-S 1.2B 號稱實現知識密度的“空前提升”—— 達到同規模稠密模型 MiniCPM 1.2B 的 2.57 倍，Mistral-7B 的 12.1 倍。

附開源鏈接：

論文地址：https://arxiv.org/pdf/2402.13516.pdf

模型地址：https://huggingface.co/openbmb/MiniCPM-S-1B-llama-format

PowerInfer可直接運行格式：https://huggingface.co/openbmb/MiniCPM-S-1B-sft-gguf

此外，面壁還開源了號稱業內首個端側大模型工具集 MobileCPM，開發者可以一鍵集成大模型到 App，且實現“開箱即用”。其包含開源端側大模型、SDK 開發套件及翻譯、摘要等豐富的 intent，可一站式靈活定制滿足不同應用場景需求的大模型 App。其為開發者提供了基礎模式、精裝模式、全包配件模式，默認集成面壁新一代高效稀疏架構模型 MiniCPM-S 1.2B。

MobileCPM 已經支持 iOS 系統，安卓版本也即將上線。附：開源地址、TestFlight 外測地址。

本文鏈接：http://www.tebozhan.com/showinfo-45-5022-0.html面壁智能開源“小鋼炮”MiniCPM-S AI 模型，主打高效低能耗

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：智譜發布并開源代碼生成大模型 CodeGeeX 第四代，號稱百億以下規模性能最強

下一篇：百度李彥宏：開源模型是智商稅，閉源模型更強大、推理成本更低

標簽：

熱門焦點

AI網紅能年賺百萬，普通人的新機會來了？

來源｜運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年，數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡，還是 AI 數字
拯救XR，蘋果力不從心

來源 | 光子星球撰文 | 文燁豪編輯 | 吳先之蘋果終于呈上了它的“答卷”。北京時間6月6日凌晨，蘋果2023年全球開發者大會（WWDC）如期舉行。作為蘋果CEO庫克口中&ld
刷完一場元宇宙世界杯音樂盛典，我爽了

作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了？三刷都不嫌多的那種。按照慣例，每逢年底，直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
避坑指南：遠離具有這些特性的NFT

關于NFT，在我們的文章中一直以來都是常駐嘉賓，不止因為NFT背后隱藏的潛力，更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手，OpenSea、庫里、ERC115、視覺中國、
Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

上周，外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項，暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中，Meta Reali
“我沒搞懂元宇宙，但一天能賺9w塊”

作者：鄭宇軒最近幾個月，“元宇宙”爆火，除了 Facebook 改名為 Meta 高調進軍元宇宙外， BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間，元宇宙成為新風口，除了
NFT：新騙局的狩獵場

騙局的自動化需要更好的防御，從數字身份開始。前幾天我在OpenSea上購買了一個NFT，是才華橫溢的藝術家海倫·福爾摩斯 (Helen Holmes) 的漫畫，來自她的 "原作 "收
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來
大廠打造元宇宙平臺的業務重心是什么？

知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告，其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上，在2021年的最后一個季度，包括Meta、英偉達、

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

面壁智能開源“小鋼炮”MiniCPM-S AI 模型，主打高效低能耗

AI網紅能年賺百萬，普通人的新機會來了？

拯救XR，蘋果力不從心

刷完一場元宇宙世界杯音樂盛典，我爽了

避坑指南：遠離具有這些特性的NFT

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

“我沒搞懂元宇宙，但一天能賺9w塊”

NFT：新騙局的狩獵場

在元宇宙開會是什么樣一種體驗

大廠打造元宇宙平臺的業務重心是什么？

最新推薦

【申萬宏源】必然的碎片化AI落地，哪種路徑可能勝出？ | 元宇宙Meta洞見

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

2022 區塊鏈 50 強榜單；垃圾NFT項目的十三個特性

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

元宇宙是推動NFT發展的初始家園

NFT行業周報：NBA巨星勒布朗·詹姆斯申請NFT相關商標

猜你喜歡

熱門推薦

相關資訊