AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

面壁智能開源“小鋼炮”MiniCPM-S AI 模型,主打高效低能耗

來源: 責編: 時間:2024-07-09 06:57:29 117觀看
導讀 7 月 5 日消息,今天的 2024 世界人工智能大會(WAIC 2024)期間,面壁智能聯合創始人、首席科學家劉知遠宣布,開源主打高效低能耗的新一代“面壁小鋼炮”MiniCPM-S 模型,同時發布助力開發者一鍵打造大模型 SuperApp 的

7 月 5 日消息,今天的 2024 世界人工智能大會(WAIC 2024)期間,面壁智能聯合創始人、首席科學家劉知遠宣布,開源主打高效低能耗的新一代“面壁小鋼炮”MiniCPM-S 模型,同時發布助力開發者一鍵打造大模型 SuperApp 的全棧工具集 MobileCPM。ecR28資訊網——每日最新資訊28at.com

據介紹,面壁 2024 年發布了具備 GPT-3 同等性能但參數僅為 24 億的 MiniCPM-2.4B,知識密度提高了約 86 倍。面壁方面更稱,這“并不是極限”—— 其持續優化 Scaling Law 使模型知識密度不斷提升,可不斷訓練出計算更加高效、表現更強(參數規模降低,數值位寬降低,結構更加高效)的基礎大模型。ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

而此次開源的 MiniCPM-S 采用“稀疏激活”在同等參數下減少大模型的推理能耗,稀疏度越高,每個詞元(token)激活的神經元越少,大模型的推理成本和能耗就越少。ecR28資訊網——每日最新資訊28at.com

MiniCPM-S 1.2B 采用了高度稀疏架構,通過將激活函數替換為 ReLU 及通過帶漸進約束的稀疏感知訓練,巧妙地解決了此前主流大模型在稀疏激活上面臨的困境。ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

官方還表示,和同規模的稠密模型 MiniCPM 1.2B 相比,MiniCPM-S 1.2 具備如下特征:ecR28資訊網——每日最新資訊28at.com

Sparse-高稀疏低能耗:在 FFN 層實現了高達 87.89% 平均稀疏度,推理算力下降 84%;ecR28資訊網——每日最新資訊28at.com

Speed-神仙推理:更少計算,迅疾響應。純CPU環境下,結合 Powerinfer 推理框架,推理解碼速度提升約 2.8 倍;ecR28資訊網——每日最新資訊28at.com

Strong-無損強大性能:更少計算量,無損下游任務性能。ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

MiniCPM-S 1.2B 號稱實現知識密度的“空前提升”—— 達到同規模稠密模型 MiniCPM 1.2B 的 2.57 倍,Mistral-7B 的 12.1 倍。ecR28資訊網——每日最新資訊28at.com

附開源鏈接:ecR28資訊網——每日最新資訊28at.com

論文地址:https://arxiv.org/pdf/2402.13516.pdfecR28資訊網——每日最新資訊28at.com

模型地址:https://huggingface.co/openbmb/MiniCPM-S-1B-llama-formatecR28資訊網——每日最新資訊28at.com

PowerInfer可直接運行格式:https://huggingface.co/openbmb/MiniCPM-S-1B-sft-ggufecR28資訊網——每日最新資訊28at.com

此外,面壁還開源了號稱業內首個端側大模型工具集 MobileCPM,開發者可以一鍵集成大模型到 App,且實現“開箱即用”。其包含開源端側大模型、SDK 開發套件及翻譯、摘要等豐富的 intent,可一站式靈活定制滿足不同應用場景需求的大模型 App。其為開發者提供了基礎模式、精裝模式、全包配件模式,默認集成面壁新一代高效稀疏架構模型 MiniCPM-S 1.2B。ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

ecR28資訊網——每日最新資訊28at.com

MobileCPM 已經支持 iOS 系統,安卓版本也即將上線。附:開源地址、TestFlight 外測地址。ecR28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-5022-0.html面壁智能開源“小鋼炮”MiniCPM-S AI 模型,主打高效低能耗

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 智譜發布并開源代碼生成大模型 CodeGeeX 第四代,號稱百億以下規模性能最強

下一篇: 百度李彥宏:開源模型是智商稅,閉源模型更強大、推理成本更低

標簽:
  • 熱門焦點
  • AI網紅能年賺百萬,普通人的新機會來了?

    來源|運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年 ,數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡,還是 AI 數字
  • 拯救XR,蘋果力不從心

    來源 | 光子星球撰文 | 文燁豪 編輯 | 吳先之 蘋果終于呈上了它的“答卷”。 北京時間6月6日凌晨,蘋果2023年全球開發者大會(WWDC)如期舉行。作為蘋果CEO庫克口中&ld
  • 刷完一場元宇宙世界杯音樂盛典,我爽了

    作者|劉小土編輯|李春暉你有多久沒完整追過一場音樂盛典了?三刷都不嫌多的那種。按照慣例,每逢年底,直播、長短視頻、音樂平臺便會搶著端上來幾場音樂盛典。擱以
  • 避坑指南:遠離具有這些特性的NFT

    關于NFT,在我們的文章中一直以來都是常駐嘉賓,不止因為NFT背后隱藏的潛力,更因為在這個NFT世界里冥冥之中仿佛有一雙幕后的手,OpenSea、庫里、ERC115、視覺中國、
  • Meta證實Quest 2無法實現全身追蹤,未來將為虛擬化身配備“假腿”

    上周,外媒UploadVR在Quest 2開發者文檔中發現了從未被公布過的“身體追蹤支持”選項,暗示Meta VR頭顯或支持全身追蹤。而在最近的Instagram問答環節中,Meta Reali
  • “我沒搞懂元宇宙,但一天能賺9w塊”

    作者:鄭宇軒最近幾個月,“元宇宙”爆火,除了 Facebook 改名為 Meta 高調進軍元宇宙外, BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間,元宇宙成為新風口,除了
  • NFT:新騙局的狩獵場

    騙局的自動化需要更好的防御,從數字身份開始。前幾天我在OpenSea上購買了一個NFT,是才華橫溢的藝術家海倫·福爾摩斯 (Helen Holmes) 的漫畫,來自她的 "原作 "收
  • 在元宇宙開會是什么樣一種體驗

    空間就是一切還記得面對面的會議嗎?就在不久前,與會者需要飛到遙遠的目的地,并進行鼓舞人心的對話、網絡、免費食物,甚至可能會有一兩個很好的小組討論。隨之而來
  • 大廠打造元宇宙平臺的業務重心是什么?

    知名市場研究機構IDC發布《2022年中國元宇宙市場十大預測》報告,其中提出互聯網大廠各自獨立布局元宇宙平臺。事實上,在2021年的最后一個季度,包括Meta、英偉達、
Top