當前位置：首頁 > 元宇宙 > AI

面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

來源：責編：時間：2024-05-23 17:06:22 160觀看

導讀 5 月 21 日消息，面壁智能昨晚推出并開源 MiniCPM 系列最新的端側多模態模型 MiniCPM-Llama3-V 2.5，支持 30+ 種語言，宣稱可實現：最強端側多模態綜合性能：超越 Gemini Pro 、GPT-4VOCR 能力 SOTA（注：State-of-the-Art

5 月 21 日消息，面壁智能昨晚推出并開源 MiniCPM 系列最新的端側多模態模型 MiniCPM-Llama3-V 2.5，支持 30+ 種語言，宣稱可實現：

最強端側多模態綜合性能：超越 Gemini Pro 、GPT-4V

OCR 能力 SOTA（注：State-of-the-Art）：9 倍像素更清晰，難圖長圖長文本精準識別

圖像編碼快 150 倍：首次端側系統級多模態加速

▲OpenCompass 模型量級對比

MiniCPM-Llama3-V 2.5 總參數量為 8B，多模態綜合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用閉源模型，OCR 能力及指令跟隨能力得到進一步提升，可精準識別難圖、長圖、長文本，并支持超過 30 種語言的多模態交互。

▲官方測試結果

在 OpenCompass 測試中，MiniCPM-Llama3-V 2.5綜合性能超越多模態“巨無霸”GPT-4V 和 Gemini Pro；在 OCRBench 上，超越了 GPT-4o、GPT-4V、Claude 3V Opus、Gemini Pro 等標桿模型。

▲OpenCompass 測試

▲OCRBench 測試

▲Object HalBench 測試

▲RealWorldQA 測試

此外，在圖像編碼方面，MiniCPM-Llama3-V 2.5 首次整合 NPU 和 CPU 加速框架，并結合顯存管理、編譯優化技術，實現了 150 倍加速提升。

在語言模型推理方面，經過 CPU、編譯優化、顯存管理等優化方式，MiniCPM-Llama3-V 2.5 在手機端的語言解碼速度由 Llama 3 的 0.5 token / s 上下提升到 3-4 token / s，并可支持 30 多種語言，包括德語、法語、西班牙語、意大利語、俄語等主流語言，基本覆蓋一帶一路國家。

▲LLaVABench 評測結果

OCR 技術方面，MiniCPM-Llama3-V 2.5 實現高效編碼及無損識別 180 萬高清像素圖片，并且支持任意長寬比、甚至 1:9 極限比例圖像。

本文鏈接：http://www.tebozhan.com/showinfo-45-4381-0.html面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌 DeepMind 推出 AI 安全框架 Frontier Safety Framework，可檢測優化降低大模型風險性

下一篇：振興鄉村發展助力青少年教育中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽：

熱門焦點

虛擬人再升級，企業可以解放雙手了？

來源：伯虎財經今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
茅臺的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡單的事情。技術、世界觀、填充內容、載體形式，每一個環節都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
萬字專訪Vitalik Buterin：以太坊將成為主流和最安全的基礎層

Vitalik Buterin 在 19 歲時撰寫了以太坊白皮書。他的目標簡單而全面，即創建一個“世界計算機”，旨在成為所有在線應用程序的靈活基礎層，無需任何第三方。自 2015
新款英特爾芯片將使NFT鑄造變得更加方便

科技巨頭和微處理器制造商英特爾（Intel）正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性，該公司的戰略是從加密興起與 NFT爆
好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

在Moviecoin.com平臺上，有一部電影設定了一個前所未有的目標，即通過預售NFT獲得100%的全額融資，這部電影就是馬克·奧康納(Mark O’connor)執導的《Oui Cannes》，
從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

作者：魯拍賣是一種從古至今的商業活動。從古代的典當到現代的拍賣市場、我們熟知的拍賣行，以及知名街頭藝術家Bansky名畫拍賣成功后，竟自毀粉碎，現價值又翻倍的拍
數字經濟、數據要素與數字治理

深入理解數字經濟與數據要素，有利于更準確理解和把握數字治理的基本規律，構建面向未來的健康的數字治理體系，也才能更好地理解元宇宙的治理框架。一、數字經濟
音樂NFT平臺里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達到新的高度。預測到2025 年N
又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

作者：董宇佳2月28日，智度股份在北京舉辦產品發布會，宣布其與國光電器聯手打造的國內首個藝術元宇宙社區——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

面壁智能推出 MiniCPM-Llama3-V 2.5 開源端側多模態模型：8B 參數、高效部署手機

虛擬人再升級，企業可以解放雙手了？

茅臺的元宇宙App火了，也被罵慘了

萬字專訪Vitalik Buterin：以太坊將成為主流和最安全的基礎層

新款英特爾芯片將使NFT鑄造變得更加方便

好萊塢：一股新的電影制作加密浪潮將顛覆這個行業

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

數字經濟、數據要素與數字治理

音樂NFT平臺里的下一匹黑馬是誰？

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

最新推薦

三院士三教授熱聊元宇宙&——AIGC，學術界怎么看？

AI大模型“戰火”燒到了教育領域

25萬虛擬er在“元宇宙”追星

刷完一場元宇宙世界杯音樂盛典，我爽了

Meta證實Quest 2無法實現全身追蹤，未來將為虛擬化身配備“假腿”

從冰墩墩到無聊猿，解秘未來IP爆款的模因

猜你喜歡

熱門推薦

相關資訊