1 月 16 日消息,面壁智能公眾號今日宣布推出“小鋼炮”MiniCPM-o 2.6 端側全模態模型,參數為 8B,號稱性能比肩 GPT-4o、Claude-3.5-Sonnet。
其采用了端到端多模態架構,可同時處理文本、圖像、音頻和視頻等多種類型的數據,生成高質量文本和語音輸出。官方表示,其總參數量 8B,視覺、語音和多模態流式能力達到了 GPT-4o-202405 級別,是開源社區中模態支持最豐富、性能最佳的模型之一。
MiniCPM-o 2.6 支持可配置聲音的中英雙語語音對話,還具備情感 / 語速 / 風格控制、端到端聲音克隆、角色扮演等進階能力。
據官方介紹,MiniCPM-o 2.6 也是首個支持在 iPad 等端側設備上進行多模態實時流式交互的多模態大模型。其在 OpenCompass 榜單上(綜合 8 個主流多模態評測基準)平均得分 70.2,以 8B 量級的大小在單圖理解方面超越了 GPT-4o-202405、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等主流商用閉源多模態大模型。
附開源地址:
GitHub:https://github.com/OpenBMB/MiniCPM-o
huggingface:https://huggingface.co/openbmb/MiniCPM-o-2_6
本文鏈接:http://www.tebozhan.com/showinfo-45-9460-0.html面壁智能發布 MiniCPM-o 2.6 全模態模型,號稱“端側 GPT-4o”
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 李飛飛再創輝煌,新獨角獸企業橫空出世!