1 月 16 日消息,面壁智能公眾號(hào)今日宣布推出“小鋼炮”MiniCPM-o 2.6 端側(cè)全模態(tài)模型,參數(shù)為 8B,號(hào)稱(chēng)性能比肩 GPT-4o、Claude-3.5-Sonnet。
其采用了端到端多模態(tài)架構(gòu),可同時(shí)處理文本、圖像、音頻和視頻等多種類(lèi)型的數(shù)據(jù),生成高質(zhì)量文本和語(yǔ)音輸出。官方表示,其總參數(shù)量 8B,視覺(jué)、語(yǔ)音和多模態(tài)流式能力達(dá)到了 GPT-4o-202405 級(jí)別,是開(kāi)源社區(qū)中模態(tài)支持最豐富、性能最佳的模型之一。
MiniCPM-o 2.6 支持可配置聲音的中英雙語(yǔ)語(yǔ)音對(duì)話(huà),還具備情感 / 語(yǔ)速 / 風(fēng)格控制、端到端聲音克隆、角色扮演等進(jìn)階能力。
據(jù)官方介紹,MiniCPM-o 2.6 也是首個(gè)支持在 iPad 等端側(cè)設(shè)備上進(jìn)行多模態(tài)實(shí)時(shí)流式交互的多模態(tài)大模型。其在 OpenCompass 榜單上(綜合 8 個(gè)主流多模態(tài)評(píng)測(cè)基準(zhǔn))平均得分 70.2,以 8B 量級(jí)的大小在單圖理解方面超越了 GPT-4o-202405、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等主流商用閉源多模態(tài)大模型。
附開(kāi)源地址:
GitHub:https://github.com/OpenBMB/MiniCPM-o
huggingface:https://huggingface.co/openbmb/MiniCPM-o-2_6
本文鏈接:http://www.tebozhan.com/showinfo-45-9460-0.html面壁智能發(fā)布 MiniCPM-o 2.6 全模態(tài)模型,號(hào)稱(chēng)“端側(cè) GPT-4o”
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com