當前位置：首頁 > 元宇宙 > AI

百川智能上線開源全模態模型 Omni-1.5，號稱多項能力超越 GPT-4o mini

來源：責編：時間：2025-01-28 08:57:22 67觀看

導讀 1 月 26 日消息，百川智能今日宣布，Baichuan-Omni-1.5 開源全模態模型正式上線。該模型不僅支持文本、圖像、音頻和視頻的全模態理解，還具備文本和音頻的雙模態生成能力。官方宣稱，其在視覺、語音及多模態流式處理

1 月 26 日消息，百川智能今日宣布，Baichuan-Omni-1.5 開源全模態模型正式上線。該模型不僅支持文本、圖像、音頻和視頻的全模態理解，還具備文本和音頻的雙模態生成能力。

官方宣稱，其在視覺、語音及多模態流式處理等方面，Baichuan-Omni-1.5 的表現均優于 GPT-4o mini；在多模態醫療應用領域，其具備更突出的領先優勢。

Baichuan-Omni-1.5 不僅能在輸入和輸出端實現多種交互操作，還擁有強大的多模態推理能力和跨模態遷移能力。

其在音頻技術領域采用了端到端解決方案，可支持多語言對話、端到端音頻合成，還可實現自動語音識別、文本轉語音等功能，且支持音視頻實時交互。

據介紹，在視頻理解能力方面，Baichuan-Omni-1.5 通過對編碼器、訓練數據和訓練方法等多個關鍵環節進行深入優化，其整體性能大幅超越 GPT-4o-mini。

模型結構方面，Baichuan-Omni-1.5 的模型輸入部分支持各種模態通過相應的 Encoder / Tokenizer 輸入到大型語言模型中。

而在模型輸出部分，Baichuan-Omni-1.5 采用了文本-音頻交錯輸出的設計，通過 Text Tokenizer 和 Audio Decoder 同時生成文本和音頻。

百川智能構建了一個包含 3.4 億條高質量圖片 / 視頻-文本數據和近 100 萬小時音頻數據的龐大數據庫，且在 SFT 階段使用了 1700 萬條全模態數據。

附開源地址如下：

GitHub：

https://github.com/baichuan-inc/Baichuan-Omni-1.5

模型權重：

Baichuan-Omni-1.5：

https://huggingface.co/baichuan-inc/Baichuan-Omni-1d5

https://modelers.cn/models/Baichuan/Baichuan-Omni-1d5

Baichuan-Omni-1.5-Base：

https://huggingface.co/baichuan-inc/Baichuan-Omni-1d5-Base

https://modelers.cn/models/Baichuan/Baichuan-Omni-1d5-Base

技術報告：

https://github.com/baichuan-inc/Baichuan-Omni-1.5/blob/main/baichuan_omni_1_5.pdf

本文鏈接：http://www.tebozhan.com/showinfo-45-10216-0.html百川智能上線開源全模態模型 Omni-1.5，號稱多項能力超越 GPT-4o mini

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Hugging Face 推出號稱“世界上最小的視覺語言模型”SmolVLM-256M

下一篇：印度首富計劃建設“世界最大”數據中心，預計投資 200~300 億美元

標簽：

熱門焦點

元宇宙風口下，視覺中國如何重估？

要說橫跨2021年和2022年，到目前仍然很火的概念，元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局，上市公司們趨之若鶩，還被不少地方政府寫入了產業規劃，大有在2022年
企業熱、用戶冷，元宇宙第一站將是“營銷場”？

如果說2021年底什么最火熱，那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語，在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日，有消息傳
比特幣的價格越高，使用價值越大

隔夜比特幣還是在精準地橫盤在42k上方。空頭昨日試圖發起一波小的攻勢，但是晚上就被多頭掰了回來。以太坊的鏈上gas price降到了60 gwei以下，彰顯著市場活躍度的
銀保監會：打擊以“元宇宙”為名義的違法行為

今日，銀保監會發布《關于防范以“元宇宙”名義進行非法集資的風險提示》，全文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名目吸收資金，涉
8個最適合藝術家發行NFT的交易市場

近年來，加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術家和藝術鑒賞家的
新款英特爾芯片將使NFT鑄造變得更加方便

科技巨頭和微處理器制造商英特爾（Intel）正在發布一款適用于 NFT 鑄造和挖礦的新芯片。新產品專注于效率、易操作性和可持續性，該公司的戰略是從加密興起與 NFT爆
2021年中國元宇宙行業用戶行為分析熱點報告

元宇宙網絡熱度高漲，中國網民對虛擬生態興趣濃厚。艾媒咨詢數據顯示，超六成的網民對“元宇宙”了解程度較高，在元宇宙較基礎的游戲領域，超九成的人對VR游戲更感興
數字經濟、數據要素與數字治理

深入理解數字經濟與數據要素，有利于更準確理解和把握數字治理的基本規律，構建面向未來的健康的數字治理體系，也才能更好地理解元宇宙的治理框架。一、數字經濟
Steam 禁止NFT和加密貨幣原因曝光

近日，Valve（V社）總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日，PC Gamer就報道Steam推出的新規：使用區塊鏈或允許交

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

百川智能上線開源全模態模型 Omni-1.5，號稱多項能力超越 GPT-4o mini

元宇宙風口下，視覺中國如何重估？

企業熱、用戶冷，元宇宙第一站將是“營銷場”？

比特幣的價格越高，使用價值越大

銀保監會：打擊以“元宇宙”為名義的違法行為

8個最適合藝術家發行NFT的交易市場

新款英特爾芯片將使NFT鑄造變得更加方便

2021年中國元宇宙行業用戶行為分析熱點報告

數字經濟、數據要素與數字治理

Steam 禁止NFT和加密貨幣原因曝光

最新推薦

風口已至，多領域平臺融入社交元素！

“任何國產元宇宙都是假元宇宙”

避坑指南：遠離具有這些特性的NFT

2021年中國元宇宙行業用戶行為分析熱點報告

NFT領域，我們是否應該遵守版權法

Staking 收益翻倍？

猜你喜歡

熱門推薦

相關資訊