快科技3月27日消息,今天,阿里云宣布通義千問Qwen2.5-Omni-7B正式開源。
這是通義系列模型中首個端到端全模態大模型,可同時處理文本、圖像、音頻和視頻等多種輸入,并實時生成文本與自然語音合成輸出。
在權威的多模態融合任務OmniBench等測評中,Qwen2.5-Omni刷新業界紀錄,全維度遠超谷歌的Gemini-1.5-Pro等同類模型。
阿里云表示,相較于動輒數千億參數的閉源大模型,Qwen2.5-Omni以7B的小尺寸讓全模態大模型在產業上的廣泛應用成為可能。
即便在手機上,也能部署和應用Qwen2.5-Omni模型。
目前,Qwen2.5-Omni已在魔搭社區和Hugging Face 同步開源,用戶也可在Qwen Chat上直接體驗。
據悉,2023年起,通義團隊陸續開發覆蓋0.5B、1.5B、3B、7B、14B、32B、72B、110B等參數的200多款全尺寸大模型,囊括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等全模態。
開源地址:
https://huggingface.co/Qwen/Qwen2.5-Omni-7B
https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B
https://github.com/QwenLM/Qwen2.5-Omni
本文鏈接:http://www.tebozhan.com/showinfo-17-139026-0.html手機也能跑的模型來了!阿里宣布開源Qwen2.5-Omni-7B
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 一自媒體博主因多次貶低小米公開致歉