近日,阿里云宣布了一項重大舉措,其視頻生成大模型萬相2.1(Wan)已正式向全球開發(fā)者開放源代碼。
此次開源遵循Apache2.0協(xié)議,涵蓋了14B和1.3B兩種參數(shù)規(guī)格的全部推理代碼與權(quán)重。無論是文字生成視頻還是圖片生成視頻的任務,開發(fā)者都可以在Github、HuggingFace以及魔搭社區(qū)輕松下載并體驗。
據(jù)悉,14B版本的萬相模型在多個方面展現(xiàn)了卓越的性能,包括指令遵循、復雜運動生成、物理建模以及文字視頻生成等。在權(quán)威評測集Vbench中,萬相2.1以86.22%的總分,顯著超越了Sora、Luma、Pika等國內(nèi)外知名模型。
而1.3B版本的萬相模型同樣不容小覷,它不僅超越了部分更大尺寸的開源模型,其表現(xiàn)甚至與一些閉源模型相近。更為重要的是,該版本能夠在消費級顯卡上流暢運行,僅需8.2GB顯存即可生成480P的視頻,這對于二次模型開發(fā)和學術(shù)研究來說,無疑是一個巨大的福音。
這一開源舉措不僅展示了阿里云在視頻生成技術(shù)領(lǐng)域的深厚積累,更為全球開發(fā)者提供了一個寶貴的資源,有望推動視頻生成技術(shù)的進一步發(fā)展與創(chuàng)新。
本文鏈接:http://www.tebozhan.com/showinfo-26-133580-0.html阿里云萬相2.1視頻生成大模型,Apache2.0協(xié)議下全面開源!
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com