當前位置：首頁 > 元宇宙 > 元宇宙

AI繪畫的下一站：“AI拍電影” 問世

來源：責編：時間：2023-08-11 16:53:39 422觀看

導讀當大家還在驚嘆和沉浸于AI文本轉圖像產出的精妙畫作的時候，一些悶聲做大事的團隊已經在人工智能研究上邁向了一個新的領域—文本轉視頻 9月29日，扎克伯格在facebook上發布了一條關于Make-A-Video人工

當大家還在驚嘆和沉浸于AI文本轉圖像產出的精妙畫作的時候，一些悶聲做大事的團隊已經在人工智能研究上邁向了一個新的領域—文本轉視頻

9月29日，扎克伯格在facebook上發布了一條關于Make-A-Video人工智能系統的帖子，并附上了一段20s的視頻，視頻中匯總了Make-A-Video系統通過文本生成視頻的一些片段。給Make-A-Video一個文本描述，它就可以為您創建一段視頻。

自文本轉圖像AI技術發布以來，也才過了幾個月，人工智能技術就發展成將靜態圖直接飛升成動態視頻了，一句話就能生成視頻，不得不說近兩年AI發展的速度有點近乎瘋狂。

不過在Meta發布之后僅一周，谷歌就緊隨其后發布了他們在人工智能領域的最新成果Imagen Video和Phenaki兩種模型，前者可以生成1280*768分辨率，24幀/秒的高清視頻，后者可以將一系列的文本提示生成連貫的長視頻。這么看Meta的Make-A-Video還是遜色一點。

其實文本生成視頻技術并不是什么新鮮事兒，早在今年的6月份，清華&智源研究院就自研了“一句話生成視頻”的模型CogVideo，并且將這一模型在gitub上開源了（剛發布不久立馬就出圈了）

下面我們就一起來了解下這三個團隊各自的模型到底如何吧。

01

CogVideo

CogVideo可以生成分辨率為480*480（畫質有點渣），4秒（幀數32張）左右的視頻，而且在生成真實的對象，以及內容一致性和運動真實性方面的表現相較于當時的其他視頻生成AI模型來說都要更好，從下圖的我們不難看出這一點，生成的實際人物相關的視頻看上去都比較自然和流暢。

但是有些地方還是值得再探究下，比如這個獅子正在喝水的視頻，CogVideo是直接給獅子加上了一雙手，這和我們的常規認知是背道而馳的，仿佛只是把人的手拿水喝這個動作和獅子做了一個拼接。不過在Meta的Make-A-Video生成的視頻中也存在類似的情況。

那接下來我們就看看Make-A-Video的表現吧！

02

Make-A-Video

Make-A-Video目前已經實現了下面三個功能

文字轉視頻
圖片轉視頻（將一張圖片變為動態視頻或者將兩張圖片合成為一個視頻）
通過原始視頻生成視頻的變體

Meta的官網上也給出了一些的案例。

Imagen Video & Phenaki

首先值得一提的是Imagen Video的清晰度，相比前兩個系統生成的視頻有了非常大的提升，目前支持生成1280*768分辨率，24幀/秒的視頻，下面是官網放出的視頻案例效果片段。

甚至還能理解3D結構

最重要的是 Imagen Video 能夠生成各種不同風格的文本動畫

不過目前谷歌方面表示不會發布 Imagen Video 模型或其源代碼，以避免存在模型可能被濫用于制造虛假、仇恨、露骨或有害的內容。

通過官網和論文公布的信息可以了解到Phenaki目前可以做到

1. 通過不同的描述切換生成的視頻風格或切換場景，生成連貫多樣化的視頻

2. 給一個靜態的圖像作為第一幀+一段文本描述就可以生成一個視頻

3. 通過一連串的文字描述描述生成2分鐘以上的長視頻（視頻案例請移步Phenaki官網查看：https://phenaki.github.io/#interactive）

而且生成的視頻還具備故事情節。這樣的話，那未來是不是人人都可以通過文本創建視頻，就不需要拍攝和剪輯了（驚訝！！！）如果真的能實現，那可能會給視頻行業帶來翻天覆地的變化。目前Meta和Google團隊都暫未提供線上試用入口，有感興趣的朋友可以去嘗試用下CogVideo在線網頁看看文字轉視頻的效果（可點擊原文鏈接跳轉）：

網址：https://huggingface.co/spaces/THUDM/CogVideo

文字轉視頻的AI技術在短短的幾個月內就已經取得了巨大的進展，似乎每天都有新的突破，難以想象再過幾個月這個技術是不是又會邁向了一個新的階層，一起拭目以待吧！

更多最新資訊和業內領先方案分析關注九日論道喲。也歡迎大家加入我們的知識星球，星球也正在做第二年的續費哈。

本文鏈接：http://www.tebozhan.com/showinfo-40-498-0.htmlAI繪畫的下一站：“AI拍電影” 問世

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：中美科技巨頭死磕元宇宙

下一篇：中青寶推出元宇宙婚禮，這么好的題材又玩砸了

標簽：

熱門焦點

《從營銷AIGC化到AIGC營銷化》報告發布

來源：清元宇宙7月2日上午，清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中，清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

來源：首席品牌官從被稱為“元宇宙元年”的2021年開始，幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法，相信多數人腦海里首先浮現
“平均時代”：ChatGPT模仿秀的隱喻

來源：錦緞如果你問ChatGPT，Instagram上最美的女人是誰？它很可能會給你一個名字，叫卡戴珊。如果你觀察過Instagram這個美版小紅書：平臺上的所有網紅，展現的幾乎是統一面孔：統一的醫
在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報未達預期致盤后股價暴跌15.28%；YouTube宣布進軍區塊鏈和元宇宙；摩根大通成為首家進入元宇宙的銀行。【中
摩根大通：元宇宙市場預計每年收入超1萬億美元

今日《元宇宙新鮮事》有：香港首屆元宇宙藝博會將于5月舉辦；NH-Amundi Asset Management上市其第二支元宇宙ETF；Meta虛擬現實平臺Horizon Worlds月活躍用戶在三個
在元宇宙開會是什么樣一種體驗

空間就是一切還記得面對面的會議嗎？就在不久前，與會者需要飛到遙遠的目的地，并進行鼓舞人心的對話、網絡、免費食物，甚至可能會有一兩個很好的小組討論。隨之而來
利用元宇宙平臺10天收入160萬，風口還是虎口？

美國Meta平臺有限公司，也就是原來的臉書公司，9日宣布，公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
元宇宙平臺會是上世紀末的互聯網嗎？

“元宇宙”火了好幾個月，互聯網大廠忙于布局，資本市場熱烈追捧。然而很多人還是看不明白，更多的人覺得這是一場泡沫，一場騙局。一開始接觸這個怪里怪氣的名詞，感覺

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI繪畫的下一站：“AI拍電影” 問世

01

02

《從營銷AIGC化到AIGC營銷化》報告發布

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

“平均時代”：ChatGPT模仿秀的隱喻

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

摩根大通：元宇宙市場預計每年收入超1萬億美元

在元宇宙開會是什么樣一種體驗

利用元宇宙平臺10天收入160萬，風口還是虎口？

元宇宙平臺會是上世紀末的互聯網嗎？

最新推薦

元宇宙的文旅賽道，還能如何發力？

元宇宙將會如何塑造未來的工作方式？

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

NFT教育要從娃娃抓起！這些青少年藝術家已經賺取了幾千萬美金

猜你喜歡

熱門推薦

相關資訊