AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

Sora爆火96小時(shí)國內(nèi)大模型進(jìn)場(chǎng)-專家認(rèn)為,國內(nèi)企業(yè)想彎道超車難度不小

來源: 責(zé)編: 時(shí)間:2024-02-29 14:33:11 180觀看
導(dǎo)讀 OpenAI“文字生成視頻”大模型Sora根據(jù)提示詞“紐約市像亞特蘭蒂斯一樣被淹沒。魚、鯨魚、海龜和鯊魚在紐約的街道上游弋”生成的20秒視頻。視頻截圖(1/1)■Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實(shí)

 puq28資訊網(wǎng)——每日最新資訊28at.com

puq28資訊網(wǎng)——每日最新資訊28at.com

OpenAI“文字生成視頻”大模型Sora根據(jù)提示詞“紐約市像亞特蘭蒂斯一樣被淹沒。魚、鯨魚、海龜和鯊魚在紐約的街道上游弋”生成的20秒視頻。視頻截圖puq28資訊網(wǎng)——每日最新資訊28at.com

(1/1)puq28資訊網(wǎng)——每日最新資訊28at.com

■Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實(shí)世界如何存在puq28資訊網(wǎng)——每日最新資訊28at.com

■視頻生成需要處理和預(yù)測(cè)長時(shí)間跨度內(nèi)的動(dòng)作和場(chǎng)景變化,增加了模型復(fù)雜度puq28資訊網(wǎng)——每日最新資訊28at.com

■Sora的角色更多是賦能創(chuàng)作者,而不是替代他們提供實(shí)現(xiàn)創(chuàng)意愿景的新途徑puq28資訊網(wǎng)——每日最新資訊28at.com

本報(bào)記者查睿puq28資訊網(wǎng)——每日最新資訊28at.com

春節(jié)期間,大洋彼岸又放出大招——美國人工智能團(tuán)隊(duì)OpenAI發(fā)布“文字生成視頻”大模型Sora,特別是官方公布的長達(dá)60秒未經(jīng)修改的AI視頻,引發(fā)業(yè)界極大的震撼,網(wǎng)友驚呼“現(xiàn)實(shí)不存在了”。puq28資訊網(wǎng)——每日最新資訊28at.com

發(fā)布短短96個(gè)小時(shí)內(nèi),國內(nèi)已有AI團(tuán)隊(duì)緊急上線相關(guān)“文字生成視頻”大模型,但與國外主流AI視頻模型能力相仿,均無法超越Sora的水平。puq28資訊網(wǎng)——每日最新資訊28at.com

“Sora能力超乎預(yù)期,但仍未達(dá)到顛覆行業(yè)的水平。”專家指出,AI生成視頻技術(shù)仍有門檻,國內(nèi)企業(yè)想彎道超車面臨不小的難度。puq28資訊網(wǎng)——每日最新資訊28at.com

碾壓同行puq28資訊網(wǎng)——每日最新資訊28at.com

2月16日,谷歌發(fā)布新一代多模態(tài)大模型Gemini 1.5 Pro,在性能上超越OpenAI的GPT-4 Turbo,堪稱業(yè)界最強(qiáng)大模型。然而,OpenAI在同一日發(fā)布Sora大模型,風(fēng)頭直接蓋過谷歌,僅需通過文本即可自動(dòng)生成視頻,這也是繼文本模型ChatGPT和圖片模型Dall-E之后,又一極具顛覆性的大模型產(chǎn)品。puq28資訊網(wǎng)——每日最新資訊28at.com

Sora并非首個(gè)文本生成視頻的大模型。據(jù)不完全統(tǒng)計(jì),截至去年年底,全球能實(shí)現(xiàn)文本生成視頻的大模型包括Runway、Pika、Stable Video Diffusion等20多個(gè)產(chǎn)品。Sora的誕生仍給業(yè)界帶來不小的震撼,它所展現(xiàn)出來的能力幾乎可用“碾壓”來形容。puq28資訊網(wǎng)——每日最新資訊28at.com

用戶僅需輸入簡(jiǎn)短一句話,Sora就可生成一段長達(dá)60秒的視頻,遠(yuǎn)遠(yuǎn)超過市面上同類型級(jí)別的AI視頻生成時(shí)長。在此之前,AI視頻模型生成時(shí)長幾乎在10秒以內(nèi),而“明星模型”Runway和Pika等也僅有3到4秒。puq28資訊網(wǎng)——每日最新資訊28at.com

60秒的視頻時(shí)長,已超過抖音等短視頻平臺(tái)的平均視頻時(shí)長,Sora的誕生也為以后短視頻平臺(tái)的內(nèi)容生產(chǎn)提供了更大的可能性。puq28資訊網(wǎng)——每日最新資訊28at.com

Sora保證視頻時(shí)長的同時(shí),也加強(qiáng)了視頻質(zhì)量的穩(wěn)定性。記者體驗(yàn)此前的AI生成視頻時(shí)發(fā)現(xiàn),即便是幾秒鐘的視頻也并不連貫,有較強(qiáng)的拼湊感。而Sora幾乎能做到60秒視頻一鏡到底,OpenAI的演示視頻顯示,一名時(shí)尚女性走過喧鬧繁華的東京街頭,無論是背景建筑和街道以及人像的逼真程度,都保持一致性,哪怕是各種鏡頭的蒙太奇,都沒有出現(xiàn)明顯的失真情況。puq28資訊網(wǎng)——每日最新資訊28at.com

OpenAI在官方博客中寫道,Sora不僅可以理解用戶的需求,還知道這些事物在現(xiàn)實(shí)世界如何存在。這離不開OpenAI在文本和圖像方面的長期積累。puq28資訊網(wǎng)——每日最新資訊28at.com

上海市人工智能行業(yè)協(xié)會(huì)秘書長鐘俊浩解釋,Sora的訓(xùn)練依賴于大量帶有文本標(biāo)題的視頻數(shù)據(jù)。OpenAI利用Dall-E 3中的標(biāo)題生成技術(shù),為視頻生成高質(zhì)量的文本標(biāo)題,以此提高文本和視頻數(shù)據(jù)之間的對(duì)齊度。在大規(guī)模訓(xùn)練過程中,Sora展示了一些“涌現(xiàn)的模擬能力”,如三維一致性、長距離連貫性、物體持久性以及與世界互動(dòng)的能力等。這些能力表明Sora能夠在一定程度上模擬物理世界和數(shù)字世界的人物、動(dòng)物和環(huán)境。puq28資訊網(wǎng)——每日最新資訊28at.com

用嗶哩嗶哩科技Up主“Git源寶”的話來說,OpenAI先拆解大量的視頻素材,并將文字與視頻做匹配對(duì)應(yīng),之后又進(jìn)行密集訓(xùn)練,使Sora擁有自主生成視頻的能力。puq28資訊網(wǎng)——每日最新資訊28at.com

挑戰(zhàn)不少puq28資訊網(wǎng)——每日最新資訊28at.com

雖然技術(shù)令人驚艷,但Sora的視頻生成能力并不完美。已披露的視頻顯示,不少素材仍會(huì)“一眼假”,不符合物理學(xué)規(guī)律等AI生成的Bug(漏洞)不少。puq28資訊網(wǎng)——每日最新資訊28at.com

以“幼狼玩耍”視頻為例,Sora生成的內(nèi)容中出現(xiàn)漏洞:在嬉戲打鬧中,幼狼的數(shù)量從3只到5只來回變換,雖然動(dòng)作連貫,但戲法般的效果讓人摸不到頭腦。另外在“一個(gè)老人吹蠟燭”的指令下,Sora生成的視頻卻顯示,老人對(duì)著生日蛋糕的蠟燭吹氣,卻沒有一根蠟燭熄滅;在呈現(xiàn)“紅酒杯在桌上摔碎”的鏡頭中,杯子摔碎前,紅酒已灑滿桌子,“先摔碎后灑酒”的邏輯,Sora也沒有理解。puq28資訊網(wǎng)——每日最新資訊28at.com

或許是考慮到性能、安全等問題,Sora并未向公眾開放,目前處于安全測(cè)試階段。據(jù)外媒預(yù)測(cè),GPT-4經(jīng)過6個(gè)月的測(cè)試后正式向公眾開放,預(yù)計(jì)Sora將于8月向公眾開放。puq28資訊網(wǎng)——每日最新資訊28at.com

在鐘俊浩眼中,Sora面臨的技術(shù)挑戰(zhàn)仍不少,特別是與文本對(duì)話和圖片生成相比,訓(xùn)練成本高昂、高質(zhì)量數(shù)據(jù)集的缺乏以及視頻描述的模糊性都將是Sora需要跨越的門檻。puq28資訊網(wǎng)——每日最新資訊28at.com

“視頻生成需要處理和預(yù)測(cè)長時(shí)間跨度內(nèi)的動(dòng)作和場(chǎng)景變化,這增加了模型的復(fù)雜度和訓(xùn)練的計(jì)算需求。”他認(rèn)為,與文本和圖像相比,適用于視頻生成的多模態(tài)高質(zhì)量數(shù)據(jù)集相對(duì)較少,這限制了模型學(xué)習(xí)復(fù)雜動(dòng)作語義的能力,不僅如此,描述視頻內(nèi)容比描述靜態(tài)圖像復(fù)雜,因?yàn)樗枰〞r(shí)間上的變化、動(dòng)作以及可能的情感或故事線索。puq28資訊網(wǎng)——每日最新資訊28at.com

值得一提的是,在Sora發(fā)布的同時(shí),OpenAI宣布一項(xiàng)要約售股交易,由此OpenAI整體估值高達(dá)800億美元,一年內(nèi)飆升兩倍多。根據(jù)調(diào)研公司CB Insights統(tǒng)計(jì),OpenAI已成為全球估值最高的創(chuàng)業(yè)公司之一,僅次于字節(jié)跳動(dòng)和SpaceX。puq28資訊網(wǎng)——每日最新資訊28at.com

難言顛覆puq28資訊網(wǎng)——每日最新資訊28at.com

Sora的橫空出世引爆學(xué)界、業(yè)界和投資界的討論熱度。puq28資訊網(wǎng)——每日最新資訊28at.com

短短4天內(nèi),中信建投、國泰君安、申萬宏源、招商證券等10家券商在研報(bào)中均表示,Sora是人工智能發(fā)展進(jìn)程中的里程碑,預(yù)示AGI(人工通用智能)將加速到來,眾多行業(yè)將迎來顛覆式變革。puq28資訊網(wǎng)——每日最新資訊28at.com

天風(fēng)證券認(rèn)為,內(nèi)容創(chuàng)作工作流有望被顛覆,下一個(gè)億級(jí)用戶的互聯(lián)網(wǎng)平臺(tái)雛形出現(xiàn)。2000億美元的短視頻創(chuàng)作生態(tài)有望率先被顛覆,生成式AI在視頻創(chuàng)作和世界模型的大踏步進(jìn)步將實(shí)現(xiàn)對(duì)視頻、3D、游戲等下游應(yīng)用場(chǎng)景的滲透。puq28資訊網(wǎng)——每日最新資訊28at.com

中信證券從投資角度判斷,Sora背后的涌現(xiàn)能力為自動(dòng)駕駛、設(shè)計(jì)等需要現(xiàn)實(shí)世界建模的行業(yè)提供了明確方向,硬件端的需求必然會(huì)隨著多模態(tài)的技術(shù)進(jìn)步不斷提高,因此AI算力持續(xù)看好。puq28資訊網(wǎng)——每日最新資訊28at.com

“Sora讓人震驚,很大原因是AI的發(fā)展速度遠(yuǎn)超預(yù)期。但不意味著短時(shí)間能形成生產(chǎn)力。”鐘俊浩認(rèn)為,Sora現(xiàn)在能力還不足以顛覆行業(yè),特別是影視行業(yè)和游戲行業(yè)高度依賴創(chuàng)意、情感投入和人類故事講述的領(lǐng)域。AI視頻生成技術(shù)可以提供幫助,比如降低制作成本、加速內(nèi)容生成,甚至在某些情境下提供創(chuàng)意靈感,但目前還不能完全替代人類在創(chuàng)作過程中的獨(dú)特視角和情感深度。“Sora的角色更多是賦能創(chuàng)作者,而不是替代他們提供實(shí)現(xiàn)創(chuàng)意愿景的新途徑。”puq28資訊網(wǎng)——每日最新資訊28at.com

根據(jù)觀察,Sora的文本到視頻生成技術(shù)難以進(jìn)行精細(xì)的局部調(diào)整。如果用戶希望修改視頻中的某個(gè)具體細(xì)節(jié),可能需要進(jìn)行復(fù)雜的手工編輯,不僅工作量大,而且也要求用戶具備一定的視頻編輯技能。同時(shí),Sora每次生成的視頻內(nèi)容有較大變化,難以保持一致的敘事風(fēng)格或視覺風(fēng)格。“即便是60秒超長視頻,也無法滿足大部分影視作品需求,將多個(gè)短視頻片段拼接起來,在轉(zhuǎn)場(chǎng)的協(xié)調(diào)和連貫性上也是額外挑戰(zhàn)。”鐘俊浩說。puq28資訊網(wǎng)——每日最新資訊28at.com

游戲開始puq28資訊網(wǎng)——每日最新資訊28at.com

Sora出手即“王炸”,AI生成視頻創(chuàng)業(yè)公司無疑將面臨巨大壓力。Runway CEO瓦倫祖拉在社交媒體寫道“Game On(游戲開始了)”,Stability CEO莫斯塔克由衷夸贊“奧特曼(OpenAI CEO)真是個(gè)魔術(shù)師”。而由華人郭文景創(chuàng)立的Pika Labs也感受到巨大沖擊力,去年11月發(fā)布Pika,能夠生成和編輯3D動(dòng)畫、動(dòng)漫、卡通和電影,是一款零門檻的視頻生成器,她向媒體透露,團(tuán)隊(duì)如今正準(zhǔn)備招人,直接對(duì)標(biāo)Sora。puq28資訊網(wǎng)——每日最新資訊28at.com

今年1月,字節(jié)跳動(dòng)也發(fā)布了MagicVideo-V2文生視頻模型,通過文生圖大模型先生成一張符合當(dāng)前輸入文本的圖片,然后使用圖片與文本描述利用圖生成視頻模型生成簡(jiǎn)單的視頻,并使用視頻到視頻模型,對(duì)當(dāng)前的視頻進(jìn)行超分辨率技術(shù)合成,讓視頻更清晰細(xì)膩。puq28資訊網(wǎng)——每日最新資訊28at.com

前幾日,阿里云旗下魔搭社區(qū)(ModelScope)上線文本生成視頻大模型。記者從阿里云方面了解到,這是第三方創(chuàng)作者上傳的作品,目前由文本特征提取、文本特征到視頻隱空間擴(kuò)散模型、視頻隱空間到視頻視覺空間這3個(gè)子網(wǎng)絡(luò)組成,整體模型參數(shù)約17億,僅支持英文輸入。文本生成視頻大模型已面向公眾開放,與Sora類似可直接輸入文字即可看到生成的視頻效果,目前已公布9個(gè)官方案例。比如“A panda eating bamboo on a rock”,將出現(xiàn)2秒鐘“大熊貓?jiān)谑^上吃竹子”的視頻。puq28資訊網(wǎng)——每日最新資訊28at.com

不過這一大模型并不成熟,記者以類似的“A panda dancing(跳舞的大熊貓)”為例,生成2秒鐘的視頻耗時(shí)長達(dá)32分鐘,且輸出的視頻與“吃竹子的大熊貓”沒有太大區(qū)別。puq28資訊網(wǎng)——每日最新資訊28at.com

北京社會(huì)科學(xué)院副研究員王鵬告訴記者,盡管國內(nèi)大模型近年來取得顯著進(jìn)展,但與OpenAI、谷歌、英偉達(dá)等國際大公司相比,仍存在技術(shù)差距。這些國際大公司在深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺等領(lǐng)域擁有更深厚的技術(shù)積累和研發(fā)實(shí)力,在AIGC領(lǐng)域具有更強(qiáng)的競(jìng)爭(zhēng)力。puq28資訊網(wǎng)——每日最新資訊28at.com

“國內(nèi)企業(yè)要迎頭趕上,需要在技術(shù)研發(fā)、人才培養(yǎng)和市場(chǎng)洞察上下功夫,同時(shí)還要考慮到國內(nèi)外市場(chǎng)的差異性和合規(guī)性問題。”人工智能行業(yè)天使投資人郭濤認(rèn)為,國內(nèi)AI企業(yè)不妨與成熟技術(shù)團(tuán)隊(duì)建立戰(zhàn)略合作,共享技術(shù)資源,針對(duì)國內(nèi)市場(chǎng)需求,進(jìn)行產(chǎn)品和應(yīng)用創(chuàng)新,實(shí)現(xiàn)彎道超車。puq28資訊網(wǎng)——每日最新資訊28at.com

上海機(jī)會(huì)puq28資訊網(wǎng)——每日最新資訊28at.com

“現(xiàn)在上海有些公司正在進(jìn)行‘從一張圖到另一張圖生成中間視頻’的大模型產(chǎn)品研發(fā),比如上海人工智能企業(yè)重點(diǎn)孵化器‘AI驛站’中的小冰公司、筆墨AI等企業(yè)。”鐘俊浩說,上海在技術(shù)研發(fā)、人才培養(yǎng)、數(shù)據(jù)資源、算力資源等方面與國際大公司存在不小差距。“追上Sora的能力需要時(shí)間,這不僅取決于技術(shù)投入和研發(fā)速度,還需要考慮行業(yè)生態(tài)的建設(shè)。”puq28資訊網(wǎng)——每日最新資訊28at.com

他認(rèn)為,OpenAI目前在競(jìng)爭(zhēng)力上一騎絕塵,中國要在AI領(lǐng)域追趕,首先依然靠人才,鼓勵(lì)行業(yè)高密度聚集,避免人才分散,也避免智能算力等稀缺資源分散。上海應(yīng)發(fā)揮全產(chǎn)業(yè)鏈生態(tài)優(yōu)勢(shì),鼓勵(lì)行業(yè)結(jié)合,尤其在智能制造、機(jī)器人等領(lǐng)域,整合不同行業(yè)的技術(shù)和市場(chǎng)資源。同時(shí),鼓勵(lì)相關(guān)企業(yè)、研究機(jī)構(gòu)和教育機(jī)構(gòu)在特定區(qū)域聚集,以促進(jìn)知識(shí)共享、人才流動(dòng)和資源高效利用。通過政策引導(dǎo)和資源配置,集中力量攻克關(guān)鍵技術(shù)難題。puq28資訊網(wǎng)——每日最新資訊28at.com

上海在大模型領(lǐng)域的發(fā)展正迅速推進(jìn),目前已成為國內(nèi)在人工智能和大模型研發(fā)上的重鎮(zhèn)。根據(jù)《上海市推動(dòng)人工智能大模型創(chuàng)新發(fā)展若干措施(2023—2025年)》,上海將加快打造世界級(jí)人工智能產(chǎn)業(yè)集群,這些措施包括支持大模型的創(chuàng)新能力、提升創(chuàng)新要素供給能級(jí)、推進(jìn)大模型的創(chuàng)新應(yīng)用,以及營造一流的創(chuàng)新環(huán)境。puq28資訊網(wǎng)——每日最新資訊28at.com

目前,徐匯區(qū)建立了全國首個(gè)以大模型、產(chǎn)業(yè)生態(tài)集聚發(fā)展為功能定位的產(chǎn)業(yè)生態(tài)空間。全國首批備案通過的8個(gè)大模型中,上海占三席,徐匯區(qū)集聚了全國近25%的大模型企業(yè)和項(xiàng)目,在全國大模型領(lǐng)域處于領(lǐng)先水平。puq28資訊網(wǎng)——每日最新資訊28at.com

 puq28資訊網(wǎng)——每日最新資訊28at.com

 puq28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3511-0.htmlSora爆火96小時(shí)國內(nèi)大模型進(jìn)場(chǎng)-專家認(rèn)為,國內(nèi)企業(yè)想彎道超車難度不小

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 人工智能搶走美國大廠員工“飯碗”

下一篇: 小米汽車工廠調(diào)研文件曝光,預(yù)計(jì)明年3月上市并4月交付

標(biāo)簽:
  • 熱門焦點(diǎn)
Top