中國經濟導報、中國發展網訊 記者邱愛荃報道 7月6日,在2024世界人工智能大會期間,快手舉辦了以“新AI·新應用·新生態”為主題的大模型論壇,會上,快手大模型首次集體亮相,視頻生成大模型可靈、圖像生成大模型可圖等產品的多項新功能正式發布。
繼圖生視頻、視頻續寫功能發布之后,可靈在一個月內迎來了第三次重大升級,網頁端(https://klingai.kuaishou.com)也正式上線。在本次論壇上,可靈推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等新功能,同時,創作者單次生成的文生視頻時長增加至10秒。圖像生成大模型可圖則宣布正式開源,這一舉措旨在激發行業活力,共建一個更為繁榮的文生圖大模型社區生態。
一直以來,AI技術創新都是推動快手發展的驅動力,不僅覆蓋內容生產、理解、推薦等多個層面,也持續推進著快手商業生態的智能化經營水平。快手高級副總裁、主站業務與社區科學線負責人蓋坤表示,快手未來將繼續加大在AI領域的投入,大力推動技術創新,“堅定地為用戶做最好的AI技術”。
蓋坤介紹,快手搭建了以快意語言大模型、推薦大模型、視覺生成大模型為核心的大模型矩陣,覆蓋內容理解、分發、生成等多個層面,并深度服務快手的商業生態場景。其中,快手的推薦大模型SIM,憑借十萬億參數的規模,成為全球領先的推薦系統之一,其下一代架構ACT預計每日將為快手App增加4億分鐘的用戶觀看時長,顯著提升用戶粘性和活躍度。
“堅定大模型技術投入與創新,堅持在真場景中挖掘真價值,滿足用戶的真需求”。快手副總裁、大模型團隊負責人張迪表示,將用大模型技術重塑快手業務,通過“升級理解、創新互動、探索生成”,在內容生產方面,打造“新一代AIGC創作、素材工具”和低門檻、智能化的內容生產體驗;在內容消費領域,升級快手的內容理解和分發體系,提升用戶的消費體驗。
據悉,基于快意大模型構建的視頻腳本生成,直播實時腳本生成、廣告線索客服,疊加數字人技術,助力商業化廣告主低成本生成高品質的視頻和直播內容,提升線索轉化效率。快手的AIGC營銷素材在今年6月達到了單日消耗峰值突破2000萬的里程碑,展示了大模型在商業場景中的巨大潛力。
快手商業化外循環和AI商業產品負責人劉逍透露,半年來,有近2萬商家在快手平臺借助大模型能力實現智能化經營,獲得不菲回報。相比今年1月,今年6月的AIGC月活躍客戶數增長了8倍,月GMV規模提升了64倍,平臺AIGC廣告收入規模提升了12倍。劉逍表示,磁力開創、女媧數字人、π數字員工等“新生意”工具將持續為商家深度賦能,“我們將繼續深化AI技術在商業化中的應用,不斷創新和發展,為客戶創造更多價值。”
可靈AI推出Web端 上線首尾幀控制、鏡頭控制等新功能
繼圖生視頻、視頻續寫功能發布之后,可靈AI在一個月內迎來了第三次重大升級,網頁端也將正式上線。在本次論壇上,快手宣布,可靈AI基礎模型再度升級,推出更加清晰的高畫質版,以及首尾幀控制、鏡頭控制等全新編輯能力,同時,創作者單次生成的文生視頻時長增加至10s,是業內對用戶開放使用可實現的最長時長。
作為全球首個真正用戶可用的視頻生成大模型,可靈于6月6日正式發布文生視頻功能,隨后又于CVPR會議期間推出了圖生視頻、視頻續寫等多項新功能,支持用戶最長生成約3分鐘視頻。可靈以真實世界物理規則為基準,生成的視頻展現出了電影級別的畫質與動態效果,甚至能夠模擬大幅度的物理運動,打破了傳統視頻生成技術的局限。這一突破性成果,不僅在國內收獲了用戶的廣泛好評,更在海外引起了巨大反響,引發了全球對中國AI技術發展速度的廣泛關注與討論。
蓋坤介紹,截至目前,已有超過50萬用戶申請可靈的內測資格,視頻生成數量達700萬。用戶通過“可靈”創造的“老照片復活”等作品,因為觸動人心的力量火爆全網。快手也將繼續致力于提升模型基礎質量,增強畫質清晰度,并引入更多創新功能,以滿足用戶多樣化需求。
快手視覺生成與互動中心負責人萬鵬飛表示,可靈AI大模型最新發布的版本中,可靈在運動生成、生成時長、物理規律、視頻畫質、指令響應、圖生視頻、視頻可控性等七個方向的能力亮點實現進一步升級,可單次生成更高清更可控的10s及更長的視頻。
值得關注的是,國內首部AIGC原創奇幻短劇《山海奇鏡之劈波斬浪》預告片還在會議期間驚艷亮相,可靈為該劇提供深度技術支持。AIGC技術的迅猛發展,為短劇產業注入了全新的活力。張迪指出,利用AI技術可大幅度提高短劇生產、制作和運營的效率,“可能半年以前,大家都沒法想象真正用AIGC來制作電影,(現在它)來了!”
此外,為了進一步激發AI愛好者們的創作熱情,快手還在論壇上正式發起“靈”感迸發——首屆可靈AI x 快影視頻創作大賽,聯動六大頂尖院校,總獎金池超30萬元。大賽還特別推出“可靈AI x 星芒短劇”創作者孵化計劃,各專題一等獎獲得者將受邀加入創作者扶持計劃,有機會獲得重磅流量及現金獎勵、與行業專家進行面對面交流。
可圖正式開源 將共建更繁榮的文生圖大模型生態
在圖像生成大模型領域,快手的可圖同樣處于行業領先水平,擁有多項核心優勢,諸如強大的復雜語義理解能力、攝影級的畫面質感、多條件的可控風格化生成等。在權威機構智源研究院的測評中,可圖以75.23分位居文生圖大模型領域全球第二水平。
蓋坤介紹,可圖大模型集成了快手在大語言模型領域的深厚積累,通過數十億中文語料的訓練,成為最懂中文的文生圖模型,其綜合性能超越了SDXL/SD3等開源模型以及Midjourney等閉源模型,樹立了中文場景下圖像生成的新標桿。本次論壇上,快手宣布可圖將正式開源,這一舉措旨在激發行業活力,共建一個更為繁榮的文生圖大模型社區生態。
會上,中國計算機學會(CCF)還宣布與快手攜手,共同成立“CCF-快手大模型探索者基金”,并同步開啟基金申請通道。該基金計劃于年內推出12個研究項目,課題最高可獲30萬元支持,旨在應對AI技術迅猛發展的趨勢及業界對前沿技術的迫切需求,聚焦新一代大模型的關鍵技術研發。
面向未來,蓋坤表示,快手將繼續加大在AI領域的投入,大力推動技術創新,“堅定地為用戶做最好的AI技術”。
本文鏈接:http://www.tebozhan.com/showinfo-28-8187-0.html快手大模型首次集體亮相 用AI重塑內容與商業生態
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com