在人工智能領域,一場關于技術革新與生態構建的盛宴于近日拉開帷幕。在這場備受矚目的生態開放日上,階躍星辰,一家被業界譽為“AI六小虎”的成員,以其獨特的姿態和前瞻性的布局,成為了全場焦點。
回顧2024年,階躍星辰無疑是模型層競爭中的佼佼者。這家起步較晚的公司,卻以驚人的速度發布了涵蓋語言、語音、視覺、推理等多個模態的11款模型,展現了其在多模態技術上的深厚積累。
階躍星辰的模型矩陣,如同一顆顆璀璨的星辰,照亮了AI探索的征途。
階躍星辰的CEO姜大昕曾透露,公司自成立之初便明確了AGI(通用人工智能)的發展路徑:從單模態到多模態,再到多模態理解和生成的統一,最終邁向世界模型和AGI。而2024年,正是階躍星辰邁向多模態關鍵節點的一年。
然而,在階躍星辰開啟“多模態理解和生成的統一”探索之前,一條名為DeepSeek的“鯰魚”攪動了整個大模型賽道。DeepSeek不僅通過API價格戰將大模型價格拉低至1元/百萬tokens,還開源了推理模型R1,引發了業界對Scaling Law暴力美學的深刻反思。
DeepSeek的崛起,對階躍星辰等六小虎構成了不小的挑戰。R1等高性能模型的開源,讓閉源模型的商業化之路變得更加艱難。同時,R1采用的低投入強化學習訓練范式,也讓六小虎的高估值和燒錢模式受到了質疑。
面對DeepSeek的沖擊,階躍星辰選擇了以開源作為回應。在R1發布后不久,階躍星辰便開源了兩款多模態模型,這一舉動被視為其捍衛技術地位的無聲宣言。這兩款模型,一款是參數量達到300億的圖生視頻模型Step-Video-T2V,另一款則是1300億參數的語音交互模型Step-Audio,它們與DeepSeek注重的文本模型形成了鮮明對比。
階躍星辰開源的多模態模型,無疑為行業注入了新的活力。
在探索AGI的征途中,階躍星辰將多模態推理視為模型發展的重要方向。這一觀點在行業內得到了廣泛認同。百度集團執行副總裁沈抖就曾預測,行業的重心將從訓練轉移到推理,多模態將成為主流需求。
階躍星辰在多模態推理模型上的進展令人矚目。在生態開放日上,階躍星辰宣布與清華大學聯合研發的Open-Reasoner-Zero,這是首個從預訓練模型直接進行大規模強化學習的開源推理模型,其效率是DeepSeek-R1-Zero的25倍。階躍星辰還在推進一項內部項目——視覺推理模型,該模型能夠實現視覺空間下的慢思考,能夠理解和解答復雜的視覺問題。
階躍星辰在多模態推理模型上的突破,為AI的發展開辟了新的道路。
在模型落地方向,階躍星辰看好AI Agent的潛力。姜大昕認為,2025年將是Agent的爆發年。他提到,影響Agent發展的兩個關鍵因素——多模態和慢思考,在2024年都取得了顯著進展。階躍星辰將Agent分為垂類Agent和智能終端Agent兩大類,并積極與下游客戶進行生態共創。
階躍星辰的Agent合作生態,展現了其在智能終端和垂類領域的廣泛布局。
在生態開放日的圓桌論壇上,曠視科技創始人印奇以自動駕駛公司“千里科技”董事長的身份亮相。他認為,目前最成功的AI產品仍是特斯拉和抖音,但大模型將為應用帶來更大的市場空間。印奇的出席,無疑為這場生態開放日增添了更多看點。
本文鏈接:http://www.tebozhan.com/showinfo-21-132343-0.html階躍星辰生態開放日:多模態推理與AI Agent成新焦點
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com