AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

大模型2025三大爭議:技術、價格、AGI

來源: 責編: 時間:2025-01-25 09:38:11 92觀看
導讀*文章來源:36氪在大模型“撞墻論”不絕于耳的當下,行業比任何時候都更為迫切地渴求探索、渴求創新。步入2025年這短短一個月之內,全球大模型玩家仿佛集體“沖業績”,OpenAI、谷歌、DeepSeek等玩家密集發布了一系列新品。

*文章來源:36氪Qrx28資訊網——每日最新資訊28at.com

在大模型“撞墻論”不絕于耳的當下,行業比任何時候都更為迫切地渴求探索、渴求創新。Qrx28資訊網——每日最新資訊28at.com

步入2025年這短短一個月之內,全球大模型玩家仿佛集體“沖業績”,OpenAI、谷歌、DeepSeek等玩家密集發布了一系列新品。Qrx28資訊網——每日最新資訊28at.com

而縱觀整個大模型行業,幾乎是有史以來的第一次,大模型行業內部出現了大規模分歧與非共識:Qrx28資訊網——每日最新資訊28at.com

1.應用 vs技術——基礎模型的更新是否已經基本停滯?行業創新的重點轉移到應用?Qrx28資訊網——每日最新資訊28at.com

2.價格戰 vs價值戰——“價格戰”打不打?怎么打?創業公司打得過嗎?Qrx28資訊網——每日最新資訊28at.com

3.單模態 vs多模態——對于AGI來說,多模態究竟有多重要?Qrx28資訊網——每日最新資訊28at.com

在這十字路口前,每家大模型企業,都自愿或是被迫地,選擇了自己的站位。Qrx28資訊網——每日最新資訊28at.com

例如,OpenAI的GPT-o1試圖用強化學習為Scaling Law“續命”,谷歌Titans開始探索全新的模型記憶力架構;但同時也有更多玩家開始將注意力轉至應用優化、功能更新、用戶留存上。Qrx28資訊網——每日最新資訊28at.com

作為國內“大模型六小龍”之一,MiniMax此前一直以產品力強而聞名業內,在這個時間點也通過開源和一系列更新表達了自己的態度。Qrx28資訊網——每日最新資訊28at.com

2025年1月以來,MiniMax在十天內連發四個AI模型,包括基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01,以及視頻模型S2V-01、語音模型T2A-01。而兩個MiniMax-01系列模型,更是公司有史以來首度開源。Qrx28資訊網——每日最新資訊28at.com

創始人在近期的媒體訪談中也直接表示,“如果重新選,第一天就應該開源”。一家商業公司從開源走向閉源是常見的,從大家調侃“OpenAI變CloseAI”可見一斑,但從閉源走向開源卻不多。Qrx28資訊網——每日最新資訊28at.com

從MiniMax這一系列更新可以看出來,這家公司正試圖通過開源、創新、技術驅動的路徑,扭轉市場對其的“只有產品強”的印象。創始人表示,“技術品牌之所以重要,本質也是因為這個行業最大的驅動力是技術進化”。Qrx28資訊網——每日最新資訊28at.com

同時,面對當前大模型行業的三大“非共識”,MiniMax也試圖通過這一系列模型更新,給出自己的答案。Qrx28資訊網——每日最新資訊28at.com

01 卷應用 vs 卷技術:行業再次來到“Transformer時刻”Qrx28資訊網——每日最新資訊28at.com

從去年以來,大模型行業內部一個顯著的趨勢是——底層技術突破開始變慢。Qrx28資訊網——每日最新資訊28at.com

OpenAI的GPT-5屢屢跳票,時至今日仍不見蹤影。AI三大要素算力、算法、數據均出現了不同程度的發展停滯,2024年的模型能力似乎停止增長。Qrx28資訊網——每日最新資訊28at.com

與之相對應的,是大模型應用“投流大戰”的爆發。Qrx28資訊網——每日最新資訊28at.com

根據AppGrowing數據,自從月之暗面(Kimi)打響國內大模型“投流大戰”以來,國內前十款大模型產品合計投放廣告超過625萬條,按市場價折算,金額達到了15億元人民幣。Qrx28資訊網——每日最新資訊28at.com

以至于坊間戲稱:“大模型行業里唯一賺到錢的是B站、抖音、小紅書”;“共享單車補貼戰好歹普惠用戶,現在賺錢的只有廣告平臺。”Qrx28資訊網——每日最新資訊28at.com

落到應用層面,不少企業選擇了專攻APP產品、定制合作項目、為政企定制小模型等方案;而在模型技術層面,無論是國內還是海外,其大部分都統一選擇了較為安全的“對標GPT”方案,在技術路徑上全面跟隨OpenAI——而當OpenAI疑似“撞墻”后,整個行業看上去都放慢了腳步。Qrx28資訊網——每日最新資訊28at.com

1月15日,MiniMax發布并開源了最新一代MiniMax-01系列模型,包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01。Qrx28資訊網——每日最新資訊28at.com

與之同步公開的一份68頁技術論文《MiniMax-01:Scaling Foundation Models with Lightning Attention》,更是幾乎在整個AI技術圈都引起討論。Qrx28資訊網——每日最新資訊28at.com

(硅谷科技媒體VentureBeat及AI科技學者、投資人與創作者評價MiniMax-01系列模型的架構創新及長文本能力)Qrx28資訊網——每日最新資訊28at.com

從參數上來看,MiniMax-01總參數規模達到4560億,其綜合性能在多個主流評測集上與GPT-4o、Claude-3.5-Sonnet等SOTA(State-of-the-Art,業內頂尖)模型持平,支持400萬token的輸入,可輸入長度是GPT-4o的32倍、Claude-3.5-Sonnet的20倍。Qrx28資訊網——每日最新資訊28at.com

在測評集LongBench V2的最新結果中,MiniMax-Text-01綜合評分僅次于OpenAI的o1-preview和人類,位列第三。Qrx28資訊網——每日最新資訊28at.com

(Long Bench V2排行榜,LongBench V2是面向現實情景進行長上下文多任務深入理解和推理的測試集)Qrx28資訊網——每日最新資訊28at.com

如果只是模型性能很強,MiniMax-01并不會在AI研究人員中引發如此廣泛的關注。Qrx28資訊網——每日最新資訊28at.com

引人注目的點在于,MiniMax第一次在一個4560億參數的超大規模商用模型上,引入了有別于傳統Transformer架構的線性注意力(Linear Attention)機制,以極低的算力成本,試圖為困擾著整個大模型行業的難題提供一個新的解題思路。Qrx28資訊網——每日最新資訊28at.com

MiniMax-01針對大模型最底層、最核心的Transformer架構進行了重構,在傳統方案(下圖上半部分)的基礎上,引入了Linear Attention線性注意力,相當于從“分子”層面對物質進行改變。Qrx28資訊網——每日最新資訊28at.com

這也是為什么,這次MiniMax-01的開源會在AI研究圈引起如此大的關注。Qrx28資訊網——每日最新資訊28at.com

(MiniMax-01核心架構示意圖)Qrx28資訊網——每日最新資訊28at.com

線性注意力技術并不是MiniMax第一個提出的,正如大語言模型技術并不是OpenAI第一個提出的,但它們卻是第一個大膽、堅定地對其進行大規模應用,并圍繞其進行了從算法到框架的全面創新,最終取得顛覆式成功的玩家。Qrx28資訊網——每日最新資訊28at.com

正是這種針對最底層技術的創新,使得MiniMax-01能夠以GPT-4o十分之一的算力成本,達到比肩業內SOTA的性能,以及國際第一的400萬token超長上下文。Qrx28資訊網——每日最新資訊28at.com

在技術論文的MiniMax的研究人員表示,MiniMax-01仍有八分之一的部分沿用了傳統Transformer技術思路。當前,他們正在研究一套更高效的全新架構,最終完全去掉傳統方案,從而實現無限制上下文窗口。Qrx28資訊網——每日最新資訊28at.com

這也就意味著,如果MiniMax成功了,大模型將從此不再受限于輸入長度,人類離AGI(通用人工智能)前進了一大步。Qrx28資訊網——每日最新資訊28at.com

正如當年BERT橫空出世,大模型產業迎來“Transformer時刻”一樣;從某種程度上來說,我們也許正在見證“第二個Transformer時刻”。Qrx28資訊網——每日最新資訊28at.com

02 價格戰 vs 價值戰:算力成本居高不下,“人人都在為英偉達打工”Qrx28資訊網——每日最新資訊28at.com

如果要回顧2024年大模型行業發展,有一個關鍵詞絕對不容錯過——“價格戰”。Qrx28資訊網——每日最新資訊28at.com

這一領域的戰場主要集中在B端,更精確來說,是為to B用戶提供大模型API服務并按量計價的大模型供應商們。Qrx28資訊網——每日最新資訊28at.com

2024年5月初,國內初創企業DeepSeek(深度求索)在發布最新模型DeepSeek-V2的同時,突然大幅調低了API價格,其每百萬token輸入價格低至1元,接近于當時GPT-4 Turbo價格的百分之一。此后,字節跳動、百度、阿里、騰訊、智譜AI、科大訊飛等行業玩家全面跟進,一場轟轟烈烈的大模型價格戰就此打響。Qrx28資訊網——每日最新資訊28at.com

與之相對應的,卻是居高不下的算力價格。Qrx28資訊網——每日最新資訊28at.com

自ChatGPT于2022年底火爆以來,本已接近供不應求的英偉達GPU芯片,在全球AI大模型爆火的背景下,價格也進一步飆升,帶動著英偉達公司市值一路突破3萬億美元,超越蘋果,成為僅次于微軟的全球第二大市值企業。Qrx28資訊網——每日最新資訊28at.com

GPU不僅價格高昂,并且有價無市,2023年甚至出現過海外AI初創企業用英偉達GPU抵押融資23億美元的新聞。由于算力昂貴而稀缺,即便在科技巨頭內部,也有不少部門為集團GPU算力分配爭得頭破血流——不少大模型從業人員戲稱“人人都在為英偉達打工”。Qrx28資訊網——每日最新資訊28at.com

一邊是高昂的算力成本,另一邊卻是慘烈的價格大戰,夾在其中的大模型廠商兩相為難。Qrx28資訊網——每日最新資訊28at.com

不過并非沒有解法。Qrx28資訊網——每日最新資訊28at.com

答案似乎有些老生常談——技術帶來的問題,終究還是要回到技術找解法。Qrx28資訊網——每日最新資訊28at.com

以DeepSeek為例:與MiniMax類似,DeepSeek也是堅定不移的“卷技術”派。2024年,在對技術不斷優化后,其推出的V3模型參數量達到了671B,訓練成本僅為557.6萬美元,對比之下,2020年的GPT-3訓練成本已經接近1200萬美元,GPT-4的訓練成本更是超過1億美元。Qrx28資訊網——每日最新資訊28at.com

事實上,模型訓練成本的降低不僅與模型算法有關,它涵蓋了算力和應用的中間層的多個步驟,涉及算法、架構、硬件、軟件、工具鏈的優化與調度,一般稱為AI Infra(AI基礎設施)。在算力成本居高不下的背景下,AI Infra的首要目標是優化算力資源,在保證性能的同時盡可能降低模型部署成本。Qrx28資訊網——每日最新資訊28at.com

而MiniMax-01所引入的Linear Attention技術,本質上是通過算法降低矩陣輸入復雜度,從而降低算力成本。與此同時,MiniMax還引入了數據打包(Data-packing)、線性注意力序列并行性(LASP+)、多級填充(Multi-level Padding)等一系列技術,從數據、算法、到GPU通信間進行了全面優化,使得其在英偉達H20 GPU上機器浮點利用率(MFU)高達75%,極大降低了模型的訓練與推理成本,其輸入價格僅為1元/百萬token,是GPT-4o的十分之一。Qrx28資訊網——每日最新資訊28at.com

在被媒體問到“MiniMax過去一年比較滿意的技術成果是什么?”時,MiniMax創始人的回答是:AI Infra與算力優化,以及多模態。Qrx28資訊網——每日最新資訊28at.com

03 單模態 vs 多模態:我們離AGI還有多遠?Qrx28資訊網——每日最新資訊28at.com

多模態可能是業內分歧最小,但競爭最為激烈的領域。Qrx28資訊網——每日最新資訊28at.com

模態(Modal)是計算機用語,可以理解為計算機和人之間的感知交流模式的分類——如文字、圖像、聲音、視頻等。Qrx28資訊網——每日最新資訊28at.com

目前除了極少數堅持單模態的玩家外,市場上的大部分AI企業都會瞄準多模態賽道,最基礎的是文字、圖像兩個賽道,涉獵更多的則會涵蓋音頻、視頻、3D建模等等。Qrx28資訊網——每日最新資訊28at.com

以語音為例,1月20日,MiniMax發布T2A-01系列語音大模型,支持17種語言,目前已經上線其海螺語音產品,面向所有用戶開放。Qrx28資訊網——每日最新資訊28at.com

文本轉語音其實是個老技術了,此前的發聲效果一直很生硬,無法像人類一樣控制語調的情緒起伏、抑揚頓挫。谷歌翻譯還曾因為發音太過機械,一度成了互聯網熱梗。Qrx28資訊網——每日最新資訊28at.com

MiniMax這次上線的語音大模型基本已經到了商用水準,AI有聲書、廣播劇、動畫、視頻配音這些場景目前看來都能夠覆蓋。Qrx28資訊網——每日最新資訊28at.com

而比語音大模型更受關注的,則要數視頻大模型。Qrx28資訊網——每日最新資訊28at.com

2024年2月,Sora橫空出世,帶動全球AI視頻大模型開始“狂飆”。不過,在此期間行業其他玩家的視頻生成大模型不斷涌現,Sora在發布后卻始終處于“期貨”狀態,直到12月才正式推出。Qrx28資訊網——每日最新資訊28at.com

目前AI視頻大模型領域有兩大主流技術路徑:文生視頻、圖生視頻。Qrx28資訊網——每日最新資訊28at.com

二者各有優劣,文生視頻(Text-to-Video)主流采用Diffusion技術,擁有極好的“發散思維”能力,用戶可以通過文本描述生成任何想象中的視頻內容;但另一方面模型訓練和推理的計算復雜度高,而且視頻主體穩定性極差——尤其是人物的面部。Qrx28資訊網——每日最新資訊28at.com

圖生視頻(Image-to-Video)與其相反,模型將根據用戶輸入的圖片生成視頻內容,一個典型的應用場景就是“讓老照片動起來”,其相比文生視頻主體穩定性更好,計算資源需求更低,但視頻自由度嚴重受限。Qrx28資訊網——每日最新資訊28at.com

不過,MiniMax在1月10日發布的最新視頻模型S2V-01卻打破了兩者間的壁壘,其自研基于單張圖片的主體參考功能,用戶在上傳一張圖片創建參考角色后,模型會將圖片中的主體視覺信息抽取出來,再根據用戶的文本Prompt進行視頻生成,在保證視頻主體穩定的同時,將創意表達得更靈活。Qrx28資訊網——每日最新資訊28at.com

尤其如下圖所示,是在用人物特寫圖像生成視頻時,S2V-01能夠保證極高程度的人物五官、面部細節穩定、自然。Qrx28資訊網——每日最新資訊28at.com

尤為下圖人物的眉心、臉頰、唇角各有一顆痣,海螺AI所生成的視頻不僅能夠清晰還原參考圖中痣的細節,還能在不同鏡頭中保持其位置的一致性——在目前所有AI視頻生成大模型中,這可能是第一個能做到的。Qrx28資訊網——每日最新資訊28at.com

(海外平臺上,創作者們對S2V-01表現出極高熱情)Qrx28資訊網——每日最新資訊28at.com

值得關注的是,MiniMax-S2V-01模型對于視覺和文字信息的處理方式,非常接近人類。Qrx28資訊網——每日最新資訊28at.com

事實上,多任務、多語境、多模態是AI界“冠上明珠”——通用人工智能(AGI)——的幾大主要研究方向。Qrx28資訊網——每日最新資訊28at.com

在AI界的目標中,AGI是一種極其復雜、靈活的人工智能,不僅能完成圖像分類或跨語種文本翻譯等任務,還能模擬人類分析、策劃、創造等一切認知能力。Qrx28資訊網——每日最新資訊28at.com

不過,多模態并非是當前唯一的技術路徑,也有技術流派將語言大模型認定為AGI的通路。不過就目前而言,在行業尚未達成明確AGI共識的當下,Agent(智能體)是個目標更明確的關鍵節點。Qrx28資訊網——每日最新資訊28at.com

隨著大模型底層技術的發展,各行各業對Agent能力要求也在不斷提高,任務變得越來越復雜、數據量越來越龐大,相應而言,大模型本身不僅需要更長的上下文處理能力,同時也需要越來越“像人”,不斷提升其對圖像、視頻、聲音等多模態信息的處理能力。Qrx28資訊網——每日最新資訊28at.com

2025年,可能是AI Agent爆發的一年。Qrx28資訊網——每日最新資訊28at.com

結語Qrx28資訊網——每日最新資訊28at.com

截止至2024年12月,根據AI產品榜數據,MiniMax旗下的AI內容社區Talkie以2977萬的月活躍用戶數,成為全球第一大AI內容社區——這是中國AI廠商第一次在海外超過同類應用,登頂全球第一。Qrx28資訊網——每日最新資訊28at.com

按理來說,作為這場比賽中的贏家,MiniMax應該比任何人都要擁護“卷應用”。Qrx28資訊網——每日最新資訊28at.com

但很有意思的是,MiniMax創始人在最近接受媒體采訪時,卻拋出了“中國人工智能產業過去一兩年走入了巨大的誤區:認為用戶越多,模型能力提升越快。這也導致企業為了有更多用戶,就花大量的錢來買流量”的觀點,引發了業內激烈討論。Qrx28資訊網——每日最新資訊28at.com

坦白說,他可能是對的。Qrx28資訊網——每日最新資訊28at.com

一直以來,MiniMax都是大模型行業里一個非常獨特的存在。Qrx28資訊網——每日最新資訊28at.com

一個事實是,全球許多大模型公司基本都在2022年底ChatGPT火了之后才成立,但MiniMax則早在2021年底就成立了。這也導致當年ChatGPT突然爆火之后,所有人都懵了,回過頭來四處打聽這個MiniMax到底是何方神圣。Qrx28資訊網——每日最新資訊28at.com

在技術路徑上,MiniMax也始終有些“特立獨行”。Qrx28資訊網——每日最新資訊28at.com

2023年,彼時國內市場還是Dense(稠密)模型的天下,MiniMax卻將80%以上的算力和資源全部投入MoE(混合專家)模型的開發中,于2024年初推出了國內第一個MoE大模型。Qrx28資訊網——每日最新資訊28at.com

事后,MiniMax曾經透露,當時公司沒有準備任何MoE以外的備選計劃。Qrx28資訊網——每日最新資訊28at.com

一年后來看,MiniMax賭對了。如今,MoE路徑已經成為各家共識,尤其在模型規模、計算規模越來越大的當下,混合專家技術已成為模型大規模部署必不可少的核心技術。Qrx28資訊網——每日最新資訊28at.com

在行業普遍選擇跟隨GPT-o1路徑的當下,MiniMax卻大膽地瞄準了困擾全行業的“Transformer撞墻”問題,通過底層架構的創新,用有限的算力成本達到真正可以比肩國際領軍模型的效果。Qrx28資訊網——每日最新資訊28at.com

用戶從來都是用腳投票的。Qrx28資訊網——每日最新資訊28at.com

無論是文本、圖像、語音還是視頻,每當模型能力、處理速度有重大提升時,這一提升都會真切地反映在產品與用戶體驗中。MiniMax曾經透露,每當模型能力變強后,產品內用戶的留存表現和使用深度都有著顯著提升。Qrx28資訊網——每日最新資訊28at.com

從創業第一天起,MiniMax就是一個集合了大量“非共識”的存在,它在業務選擇、技術路線、AGI實現路徑上都有著獨立而清晰的判斷,不焦慮,也不跟風,敢于在非共識路上突破上限、做難而正確的事。Qrx28資訊網——每日最新資訊28at.com

當前的大模型產業,已經進入了比賽的下半場,所有“低處的果子”都已被摘光,僅靠跟風與模仿,幾乎毫無勝算。Qrx28資訊網——每日最新資訊28at.com

靠技術創新打開的市場,終究還是要靠技術創新站穩腳跟。Qrx28資訊網——每日最新資訊28at.com

舉報 0收藏 0打賞 0評論 0
 
 
更多>同類資訊
點擊查看更多 +
全站最新
沃爾沃ES90純電版來襲!3月發布,能否在中大型電車市場站穩腳跟?
沃爾沃ES90純電版來襲!3月發布,能否在中大型電車市場站穩腳跟?
理想汽車:2024年底高速充電站近1700座,覆蓋全國23省市99城
理想汽車:2024年底高速充電站近1700座,覆蓋全國23省市99城
6.5英寸手機成新寵?華為OPPO等大廠計劃推出,智能手機市場再掀波瀾
6.5英寸手機成新寵?華為OPPO等大廠計劃推出,智能手機市場再掀波瀾
奧迪Q6 e-tron越野概念車亮相:門式車橋+越野胎,技術亮點搶先看
奧迪Q6 e-tron越野概念車亮相:門式車橋+越野胎,技術亮點搶先看
華為鴻蒙新春大放送,1月1日起升級NEXT系統享多重會員權益
華為鴻蒙新春大放送,1月1日起升級NEXT系統享多重會員權益
華為領跑5G專利榜,高通愛立信緊隨其后表現不俗
華為領跑5G專利榜,高通愛立信緊隨其后表現不俗
熱門內容
  • 95后AI天才少女羅福莉跳槽小米,DeepSeek-V3模型已上線并開源
  • 三星Galaxy S25系列真機曝光,明日發布會將有何驚喜?
  • 95后AI天才少女羅福莉,棄幻方量化投小米,雷軍千萬年薪有何吸引力?
  • 支付寶集五福新升級,2025年1月20日活動盛大啟幕!
  • 掃地機器人進化新形態,追覓機械手引領家庭服務智能革命
  • 2025食飲營銷新風向:短劇、游戲聯名、AI技術引領創新潮流
  • CES 2025:Aria機器人亮相,高度擬人可換臉,專為陪伴而生
  • DeepSeek實測:低成本AI大模型能否媲美行業巨頭?
  • 三星Galaxy S25系列評測:AI大升級,Ultra版全面領跑
  • 英偉達CES發布Project Digits:3000美元迷你AI超算實拍亮相
  • 字節跳動自建數據中心,2025年計劃投資1600億打造大規模集群
  • 三星S25系列發布會前瞻:手機迭代溫和,OneUI 7與AI硬件成亮點?
  • DeepSeek團隊揭秘:清北應屆生領銜,年輕力量如何撐起AI大模型新篇章?
  • 中部最大智算中心“河南空港”正式投產,算力規模將達10萬P!
  • CES現場直擊:萌友智能Ropet,讓大白式陪伴機器人走進現實?
本欄最新
“人類終極考試”難倒頂級AI:跨學科挑戰暴露AI短板
“人類終極考試”難倒頂級AI:跨學科挑戰暴露AI短板
AI時代來臨,連鄉村老人都成“科技弄潮兒”了?
AI時代來臨,連鄉村老人都成“科技弄潮兒”了?
1月24日A股收紅,人工智能領漲,兩市成交縮量至1.22萬億
1月24日A股收紅,人工智能領漲,兩市成交縮量至1.22萬億
金華市低空產投運營公司成立,注冊資本2億元
金華市低空產投運營公司成立,注冊資本2億元
中文傳媒等成立數智科技公司,含AI業務
中文傳媒等成立數智科技公司,含AI業務
金華新成立低空產業投資運營公司,注冊資本高達2億!
金華新成立低空產業投資運營公司,注冊資本高達2億!

本文鏈接:http://www.tebozhan.com/showinfo-45-10173-0.html大模型2025三大爭議:技術、價格、AGI

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: AI大模型“智譜”高層變動:前Midjourney亞洲VP加入,兩位融資高管離職

下一篇: 國超算長沙中心攜加佳科技,共探教育出版智算新篇章

標簽:
  • 熱門焦點

最新推薦

猜你喜歡

熱門推薦

相關資訊

Top