在科技界掀起的最新風暴中,DeepSeek如同一顆璀璨的新星,瞬間吸引了全球的目光,將一眾國產大模型的光芒黯然失色。無論是早已聲名在外的Kimi、后來居上的豆包,還是用戶基數龐大的文心一言,乃至全球開源榜首的通義千問,在DeepSeek的震撼登場面前,都顯得稍遜一籌。
這并非意味著其他國產大模型缺乏實力,而是DeepSeek的表現太過耀眼。以往,國內科技巨頭們總在探討與OpenAI的差距,但在DeepSeek這里,話題變成了它是否已超越了OpenAI。DeepSeek所代表的開源路線,甚至迫使OpenAI的CEO山姆·奧爾特曼反思,他認為OpenAI或許站在了歷史的錯誤一邊,需要重新考慮開源策略。
DeepSeek的出現,不僅震撼了科技行業,也在C端市場引發了巨大反響。數據顯示,自上線以來,僅20天時間,DeepSeek的日活躍用戶就突破了2000萬大關,成為全球增長最快的AI應用。相比之下,ChatGPT達到1500萬日活用了244天,而DeepSeek僅用了18天。20天后,DeepSeek的日活已達到2215萬,是ChatGPT日活用戶的41.6%,遠超豆包的1695萬。
這場AI風暴的異常猛烈,且與眾不同之處在于,它是由一家中國創業公司主導引發的。這引發了廣泛討論:為何是DeepSeek脫穎而出?
過去兩年,國內主流的互聯網大廠在大模型賽道上投入巨大,推出了多款產品,市場也滿懷期待,希望有朝一日能與硅谷AI一較高下。然而,最終打破僵局的卻是DeepSeek,大廠未能實現的,它做到了。
DeepSeek的爆火,是多年厚積薄發的結果。雖然此次一鳴驚人,但其團隊在AI領域的布局已久,甚至比大廠還早。DeepSeek由知名私募巨頭幻方量化孕育而生,創始人梁文鋒在大學期間就篤信人工智能將改變世界,這一信念貫穿了他的創業生涯。
2015年,梁文鋒創辦了幻方,成為國內最早使用人工智能進行量化交易的公司。自2016年起,幻方逐步將深度學習技術應用于交易,并在2018年將AI確定為公司的主要發展方向。此后,幻方成立了幻方AI,自稱是一家以大規模深度學習基礎研究與應用為核心的人工智能公司。從2019年至2021年,幻方相繼自主研發了“螢火一號”與“螢火二號”AI集群,極大提升了算力支持,并積極招募算法科學家。
除了技術儲備,幻方在基礎設施上的投入也毫不遜色。當ChatGPT在2023年橫空出世時,市場驚訝地發現,國內擁有高性能GPU芯片最多的不是人工智能公司,而是梁文鋒旗下的幻方量化。彼時,幻方擁有超過1萬張A100芯片儲備,足見其對AI的投入之大。
DeepSeek的成功,還得益于以梁文鋒為代表的創業團隊的銳氣。互聯網大廠的AI戰略往往依附于現有業務體系,這固然能快速商業化,但也限制了技術演進的路徑。而背靠幻方的DeepSeek,既有強大的財力支持,又有創業者敢于從零開始、不怕試錯的勇氣。這使得DeepSeek能夠沿著創新的道路一路前行。
梁文鋒對于創新的態度非常堅決。他認為,中國公司不能總是習慣于別人做技術創新,自己拿過來做應用變現。在這一波浪潮里,DeepSeek的出發點不是趁機賺一筆,而是走到技術的前沿,推動整個生態發展。他指出,中國AI與美國之間的差距不僅僅是時間上的,更是原創與模仿之間的差距。如果不改變這一點,中國將永遠是追隨者。
DeepSeek實現創新的方式是拋棄慣性的反套路。在團隊組成上,國內大廠通常傾向于海外挖人,快速拉起團隊。而DeepSeek團隊多由本土Top高校的應屆畢業生組成,選人標準注重熱愛和好奇心。在工作機制上,DeepSeek鼓勵自然分工和靈活調用資源,每個人隨時可以調用訓練集群的卡無需審批。這種反效率的工作方式,恰恰為顛覆性創新的誕生提供了可能。
對于大廠為何沒有做出DeepSeek的問題,DeepSeek表示,這本質上是組織慣性、商業化壓力與技術路徑共同作用的結果。這場由開源模型引發的技術革命,正在倒逼大廠重新思考創新邏輯。若無法跳出既有框架,大廠的技術話語權或將進一步削弱。
本文鏈接:http://www.tebozhan.com/showinfo-45-10569-0.html國產AI大模型破局者:DeepSeek為何能超越BAT?
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com