在科技界掀起的最新風(fēng)暴中,DeepSeek如同一顆璀璨的新星,瞬間吸引了全球的目光,將一眾國產(chǎn)大模型的光芒黯然失色。無論是早已聲名在外的Kimi、后來居上的豆包,還是用戶基數(shù)龐大的文心一言,乃至全球開源榜首的通義千問,在DeepSeek的震撼登場(chǎng)面前,都顯得稍遜一籌。
這并非意味著其他國產(chǎn)大模型缺乏實(shí)力,而是DeepSeek的表現(xiàn)太過耀眼。以往,國內(nèi)科技巨頭們總在探討與OpenAI的差距,但在DeepSeek這里,話題變成了它是否已超越了OpenAI。DeepSeek所代表的開源路線,甚至迫使OpenAI的CEO山姆·奧爾特曼反思,他認(rèn)為OpenAI或許站在了歷史的錯(cuò)誤一邊,需要重新考慮開源策略。
DeepSeek的出現(xiàn),不僅震撼了科技行業(yè),也在C端市場(chǎng)引發(fā)了巨大反響。數(shù)據(jù)顯示,自上線以來,僅20天時(shí)間,DeepSeek的日活躍用戶就突破了2000萬大關(guān),成為全球增長(zhǎng)最快的AI應(yīng)用。相比之下,ChatGPT達(dá)到1500萬日活用了244天,而DeepSeek僅用了18天。20天后,DeepSeek的日活已達(dá)到2215萬,是ChatGPT日活用戶的41.6%,遠(yuǎn)超豆包的1695萬。
這場(chǎng)AI風(fēng)暴的異常猛烈,且與眾不同之處在于,它是由一家中國創(chuàng)業(yè)公司主導(dǎo)引發(fā)的。這引發(fā)了廣泛討論:為何是DeepSeek脫穎而出?
過去兩年,國內(nèi)主流的互聯(lián)網(wǎng)大廠在大模型賽道上投入巨大,推出了多款產(chǎn)品,市場(chǎng)也滿懷期待,希望有朝一日能與硅谷AI一較高下。然而,最終打破僵局的卻是DeepSeek,大廠未能實(shí)現(xiàn)的,它做到了。
DeepSeek的爆火,是多年厚積薄發(fā)的結(jié)果。雖然此次一鳴驚人,但其團(tuán)隊(duì)在AI領(lǐng)域的布局已久,甚至比大廠還早。DeepSeek由知名私募巨頭幻方量化孕育而生,創(chuàng)始人梁文鋒在大學(xué)期間就篤信人工智能將改變世界,這一信念貫穿了他的創(chuàng)業(yè)生涯。
2015年,梁文鋒創(chuàng)辦了幻方,成為國內(nèi)最早使用人工智能進(jìn)行量化交易的公司。自2016年起,幻方逐步將深度學(xué)習(xí)技術(shù)應(yīng)用于交易,并在2018年將AI確定為公司的主要發(fā)展方向。此后,幻方成立了幻方AI,自稱是一家以大規(guī)模深度學(xué)習(xí)基礎(chǔ)研究與應(yīng)用為核心的人工智能公司。從2019年至2021年,幻方相繼自主研發(fā)了“螢火一號(hào)”與“螢火二號(hào)”AI集群,極大提升了算力支持,并積極招募算法科學(xué)家。
除了技術(shù)儲(chǔ)備,幻方在基礎(chǔ)設(shè)施上的投入也毫不遜色。當(dāng)ChatGPT在2023年橫空出世時(shí),市場(chǎng)驚訝地發(fā)現(xiàn),國內(nèi)擁有高性能GPU芯片最多的不是人工智能公司,而是梁文鋒旗下的幻方量化。彼時(shí),幻方擁有超過1萬張A100芯片儲(chǔ)備,足見其對(duì)AI的投入之大。
DeepSeek的成功,還得益于以梁文鋒為代表的創(chuàng)業(yè)團(tuán)隊(duì)的銳氣。互聯(lián)網(wǎng)大廠的AI戰(zhàn)略往往依附于現(xiàn)有業(yè)務(wù)體系,這固然能快速商業(yè)化,但也限制了技術(shù)演進(jìn)的路徑。而背靠幻方的DeepSeek,既有強(qiáng)大的財(cái)力支持,又有創(chuàng)業(yè)者敢于從零開始、不怕試錯(cuò)的勇氣。這使得DeepSeek能夠沿著創(chuàng)新的道路一路前行。
梁文鋒對(duì)于創(chuàng)新的態(tài)度非常堅(jiān)決。他認(rèn)為,中國公司不能總是習(xí)慣于別人做技術(shù)創(chuàng)新,自己拿過來做應(yīng)用變現(xiàn)。在這一波浪潮里,DeepSeek的出發(fā)點(diǎn)不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,推動(dòng)整個(gè)生態(tài)發(fā)展。他指出,中國AI與美國之間的差距不僅僅是時(shí)間上的,更是原創(chuàng)與模仿之間的差距。如果不改變這一點(diǎn),中國將永遠(yuǎn)是追隨者。
DeepSeek實(shí)現(xiàn)創(chuàng)新的方式是拋棄慣性的反套路。在團(tuán)隊(duì)組成上,國內(nèi)大廠通常傾向于海外挖人,快速拉起團(tuán)隊(duì)。而DeepSeek團(tuán)隊(duì)多由本土Top高校的應(yīng)屆畢業(yè)生組成,選人標(biāo)準(zhǔn)注重?zé)釔酆秃闷嫘摹T诠ぷ鳈C(jī)制上,DeepSeek鼓勵(lì)自然分工和靈活調(diào)用資源,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無需審批。這種反效率的工作方式,恰恰為顛覆性創(chuàng)新的誕生提供了可能。
對(duì)于大廠為何沒有做出DeepSeek的問題,DeepSeek表示,這本質(zhì)上是組織慣性、商業(yè)化壓力與技術(shù)路徑共同作用的結(jié)果。這場(chǎng)由開源模型引發(fā)的技術(shù)革命,正在倒逼大廠重新思考創(chuàng)新邏輯。若無法跳出既有框架,大廠的技術(shù)話語權(quán)或?qū)⑦M(jìn)一步削弱。
本文鏈接:http://www.tebozhan.com/showinfo-45-10569-0.html國產(chǎn)AI大模型破局者:DeepSeek為何能超越BAT?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com