在DeepSeek引發(fā)的風(fēng)暴之后,中國(guó)大模型創(chuàng)業(yè)領(lǐng)域正經(jīng)歷一場(chǎng)前所未有的變革。通過(guò)與多位行業(yè)專家的深入交流,筆者發(fā)現(xiàn),當(dāng)前國(guó)產(chǎn)大模型領(lǐng)域呈現(xiàn)出兩種截然不同的態(tài)勢(shì)。
一方面,那些積極融入DeepSeek生態(tài)的算力提供商、模型服務(wù)商,以及原本無(wú)法參與大模型“軍備競(jìng)賽”的開源受益者,正滿懷熱情地?fù)肀н@一變革。另一方面,以“大模型六小虎”為代表的其他中國(guó)大模型創(chuàng)業(yè)公司,以及過(guò)去兩年投資了這些公司的風(fēng)險(xiǎn)資本(VC)們,則陷入了深深的憂慮之中,整個(gè)行業(yè)呈現(xiàn)出鮮明的“冰火兩重天”景象。
“為何沒(méi)能成為DeepSeek”,以及“為何中國(guó)只有一個(gè)DeepSeek”,這兩個(gè)問(wèn)題自春節(jié)以來(lái)就一直困擾著大模型從業(yè)者和VC們。這兩個(gè)問(wèn)題不僅觸及了國(guó)內(nèi)大模型創(chuàng)新的焦慮核心,也是探討如何成為下一個(gè)DeepSeek的關(guān)鍵。
回顧過(guò)去四年中國(guó)大模型的發(fā)展歷程,我們不禁要問(wèn):中國(guó)是否缺乏像DeepSeek這樣的技術(shù)理想主義者?如果答案是否定的,那么這樣的技術(shù)團(tuán)隊(duì)是否得到了充分的挖掘和社會(huì)系統(tǒng)性的支持?如果沒(méi)有,原因何在?
2023年之前,中國(guó)僅有四家大模型公司:智譜、面壁、深言與聆心(后被智譜收購(gòu)),且均出自清華大學(xué)。2023年之后,大模型創(chuàng)業(yè)公司激增至十余家,技術(shù)上的直接原因是Llama的開源,但更深層次的原因在于,當(dāng)時(shí)普遍認(rèn)為大模型的技術(shù)門檻雖高,但并非不可模仿,尤其是基于開源大模型,技術(shù)難度進(jìn)一步降低,“技術(shù)不構(gòu)成商業(yè)壁壘”的觀點(diǎn)甚囂塵上。
在這種共識(shí)下,2023年ChatGPT爆火后,中國(guó)大模型創(chuàng)業(yè)領(lǐng)域的動(dòng)態(tài)呈現(xiàn)出一種畸形現(xiàn)象。智譜成為資本的寵兒,最早突破200億人民幣估值大關(guān),而同樣出自清華自然語(yǔ)言處理實(shí)驗(yàn)室(THUNLP)的面壁和深言,在資本市場(chǎng)的表現(xiàn)卻遠(yuǎn)不如后來(lái)者。尤其是面壁智能,作為國(guó)內(nèi)最早提出要做“平民版大模型”的公司,甚至比DeepSeek還早成立,但直到2024年年底完成一筆3億人民幣的融資后,估值仍不到35億人民幣。
據(jù)雷峰網(wǎng)AI科技評(píng)論與多位大模型投資人的交流,智譜與面壁在資本市場(chǎng)表現(xiàn)迥異的原因主要在于:清華學(xué)術(shù)派在投資大模型時(shí)往往只選擇一家,且對(duì)教授創(chuàng)業(yè)持保留意見;智譜的愿景更易于理解,對(duì)外融資時(shí)提出“對(duì)標(biāo)OpenAI”,VC立刻就能明白,而面壁一開始強(qiáng)調(diào)底層模型訓(xùn)練效率優(yōu)化,在熱錢最多的2023年一度被認(rèn)為是一家類似潞晨、硅基的“AI Infra”公司。
2023年大模型浪潮來(lái)臨后,中國(guó)的AI科技VC并未深入研究AGI技術(shù),而是迅速將資金投向了“曾打過(guò)勝仗的連續(xù)成功創(chuàng)業(yè)者”,哪怕這些團(tuán)隊(duì)此前從未涉足大模型研發(fā)。光年之外與百川智能就是典型代表。當(dāng)前估值超過(guò)200億人民幣的大模型公司中,只有智譜唐杰、月之暗面楊植麟等人是從2020年大模型未出圈時(shí)就開始技術(shù)探索的。
DeepSeek的研發(fā)團(tuán)隊(duì)同樣是從零開始學(xué)習(xí)大模型技術(shù),通過(guò)苦讀論文、死磕實(shí)驗(yàn),最終取得了顯著成果。然而,從過(guò)去兩年的行業(yè)發(fā)展來(lái)看,百川智能在基座模型上的升級(jí)并不頻繁,重心轉(zhuǎn)向醫(yī)療行業(yè)大模型。這種轉(zhuǎn)變雖然對(duì)百川有利,但對(duì)整個(gè)大模型行業(yè)的發(fā)展貢獻(xiàn)有限。
在資源有限的情況下,沒(méi)有技術(shù)能力的團(tuán)隊(duì)占據(jù)大量資本資源,而有技術(shù)能力的團(tuán)隊(duì)卻只能獲得極少的資本支持,這種系統(tǒng)性錯(cuò)位注定會(huì)產(chǎn)生遺憾。如果AGI大模型技術(shù)已無(wú)上升空間,各家的技術(shù)壁壘逐漸拉平,那么互聯(lián)網(wǎng)時(shí)代拼資源、拼資本的打法或許還能分到一杯羹。但對(duì)技術(shù)有敬畏之心的創(chuàng)業(yè)者始終保持清醒頭腦,他們能看到現(xiàn)有大模型底層算法與架構(gòu)在訓(xùn)練與推理中的不足,知道AGI仍有許多具體且高難度的問(wèn)題要解決。
底層技術(shù)的持續(xù)創(chuàng)新能力仍是大模型公司的護(hù)城河,純拼資源的互聯(lián)網(wǎng)方法論暫不適用當(dāng)前中國(guó)的大模型發(fā)展。一個(gè)不愿意學(xué)習(xí)技術(shù)的VC,比一個(gè)不愿意學(xué)習(xí)技術(shù)的研發(fā)團(tuán)隊(duì)所產(chǎn)生的殺傷力可能更大。
DeepSeek的成功不僅在于其過(guò)硬的技術(shù)實(shí)力,更在于其對(duì)AGI的純粹追求。DeepSeek專注AGI研究,依托梁文鋒個(gè)人與幻方量化的原有儲(chǔ)備資金,沒(méi)有向外融資。這種“自己有錢,所以不需要聽外界的,自己想干什么就干什么”的自在,讓DeepSeek能夠?qū)W⒂诩夹g(shù)探索,不受外界干擾。
DeepSeek的成功或許無(wú)法復(fù)制,但其對(duì)人才的重視程度值得借鑒。DeepSeek的招聘門檻非常高,團(tuán)隊(duì)規(guī)模雖不大,但成員大多是原幻方的技術(shù)高手。他們不僅擁有頂尖的技術(shù)能力,更有著對(duì)技術(shù)的敬畏之心和好奇之心。DeepSeek的內(nèi)部組織文化也非常扁平,只有一個(gè)老板:梁文鋒。這種集權(quán)風(fēng)格明顯的扁平化管理,使得團(tuán)隊(duì)在遇到困難時(shí)能夠自上而下協(xié)調(diào)資源,快速達(dá)到上傳下達(dá)的效果。
梁文鋒的個(gè)人風(fēng)格也十分明顯:有極強(qiáng)的技術(shù)信仰,對(duì)AGI有十足的好奇心與求知欲,并且十分刻苦。他說(shuō)話非常簡(jiǎn)潔,但往往一針見血。這種對(duì)技術(shù)的執(zhí)著和追求,正是DeepSeek能夠取得成功的關(guān)鍵。
DeepSeek的成功不僅改變了VC對(duì)大模型公司的看法,更讓整個(gè)行業(yè)意識(shí)到,AGI的實(shí)現(xiàn)仍需要理想主義。在DeepSeek之前,“北九坤、南幻方”已經(jīng)在金融量化領(lǐng)域鼎鼎有名,而量化行業(yè)對(duì)技術(shù)人才的高要求也是眾所周知的。DeepSeek的成功或許是一個(gè)偶然,但它所展現(xiàn)出的技術(shù)實(shí)力和創(chuàng)新能力,卻為整個(gè)行業(yè)樹立了榜樣。
然而,DeepSeek的成功并非一蹴而就。在DeepSeek之前,也有許多團(tuán)隊(duì)在探索大模型技術(shù),但大多未能取得顯著成果。這并非因?yàn)檫@些團(tuán)隊(duì)缺乏技術(shù)能力或創(chuàng)新精神,而是因?yàn)樗麄兾茨芟馜eepSeek一樣堅(jiān)持對(duì)AGI的純粹追求。許多團(tuán)隊(duì)在探索過(guò)程中逐漸轉(zhuǎn)向短期商收或產(chǎn)品打磨,放棄了對(duì)AGI的長(zhǎng)期投入。
這種轉(zhuǎn)變不僅反映了市場(chǎng)對(duì)技術(shù)缺乏敬畏之心,也反映了創(chuàng)業(yè)公司在面對(duì)市場(chǎng)壓力和資本誘惑時(shí)的無(wú)奈選擇。然而,對(duì)于真正追求AGI的團(tuán)隊(duì)來(lái)說(shuō),這種轉(zhuǎn)變是不可取的。他們必須堅(jiān)定信念,繼續(xù)投入資源和技術(shù)力量進(jìn)行探索和創(chuàng)新。
事實(shí)上,除了DeepSeek之外,國(guó)內(nèi)也有許多團(tuán)隊(duì)在堅(jiān)持創(chuàng)新并不斷探索新的解法來(lái)解決懸而未決的難題。例如香港大學(xué)計(jì)算與數(shù)據(jù)科學(xué)研究院院長(zhǎng)馬毅教授團(tuán)隊(duì)一直致力于研究可解釋、可控制的人工智能算法與框架(白盒理論);智譜團(tuán)隊(duì)從2021年開始探索多模態(tài)大模型并遇到了許多問(wèn)題;面壁團(tuán)隊(duì)則指出當(dāng)前主流的大模型架構(gòu)還無(wú)法很好地解決經(jīng)驗(yàn)學(xué)習(xí)與空間記憶等關(guān)鍵問(wèn)題。
隨著具身智能的發(fā)展,AGI也將分為云端AGI與端側(cè)AGI。這一趨勢(shì)為AGI的發(fā)展提供了新的方向和挑戰(zhàn)。要解決這些問(wèn)題,不僅需要資源投入,更需要強(qiáng)烈的技術(shù)實(shí)力和技術(shù)愿景。DeepSeek的路徑是從底層萬(wàn)卡集群、HAI框架向上貫穿構(gòu)建環(huán)環(huán)相扣的技術(shù)體系。這種從底層到上層的全面布局和深入探索正是DeepSeek能夠取得成功的關(guān)鍵所在。
在DeepSeek之后,中國(guó)的大模型創(chuàng)業(yè)領(lǐng)域?qū)⒑稳ズ螐模窟@是一個(gè)值得深思的問(wèn)題。但可以肯定的是,那些能夠堅(jiān)持對(duì)AGI的純粹追求、擁有強(qiáng)大技術(shù)實(shí)力和創(chuàng)新能力的團(tuán)隊(duì)將更有可能成為下一個(gè)DeepSeek。而這些團(tuán)隊(duì)的成功也將為中國(guó)AI的崛起注入新的動(dòng)力。
本文鏈接:http://www.tebozhan.com/showinfo-45-10600-0.html中國(guó)大模型創(chuàng)業(yè)圈:DeepSeek之后,誰(shuí)將是下一個(gè)技術(shù)引領(lǐng)者?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 歐洲AI新勢(shì)力Mistral與Deepseek,能否撼動(dòng)美國(guó)ChatGPT霸主地位?
下一篇: DeepSeek-V3 API調(diào)價(jià),輸出費(fèi)用漲至8元每百萬(wàn)tokens