在2025年的春節(jié)前夕,大模型領(lǐng)域迎來(lái)了一場(chǎng)意想不到的“狂歡”。DeepSeek,這家初出茅廬的大模型公司,以一記重拳震撼了整個(gè)AI界——它正式開(kāi)源了DeepSeek-R1,這款模型在數(shù)學(xué)、代碼及自然語(yǔ)言推理等方面,與OpenAI的o1正式版并駕齊驅(qū)。
這一消息如同平地驚雷,讓眾多AI研究者瞠目結(jié)舌,紛紛揣測(cè)DeepSeek是如何在硬件受限的條件下實(shí)現(xiàn)這一壯舉的。據(jù)悉,DeepSeek采用了一系列技術(shù)創(chuàng)新,大幅降低了模型對(duì)算力的需求,同時(shí)實(shí)現(xiàn)了性能的提升。英偉達(dá)市值的劇烈波動(dòng),更是成為了這場(chǎng)“AI地震”的余波。
DeepSeek的技術(shù)創(chuàng)新引發(fā)了廣泛討論。許多觀點(diǎn)認(rèn)為,它在算力受限的困境中,走出了一條與OpenAI截然不同的道路。而大洋彼岸的硅谷,對(duì)DeepSeek的態(tài)度也頗為微妙,從最初的贊譽(yù)有加,到后來(lái)的網(wǎng)絡(luò)攻擊與審查,這背后折射出的是中國(guó)AI崛起的巨大沖擊力。
回望過(guò)去兩年,中國(guó)大模型領(lǐng)域的發(fā)展猶如脫韁野馬,狂飆突進(jìn)。文心一言、豆包、可靈等國(guó)產(chǎn)大模型,已在多個(gè)垂直賽道中嶄露頭角,跨過(guò)了曾經(jīng)看似不可逾越的“護(hù)城河”。
以視頻生成領(lǐng)域?yàn)槔琌penAI在2024年春節(jié)期間推出了Sora,被視為視頻生成技術(shù)的里程碑。然而,僅過(guò)了半年,可靈便橫空出世,以文生視頻技術(shù)的實(shí)質(zhì)性領(lǐng)先,讓硅谷首次感受到了“中國(guó)AI技術(shù)的獨(dú)特優(yōu)勢(shì)”。
在語(yǔ)音通話方面,GPT-4o為ChatGPT帶來(lái)了實(shí)時(shí)語(yǔ)音通話能力,但用戶體驗(yàn)卻差強(qiáng)人意。相比之下,豆包實(shí)時(shí)語(yǔ)音大模型在2025年初正式上線時(shí),其擬人度、有用性、情商、通話穩(wěn)定性及對(duì)話流暢度均令人驚艷。且該功能在豆包App中全面開(kāi)放,人人皆可免費(fèi)使用,填補(bǔ)了國(guó)產(chǎn)大模型在“端到端語(yǔ)音系統(tǒng)”上的空白。
而DeepSeek-R1的橫空出世,更是將這場(chǎng)“AI狂歡”推向了高潮。這款僅用550萬(wàn)美元訓(xùn)練的模型,在短短幾周內(nèi)便從Deepseek-v3基座進(jìn)化為擁有堪比OpenAI o1的思維鏈推理能力。其背后的純強(qiáng)化學(xué)習(xí)路線及面向H800的大量?jī)?yōu)化創(chuàng)新,成為了業(yè)界熱議的焦點(diǎn)。
值得注意的是,推理模型雖是當(dāng)前最熱門的方向之一,但也存在局限性。大模型推理基于當(dāng)前已知數(shù)據(jù),一旦遭遇錯(cuò)誤的推理路徑,便可能陷入死循環(huán)。因此,提升檢索增強(qiáng)能力顯得尤為重要。而在這方面,文心一言無(wú)疑是國(guó)內(nèi)RAG(檢索增強(qiáng)生成)能力最領(lǐng)先的大模型應(yīng)用。
作為國(guó)內(nèi)搜索領(lǐng)域的佼佼者,百度在RAG技術(shù)上擁有得天獨(dú)厚的優(yōu)勢(shì)。它基于搜索技術(shù)的積累,推出了百度AI原生檢索,持續(xù)保持領(lǐng)先。從RAG能力實(shí)測(cè)來(lái)看,國(guó)內(nèi)外主流大模型中,百度文心一言的綜合表現(xiàn)最為出色。
在實(shí)際測(cè)試中,文心一言甚至在某些任務(wù)上超越了OpenAI的ChatGPT。例如,在回答關(guān)于春節(jié)檔電影細(xì)節(jié)、春晚節(jié)目等內(nèi)容時(shí),文心一言能夠準(zhǔn)確回應(yīng);而ChatGPT雖能檢索到信源,卻無(wú)法生成準(zhǔn)確答案。在回答關(guān)于春晚語(yǔ)言類節(jié)目、國(guó)際新聞等問(wèn)題時(shí),文心一言同樣展現(xiàn)出了更高的準(zhǔn)確性和全面性。
百度在RAG技術(shù)上的優(yōu)勢(shì),得益于其在中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化及實(shí)時(shí)數(shù)據(jù)整合能力等方面的深厚積累。這使得文心一言在中文互聯(lián)網(wǎng)、企業(yè)服務(wù)、政務(wù)等場(chǎng)景中更具實(shí)用性和競(jìng)爭(zhēng)力。百度研發(fā)的“理解-檢索-生成”協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù),更是顯著提升了大模型技術(shù)及應(yīng)用的效果。
隨著DeepSeek等中國(guó)大模型廠商的崛起,OpenAI昔日的“技術(shù)黑盒”正被逐一破解。從復(fù)制Sora到復(fù)制o1,中國(guó)大模型廠商已經(jīng)證明了自己的實(shí)力。知名AI研究者吳恩達(dá)也表示,中國(guó)在生成式人工智能方面正在趕超美國(guó)。借助Qwen、Kimi、InternVL和DeepSeek等模型,中國(guó)正在迅速縮小與美國(guó)的差距,并在視頻生成等領(lǐng)域取得了領(lǐng)先地位。
本文鏈接:http://www.tebozhan.com/showinfo-45-10397-0.html國(guó)產(chǎn)大模型全面崛起,2025年將迎來(lái)哪些高光時(shí)刻?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 幣安陷爭(zhēng)議:行業(yè)爆料文章指其存在利益輸送與內(nèi)部貪腐問(wèn)題
下一篇: 騰訊云實(shí)現(xiàn)DeepSeek-R1大模型快速部署,開(kāi)發(fā)者3分鐘接入新時(shí)代