近日,據(jù)CNBC報(bào)道,中國人工智能初創(chuàng)公司DeepSeek發(fā)布了一項(xiàng)震撼業(yè)界的聲明,稱其新研發(fā)的人工智能模型性能可媲美OpenAI,但構(gòu)建成本卻僅為后者的一小部分。這一消息迅速在科技界引發(fā)軒然大波。
DeepSeek聲稱,其大型語言模型的訓(xùn)練成本僅為560萬美元,這一數(shù)字遠(yuǎn)低于科技巨頭在訓(xùn)練和運(yùn)行高級(jí)AI工作負(fù)載上所需的高額計(jì)算基礎(chǔ)設(shè)施費(fèi)用。這一斷言讓投資者對(duì)科技巨頭現(xiàn)有的投入產(chǎn)生了擔(dān)憂,進(jìn)而影響了市場表現(xiàn),例如英偉達(dá)市值在消息傳出后的首個(gè)交易日大幅下跌。
然而,并非所有人都對(duì)DeepSeek的聲明持樂觀態(tài)度。業(yè)內(nèi)專家對(duì)此反應(yīng)不一,有人對(duì)DeepSeek的技術(shù)突破表示贊賞,同時(shí)也有人對(duì)其聲明的真實(shí)性表示懷疑。CNBC就此事咨詢了多位業(yè)內(nèi)專家,以獲取對(duì)DeepSeek及其與OpenAI之間對(duì)比的深入見解。
DeepSeek由專注于人工智能的量化對(duì)沖基金High-Flyer的聯(lián)合創(chuàng)始人梁文鋒于2023年創(chuàng)立,公司致力于大型語言模型和通用人工智能(AGI)的研究。AGI作為一個(gè)概念,指的是人工智能在廣泛任務(wù)上能夠等同于或超越人類智力的水平。
DeepSeek最新發(fā)布的推理模型R1,可與OpenAI的同類產(chǎn)品相媲美。R1將提示分解為較小的部分,并在生成響應(yīng)前考慮多種方法,旨在以類似于人類的方式處理復(fù)雜問題。盡管R1背后的技術(shù)并非全新,但DeepSeek是首個(gè)將其部署到高性能AI模型中的公司,并據(jù)稱大大降低了功耗要求。
DeepSeek的V3和R1兩大系統(tǒng)引起了AI社區(qū)的廣泛關(guān)注。這兩個(gè)模型均為開源,意味著它們的底層代碼可免費(fèi)獲取,并可公開供其他開發(fā)人員定制和重新分發(fā)。在性能方面,DeepSeek表示R1在推理任務(wù)上實(shí)現(xiàn)了與OpenAI同類產(chǎn)品的相當(dāng)性能,并引用了多項(xiàng)基準(zhǔn)測試結(jié)果作為證明。
盡管DeepSeek聲稱其訓(xùn)練成本遠(yuǎn)低于競爭對(duì)手,但關(guān)于其運(yùn)行成本的具體數(shù)字尚不清楚。科技洞察公司The Futurum Group的首席執(zhí)行官丹尼爾·紐曼雖然認(rèn)為這些發(fā)展表明了一個(gè)巨大的突破,但他對(duì)DeepSeek所給出的具體數(shù)字表示懷疑。
咨詢公司DGA Group中國區(qū)高級(jí)副總裁兼技術(shù)政策負(fù)責(zé)人Paul Triolio指出,很難直接比較DeepSeek的模型成本與美國主要開發(fā)商的模型成本。他強(qiáng)調(diào),DeepSeek所給出的560萬美元數(shù)字僅代表一次訓(xùn)練運(yùn)行的成本,而非開發(fā)該模型的總體研發(fā)成本。
在價(jià)格方面,DeepSeek和OpenAI均在其網(wǎng)站上披露了模型計(jì)算的定價(jià)。DeepSeek的R1模型在處理文本單元的成本上遠(yuǎn)低于OpenAI的同類產(chǎn)品,這使得DeepSeek在性價(jià)比方面具有一定優(yōu)勢。
然而,DeepSeek的聲明也引發(fā)了一些爭議。特別是在美國限制向中國出口先進(jìn)AI芯片的背景下,DeepSeek聲稱其模型是在使用成熟的Nvidia芯片上取得的突破,這引發(fā)了關(guān)于其是否使用了被禁芯片的質(zhì)疑。盡管Nvidia隨后表示DeepSeek使用的GPU完全符合出口要求,但這一爭議仍未平息。
業(yè)內(nèi)專家對(duì)DeepSeek所取得的成就普遍表示印象深刻,但一些人對(duì)這家中國公司的部分說法表示懷疑。例如,Oculus和Anduril的創(chuàng)始人帕爾默·盧基在社交媒體上表示,他認(rèn)為DeepSeek所給出的500萬美元成本數(shù)字是假的,并指責(zé)該公司試圖減緩對(duì)美國人工智能初創(chuàng)企業(yè)的投資。
盡管如此,仍有一些人對(duì)DeepSeek持樂觀態(tài)度。總部位于倫敦的初創(chuàng)公司NetMind的首席商務(wù)官Seena Rejal表示,他沒有理由不相信DeepSeek的聲明。他認(rèn)為,即使存在一定的誤差,DeepSeek的效率仍然很高,并且其解釋的邏輯非常合理。
人工智能的商品化趨勢日益明顯,DeepSeek的成功被廣泛認(rèn)為是該行業(yè)積極發(fā)展的一個(gè)標(biāo)志。meta首席人工智能科學(xué)家Yann LeCun表示,DeepSeek的成功代表了開源AI模型的勝利,而不一定代表中國戰(zhàn)勝美國。他認(rèn)為,DeepSeek受益于開放研究和開源項(xiàng)目,如meta的PyTorch和Llama等。
“對(duì)于那些看到DeepSeek的表現(xiàn)并認(rèn)為‘中國在人工智能領(lǐng)域正在超越美國’的人來說,你們理解錯(cuò)了。”LeCun在LinkedIn上的一篇帖子中寫道,“正確的理解是:開源模型正在超越專有模型。DeepSeek受益于開放研究和開源項(xiàng)目,他們提出了新的想法,并在其他人的工作基礎(chǔ)上構(gòu)建了這些想法。由于他們的工作已發(fā)表并開源,因此每個(gè)人都可以從中受益。這就是開放研究和開源的力量。”
本文鏈接:http://www.tebozhan.com/showinfo-45-10352-0.htmlDeepSeek挑戰(zhàn)OpenAI,低成本AI模型引發(fā)業(yè)界熱議
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com