DeepSeek的迅猛崛起,如同一顆璀璨的新星,不僅震撼了全球資本市場,更引發了業界對美國技術霸主地位的深刻反思。近日,這款由中國領先的量化私募機構幻方量化推出的AI應用,成功登頂美區及國內蘋果App Store免費榜,將ChatGPT、谷歌Gemini、微軟Copilot等一眾美國生成式AI產品甩在身后。
DeepSeek的火爆,直接沖擊了美國芯片股。在美股盤前交易中,AI芯片巨頭英偉達股價暴跌超過12%,市值瞬間蒸發超4000億美元,這一數字比AMD和英特爾的市值總和還要高出許多。與此同時,博通、臺積電、阿斯麥、美光等芯片股也紛紛下挫。谷歌母公司Alphabet、meta、亞馬遜等科技巨頭同樣未能幸免,股價均出現大幅下跌。A股AI算力指數也隨之下跌,多家相關企業股價遭遇重創。
分析師指出,DeepSeek之所以能對美國股市構成如此大的威脅,是因為該公司以極低的價格構建了一個突破性的AI模型,且無需依賴最先進的芯片。這一成就引發了業界對數百億美元資本支出的質疑,這些資金正被大量投入到AI芯片行業中。DeepSeek的成功,似乎預示著一種全新的AI發展模式,即高效算力調度和模型優化能力的重要性,遠超單純堆積硬件資源。
事實上,DeepSeek的崛起并非一蹴而就。自2024年5月發布DeepSeek-V2以來,憑借其創新的模型架構和極高的性價比,DeepSeek迅速贏得了市場的關注。該模型的推理成本極低,僅為開源大模型Llama3 70B的1/7、GPT-4 Turbo的1/70,這一優勢引發了包括字節、阿里、百度等企業在內的模型降價風潮。而近一個月以來,隨著新一代千億參數規模的基座模型DeepSeek-V3及R1推理模型的相繼發布,DeepSeek更是在海外市場聲名鵲起。
DeepSeek-R1在Chatbot Arena綜合榜單上位列第三,與OpenAI的頂尖推理模型o1并列,而其預訓練費用僅為557.6萬美元,僅為OpenAI GPT-4o模型訓練成本的不到十分之一。這一成就不僅彰顯了DeepSeek在模型訓練成本上的巨大優勢,更讓業界看到了中國在AI技術領域的巨大潛力。
中國工程院院士、清華大學計算機系教授鄭緯民認為,DeepSeek自研的MLA架構和DeepSeek MoE架構,為其模型訓練成本的大幅降低起到了關鍵作用。這些創新架構不僅壓縮了KV Cache大小,實現了存儲效率的大幅提升,還配合FFN層的改造,構建了一個非常大的稀疏MoE層,從而實現了訓練成本的大幅降低。
在算力、資金、芯片限制等外部挑戰之下,中國大模型廠商紛紛尋求軟件、算法等優化方案,以最大化算力利用效率。DeepSeek正是這一趨勢的佼佼者,其高性價比模式讓華爾街擔憂GPU銷量放緩,從而引發了對英偉達等芯片巨頭市值的重新評估。彭博社分析稱,DeepSeek在次先進的AI芯片上以更低成本的方式訓練出有效的模型,這一成就挑戰了“唯有美國科技巨頭才能研發尖端AI”的普遍認知。
DeepSeek的崛起,不僅讓中國AI技術在全球舞臺上大放異彩,更讓業界看到了“小而精”模式的巨大潛力。譚寅亮教授指出,DeepSeek的成功表明,在資源相對有限的情況下,通過高效的技術路徑和精準的市場定位,同樣可以取得快速突破。然而,他也強調,從長期來看,美國企業在“堆砌資源”方面的優勢依然難以忽視。但DeepSeek的崛起無疑為業界帶來了新的啟示,即不同技術路線和市場策略的多樣化競爭可能削弱“堆砌資源”模式的壟斷性效應。
面對DeepSeek的強勁勢頭,美國科技巨頭紛紛采取行動。OpenAI CEO奧爾特曼預告將推出ChatGPT免費套餐的o3-mini版本,以應對DeepSeek的競爭。meta則緊急成立多個作戰小分隊,拆解DeepSeek模型的技術秘訣。這些舉措無疑表明了美國科技巨頭對DeepSeek崛起的重視和警惕。
DeepSeek的創始人梁文鋒,以其卓越的領導力和創新精神,引領著幻方量化在AI領域不斷突破。他的成功不僅為中國AI技術的發展注入了新的活力,更為全球AI領域的競爭帶來了新的格局。
在當前中美AI熱潮下,DeepSeek無疑成為了關注的焦點。其克服算力限制瓶頸的成就,不僅讓中國AI技術在全球舞臺上嶄露頭角,更讓業界看到了中美AI技術競爭的未來走向。隨著DeepSeek等中國AI企業的不斷崛起,中美AI技術的競爭將更加激烈和精彩。
本文鏈接:http://www.tebozhan.com/showinfo-45-10240-0.htmlDeepSeek崛起沖擊全球資本市場,中美AI技術競爭迎來新變數
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com