圖片來源:Pixabay
Deepseek的橫空出世,無疑在全球AI領域掀起了一場風暴。該產品不僅在國內一直霸榜,還成功超過谷歌旗下的Gemini,成為全球第二受歡迎的AI聊天機器人。如此優異的表現吸引了全球各路人馬的眼光,其中就包括特斯拉CEO馬斯克。
日前,WELT經濟峰會發布了馬斯克采訪視頻,其中提到了大火的國產大模型DeepSeek。馬斯克首先對中國工程師點贊,并指出中國擁有大量聰明且非常有上進心的工程師,所以應該預料到中國可以做出很多偉大的東西,DeepSeek只是這些偉大造物之中的一個,這其實是中國人才濟濟的結果。
但盡管如此,馬斯克依舊認為Deepseek不能算作AI領域的一次革命性突破,在他看來,xAI(馬斯克旗下AI公司)和其他AI公司很快就會發布比Deepseek更好的模型。
有著類似觀點的科技大佬,不止馬斯克一人。谷歌旗下人工智能實驗室DeepMind首席執行官、2024年諾貝爾化學獎得主德米斯·哈薩比斯(Demis Hassabis)也在近期對DeepSeek作出點評。
哈薩比斯先是強調,Deepseek的AI模型可能是“我見過的來自中國最好的作品”。但隨后他又指出,盡管Deepseek的模型展示了出色的工程能力,但從技術角度來看,這并非一項重大的變革:“Deepseek的模型并未帶來新的科學進展,而是使用了已知的人工智能技術,外界對其的炒作可能‘有點夸大了’。”
哈薩比斯還稱,谷歌上周向公眾發布的Gemini 2.0 Flash模型要比Deepseek的模型更為高效。
事實上,任何一項新的技術突破在推動邊界的同時,也會暴露出新的問題,并因此面臨質疑。兩年前,在ChatGPT橫空出世,并以其驚艷的語言理解能力引發全世界關注的時候,也有類似的觀點出現。2023年初,Meta首席人工智能科學家楊立昆(Yann LeCun)也曾在一次小型媒體和高管在線聚會發表了自己的看法,他認為ChatGPT并沒有什么特別的創新,也不是什么革命性的東西。
但事后回看,ChatGPT的出現無疑為人工智能產業的發展帶來了新的范式革命,自那之后整個產業都在向生成式AI遷移。
而以極低成本出圈的Deepseek,或許也有望創造同樣的神話。
公開資料顯示,Deepseek成立于2023年5月,至今不到兩年,其背后是國內對沖基金巨頭幻方量化。2024年5月,Deepseek發布開源的第二代MoE大模型DeepSeek-V2。該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的百分之一,DeepSeek由此被開始稱作“價格屠夫”“AI界的拼多多”,吸引市場廣泛關注。
2025年1月,Deepseek推出的R1模型,更是在數學、代碼、自然語言推理等任務上與OpenAI-o1-1217基本持平,尤其在AIME 2024(美國數學邀請賽)、MATH-500、SWE-Bench Verified(軟件開發領域測試集)三項測試集上以微弱優勢取勝。
而這一切,是在不到600萬美元的投入下完成的。這種“四兩撥千斤”的模式,顛覆了人們過往對大模型行業“大力出奇跡”式的固有認知,也有望為整個大模型產業的落地提供新的加速器。
(時代財經謝斯臨 綜合自財聯社、界面新聞、新智元、IT之家、經濟觀察報等)
本文鏈接:http://www.tebozhan.com/showinfo-16-129655-0.htmlDeepSeek很強,但還不是革命?馬斯克發聲:很快會發布比Deepseek更好的模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com