在人工智能領域,一款名為DeepSeek的大模型突然爆火,引發了全球范圍內的廣泛關注。然而,在這場大模型戰役的前線,有一個人卻在DeepSeek-V3發布前心存疑慮,他就是硅基流動公司的創始人袁進輝。
袁進輝在社交媒體上分享了一個故事:DeepSeek爆火的前一個月,梁文鋒曾向他建議,硅基流動應該部署DeepSeek-V3,并準備至少20臺H800服務器,最好是80臺。袁進輝迅速進行了成本估算,發現僅一個月的算力成本就可能高達五六百萬,而且服務器還不一定能完全利用。“風險太大了,所以我們沒有下注。”他回憶道。
然而,DeepSeek迅速走紅,巨大的流量導致其官網和App崩潰,用戶急于找到能正常使用的渠道。袁進輝對此深感懊悔:“現在DeepSeek這么火,我們卻因為決策失誤而錯失良機。”
但懊悔很快轉化為了行動。面對算力不足的問題,硅基流動找到了華為,全力推進DeepSeek-R1 & V3在昇騰芯片上的適配工作。春節期間,硅基流動團隊沒有休息一天,最終成功承接住了第一波流量。
2月1日,硅基流動首發了基于華為昇騰算力的滿血版DeepSeek-R1 & V3,迅速吸引了大量開發者和個人用戶。這一合作不僅消除了市場對國產芯片性能瓶頸的疑慮,還無意間引發了一場國產替代的狂歡。
硅基流動借此機會證明了自己的AI Infra實力。袁進輝表示:“尤其這次上線DeepSeek R1 & V3之后,合作線索如潮水般涌來,我們暫時都看不過來。”
事實上,在硅基流動爆火之前,公司已經在2024年底完成了億元人民幣的Pre-A輪融資,由華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投。值得注意的是,本輪融資之前,硅基流動已經引入了美團作為戰略股東。
硅基流動的發展歷程令人矚目。自2023年8月成立并發布MaaS平臺SiliconCloud以來,公司經歷了十倍以上的市場增長。SiliconCloud就像一個“大模型API超市”,開發者只需注冊賬號,選擇所需的模型,即可開發應用,無需購買服務器。經過硅基流動的適配和優化,模型甚至能比原廠模型響應更快、推理成本更低。
目前,SiliconCloud已經擁有超過三百萬用戶,日均調用量超過千億Token。在開發者圈子中,硅基流動因提供親民價格和優異性能的模型服務而被譽為“賽博菩薩”。平臺上已經上線了包括滿血版DeepSeek-R1 & V3在內的上百款主流模型,還提供從模型訓練、微調、托管到部署的全套工具。
硅基流動還在2024年7月推出了一款基于ComfyUI的云節點插件BizyAir。這是一款圖像生成工具,讓AI開發者與創作者無需考慮顯卡和環境限制,即可直接使用云計算資源完成生圖任務。目前,BizyAir已經支持數十種模型,并獲得了近萬名用戶。
在商業化方面,硅基流動也取得了顯著進展。公司與華為、亞馬遜云科技、英偉達等頂級云廠商、芯片廠商、大模型公司及應用公司建立了合作伙伴關系。在大語言模型、文生圖、視頻生成等多個場景,硅基流動已經有了標桿客戶案例的落地。
袁進輝在接受采訪時表示,自GPT-4o和DeepSeek等模型出現后,大模型在語言能力和知識能力方面的限制已經得到了較好的解決,但在邏輯推理能力方面仍有待提升。然而,隨著OpenAI o1和DeepSeek R1的發布,大模型在邏輯能力上取得了重大突破。
“可以預期,國內外基于DeepSeek等開源模型的應用將迎來爆發式增長。”袁進輝充滿信心地說。
對于硅基流動的未來,袁進輝表示將繼續致力于提供高性能、低成本的AI服務,推動人工智能技術的普及和應用。
本文鏈接:http://www.tebozhan.com/showinfo-45-10930-0.htmlDeepSeek火爆,硅基流動億元融資加速國產芯片適配征程
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com