DeepSeek在知乎平臺上發(fā)布了關于其V3/R1推理系統(tǒng)的概覽,揭示了該系統(tǒng)理論上可達545%的成本利潤率。該系統(tǒng)通過大規(guī)模跨節(jié)點專家并行技術,旨在提升吞吐量和降低延遲。
DeepSeek的V3和R1模型采用了混合專家模型(MoE)架構,將復雜任務分解為多個子任務,由不同子模型處理,從而在有限資源下實現(xiàn)高效運算。然而,這一技術也帶來了更大的批次處理需求和負載均衡挑戰(zhàn)。
據DeepSeek透露,其V3和R1模型平均占用226.75個節(jié)點,每個節(jié)點配置8個H800 GPU。
在假設GPU租賃成本為每小時2美元的情況下,每日運營成本高達8.7萬美元。但按照R1當前的定價策略,DeepSeek的每日潛在營收可達56.2萬美元,理論成本利潤率驚人。
然而,DeepSeek強調,這一理論數(shù)據僅供參考,實際情況可能有所不同。V3模型的定價較低,且收費服務僅占其業(yè)務的一部分。
此外,在非高峰時段,DeepSeek還提供使用折扣,進一步影響實際營收。同時,研發(fā)和訓練成本也是不可忽視的因素,這些因素都可能對DeepSeek的實際盈利產生影響。
本文鏈接:http://www.tebozhan.com/showinfo-27-135677-0.htmlDeepSeek公布成本利潤率高達545%,但實際情況或有出入
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com