當前位置：首頁 > 科技 > 軟件

開源高性能文件系統(tǒng) 3FS，DeepSeek 為何自研存儲？

來源：責編：時間：2025-03-03 11:54:53 43觀看

導讀這兩天 DeepSeek 開源 3FS 并行文件系統(tǒng)的消息，猶如向 AI 基礎設施領域投下一枚深水炸彈。3FS 每秒能搬運 6.6TB 數(shù)據(jù)，相當于 1 秒鐘傳輸完 700 部 4K 高清電影。還能自動調資源，國產(chǎn)芯片用了它，跟國際大牌的差距

這兩天 DeepSeek 開源 3FS 并行文件系統(tǒng)的消息，猶如向 AI 基礎設施領域投下一枚深水炸彈。3FS 每秒能搬運 6.6TB 數(shù)據(jù)，相當于 1 秒鐘傳輸完 700 部 4K 高清電影。還能自動調資源，國產(chǎn)芯片用了它，跟國際大牌的差距直接縮到 15%。

這并非簡單的技術迭代 —— 當 Llama3 70B 模型單次訓練需吞掉 15PB 數(shù)據(jù)（相當于連續(xù)播放 250 萬小時 4K 視頻）時，全球 AI 實驗室突然意識到：決定大模型訓練效率的不僅是 GPU 算力，存儲系統(tǒng)正成為影響進度的一大瓶頸。

當 AI 算力狂飆時，存儲正在成為隱形戰(zhàn)場

2024 年，某頭部 AI 公司曾因存儲帶寬不足，導致 2000 張 A100 顯卡的算力利用率長期低于 40%，單日經(jīng)濟損失超百萬美元。這暴露了 AI 時代的 "木桶效應"—— 當 GPU 計算速度進入微秒級時，一次突發(fā)的存儲抖動就可能導致整個訓練任務崩潰，讓數(shù)周的計算成果瞬間蒸發(fā)。這或許也是 DeepSeek 自研存儲的原因。

數(shù)據(jù)顯示，存儲優(yōu)化可直接將 175B 參數(shù)模型的訓練周期壓縮 30%，對應百萬美元級的成本被填平。而在推理端，當 10% 的異常請求遭遇存儲延遲波動時，P99 響應時間會瞬間突破 SLA 紅線，這正是某自動駕駛公司在線服務突發(fā)降級的根本誘因。

DeepSeek 之所以選擇自研 3FS 的本質，正是發(fā)現(xiàn)了存儲架構在 AI 應用中的重要性。《金融行業(yè)先進 AI 存力報告》》報告中提到，在同樣的 GPU 算力規(guī)模下，存儲性能的高低可能造成模型訓練周期 3 倍的差異。在算力軍備競賽的背后，一場關于存儲性能密度的暗戰(zhàn)悄然升級，自研存儲顯得尤為重要。

5 家頭部廠商角逐 AI 存儲，國產(chǎn)能否拔得頭籌

相比于傳統(tǒng) AI 的需求，大模型對存力需求場景具有數(shù)據(jù)量大、參數(shù)規(guī)模大、訓練周期長等特點。

為了提升大模型訓練速度，需要對大規(guī)模數(shù)據(jù)集進行快速加載，且一般采用數(shù)百甚至上萬張 GPU 構成計算集群進行高效的并行計算，需要高并發(fā)輸入 / 輸出（I/O）處理，而訓練數(shù)據(jù)集呈現(xiàn)海量小文件的特點，文件量在幾億到幾十億量級，對應的帶寬需求可能每秒要達到上 TB，這就要求存儲系統(tǒng)具備強大的數(shù)據(jù)管理能力，業(yè)界能達到該能力的僅寥寥幾家。

小編搜集了國內外優(yōu)秀的并行存儲產(chǎn)品，對具體能力進行對比

IBM 作為老牌存儲品牌，其產(chǎn)品從 HPC 場景成功向 AI 場景演進。在全球 AI 場景得到廣泛應用的 DDN，多個讀、寫帶寬等關鍵性能指標上表現(xiàn)突出，但 DDN 由于技術封閉性、專有化硬件等原因，導致用戶建設成本過高。

國產(chǎn)廠商 DeepSeek 3FS 雖然是開源的新產(chǎn)品，但相對老牌存儲也有不錯的表現(xiàn)，在讀帶寬能力上表現(xiàn)優(yōu)異，單集群 6.6TB/s，平均單節(jié)點 36.7GB/s 的讀帶寬。

我們還驚喜發(fā)現(xiàn)，另一家國產(chǎn)廠商京東云云海，在這個專業(yè)領域同樣表現(xiàn)出色，以單節(jié)點 95GB/s 的讀帶寬、60GB/s 的寫帶寬，進一步拉低了國產(chǎn)存儲與國際老牌廠商的差距。相較于 DeepSeek 的 3FS，京東云云海在提供高性能的同時適用性更廣，可以同時滿足 DeepSeek、ChatGPT、LLaMA 等 20 余種主流大模型的存力需求。

綜上來看，隨著大模型快速向縱深場景演進，對存儲的要求也越來越高，以 DeepSeek、京東云云海等國產(chǎn)存儲，顯示出在處理大規(guī)模數(shù)據(jù)集時的優(yōu)越性能，未來國產(chǎn)存儲能否拔得頭籌，讓我們拭目以待。

本文鏈接：http://www.tebozhan.com/showinfo-26-135149-0.html開源高性能文件系統(tǒng) 3FS，DeepSeek 為何自研存儲？

聲明：本網(wǎng)頁內容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：抖音李亮：沒有所謂“抖音會議”，這是仿冒詐騙

下一篇：中興通訊 2024 年報發(fā)布：轉型成效顯著，AI 布局向實發(fā)展

標簽：

熱門焦點

Mate60手機殼曝光致敬自己的經(jīng)典設計

8月3日消息，今天下午博主數(shù)碼閑聊站帶來了華為Mate60的第三方手機殼圖，可以讓我們在真機發(fā)布之前看看這款華為全新旗艦的大致輪廓。從曝光的圖片看，Mate 60背后攝像頭面積依然
Raft算法：保障分布式系統(tǒng)共識的穩(wěn)健之道

1. 什么是Raft算法？Raft 是英文”Reliable、Replicated、Redundant、And Fault-Tolerant”（“可靠、可復制、可冗余、可容錯”）的首字母縮寫。Raft算法是一種用于在分布式系統(tǒng)
三言兩語說透設計模式的藝術-簡單工廠模式

一、寫在前面工廠模式是最常見的一種創(chuàng)建型設計模式，通常說的工廠模式指的是工廠方法模式，是使用頻率最高的工廠模式。簡單工廠模式又稱為靜態(tài)工廠方法模式，不屬于GoF 23種設計
Java NIO內存映射文件：提高文件讀寫效率的優(yōu)秀實踐！

Java的NIO庫提供了內存映射文件的支持，它可以將文件映射到內存中，從而可以更快地讀取和寫入文件數(shù)據(jù)。本文將對Java內存映射文件進行詳細的介紹和演示。內存映射文件概述內存
年輕人的“職場羞恥感”，無處不在

作者：馮曉亭陶淘李欣張琳馬舒葉來源：燃次元“人在職場，應該選擇什么樣的著裝？”近日，在網(wǎng)絡上，一個與著裝相關的帖子引發(fā)關注，在該帖子里，一位在高級寫字樓亞洲金
機構稱Q2國內智能手機銷量同比下滑4% vivo份額重回第1

7月29日消息，根據(jù)市場調查機構Counterpoint Research公布的最新報告，2023年第2季度中國智能手機銷量同比下降4%，創(chuàng)新自2014年以來第2季度銷量新低。報
華為HarmonyOS 4.0將于8月4日發(fā)布或搭載AI大模型技術

華為宣布HarmonyOS4.0將于8月4日正式發(fā)布。此前，華為已經(jīng)針對開發(fā)者公布了HarmonyOS4.0，以便于開發(fā)者提前進行適配，也因此被曝光出了一些新系統(tǒng)的特性
三星Galaxy Z Fold5今日亮相：厚度縮減但仍略顯厚重

據(jù)官方此前宣布，三星將于7月26日也就是今天在韓國首爾舉辦Unpacked活動，屆時將帶來帶來包括Galaxy Buds 3、Galaxy Watch 6、Galaxy Tab S9、Galaxy
iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

去年10月，iQOO推出了iQOO Neo7系列機型，不僅搭載了天璣9000+，而且是同價位唯一一款天璣9000+直屏旗艦，一經(jīng)上市便受到了用戶的廣泛關注。在時隔半年后，

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

開源高性能文件系統(tǒng) 3FS，DeepSeek 為何自研存儲？

Mate60手機殼曝光致敬自己的經(jīng)典設計

Raft算法：保障分布式系統(tǒng)共識的穩(wěn)健之道

三言兩語說透設計模式的藝術-簡單工廠模式

Java NIO內存映射文件：提高文件讀寫效率的優(yōu)秀實踐！

年輕人的“職場羞恥感”，無處不在

機構稱Q2國內智能手機銷量同比下滑4% vivo份額重回第1

華為HarmonyOS 4.0將于8月4日發(fā)布或搭載AI大模型技術

三星Galaxy Z Fold5今日亮相：厚度縮減但仍略顯厚重

iQOO Neo8 Pro真機諜照曝光：天璣9200+和V1+旗艦雙芯加持

最新推薦

猜你喜歡

熱門推薦

相關資訊