AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

來源: 責編: 時間:2025-03-02 09:07:16 42觀看
導讀 2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。據介紹,DeepEP 是一個用于 MoE(混合專家)模

2 月 27 日消息,在 DeepSeek 開源周第四日,摩爾線程宣布已成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe,并發布相關開源代碼倉庫:MT-DeepEP 和 MT-DualPipe。mVU28資訊網——每日最新資訊28at.com

mVU28資訊網——每日最新資訊28at.com

據介紹,DeepEP 是一個用于 MoE(混合專家)模型訓練和推理的開源 EP(expert parallelism,專家并行)通信庫,主要適用于大模型訓練,特別是需要 EP 的集群訓練。它通過優化通信信道的使用率,提升了訓練效率。摩爾線程基于 MUSA Compute Capability 3.1 全功能 GPU 適配了 DeepEP,并支持以下特性:mVU28資訊網——每日最新資訊28at.com

高效優化的 All-to-All 通信,支持 dispatch & combinemVU28資訊網——每日最新資訊28at.com

支持 MTLink + GPU(MUSA Compute Capability 3.1)節點內通信mVU28資訊網——每日最新資訊28at.com

訓練及推理預填充階段的高吞吐量計算核心mVU28資訊網——每日最新資訊28at.com

推理解碼階段的低延遲計算核心mVU28資訊網——每日最新資訊28at.com

原生支持 FP8 數據分發mVU28資訊網——每日最新資訊28at.com

靈活控制 GPU 資源,實現計算與通信的高效重疊mVU28資訊網——每日最新資訊28at.com

DualPipe 是 DeepSeek-V3 提出的雙向流水線并行算法,通過前向計算與后向計算階段的計算與通信完全重疊,減少了“流水線氣泡”(設備空閑等待)。摩爾線程依托深度學習框架 Torch-MUSA(已開源)和 MUSA 軟件棧全方位的兼容性,實現了對 DualPipe 這一算法的支持。mVU28資訊網——每日最新資訊28at.com

目前,MT-DualPipe 可以完整接入摩爾線程 MT-Megatron 框架和 MT-TransformerEngine 框架(即將開源),實現 DeepSeek V3 訓練流程完整復現。此外,MT-DualPipe 結合 MT-Megatron 可實現完整 DeepSeek V3 模型 MLP-FFN 分離以及 DW-DG 分離,進一步降低氣泡占比,優化通信效率。同時,MT-DualPipe 與 MT-TranformerEngine 和 MT-DeepEP 的結合,可利用 MT-DeepEP 和異步通信引擎實現更高效的通信掩蓋,降低對計算資源損耗。mVU28資訊網——每日最新資訊28at.com

附 Torch-MUSA 開源地址如下:mVU28資訊網——每日最新資訊28at.com

https://github.com/MooreThreads/Torch_MUSAmVU28資訊網——每日最新資訊28at.com

相關閱讀:mVU28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 4/5:DualPipe、EPLB 優化并行策略》mVU28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 3/5:深度學習利器 DeepGEMM》mVU28資訊網——每日最新資訊28at.com

《DeepSeek 開源進度 2/5:首個用于 MoE 模型訓練和推理的 EP 通信庫 DeepEP》mVU28資訊網——每日最新資訊28at.com

《DeepSeek 代碼庫開源進度 1/5:為 Hopper GPU 優化的高效 MLA 解碼內核 FlashMLA》mVU28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-11260-0.html摩爾線程成功支持 DeepSeek 開源通信庫 DeepEP 和并行算法 DualPipe

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 騰訊混元新一代快思考模型 Turbo S 發布,支持“秒回”

下一篇: 地道表達 + 文化解讀:谷歌翻譯醞釀“追問”功能,打造你的專屬 AI 外教

標簽:
  • 熱門焦點
  • “平均時代”:ChatGPT模仿秀的隱喻

    來源:錦緞如果你問ChatGPT,Instagram上最美的女人是誰?它很可能會給你一個名字,叫卡戴珊。如果你觀察過Instagram這個美版小紅書:平臺上的所有網紅,展現的幾乎是統一面孔:統一的醫
  • 搶先推出“元宇宙”飲料,可口可樂贏麻了

    試圖傍上元宇宙的品牌千千萬,但像可口可樂玩得這么花的,屬實不多。01 可口可樂盯上元宇宙1886年,可口可樂誕生于美國喬治亞州亞特蘭大市,至今已擁有136年的悠久歷
  • 元宇宙帶來沉浸式智能登錄?你學會了嗎?

    備受資本市場寵愛的元宇宙概念,正掀起一番番波瀾。元宇宙作為虛實相融的互聯網應用和社會形態,與沉浸式體驗緊密相關。 多重路徑,打造無感知沉浸式智能登錄《設計
  • 元宇宙社交啫喱、希壤爆款迭出,騰訊慌了嗎?

    文 | 陳橋輝沒想到騰訊超級QQ秀的20周年歸來首秀,被一款名不見經傳的產品搶了風頭。1月15日,一款名為“啫喱”的社交App迅速在各個互聯網的社交圈內火爆起來,引起
  • 2021年中國元宇宙行業用戶行為分析熱點報告

    元宇宙網絡熱度高漲,中國網民對虛擬生態興趣濃厚。艾媒咨詢數據顯示,超六成的網民對“元宇宙”了解程度較高,在元宇宙較基礎的游戲領域,超九成的人對VR游戲更感興
  • Meta 呼吁行業合作建立元宇宙網絡基礎設施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基礎設施,以支持其蓬勃發展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一,這在很大程度上是由 Facebo
  • 頭像類NFTs的統治能持續多久?

    在過去的一兩年里,NFTs在互聯網世界中掀起了一場風暴。今天,當我們想到NFTs時,我們主要想到的是那些充斥著我們的社交媒體屏幕的數字卡通--無聊猿、punks 和介于
  • Staking 收益翻倍?

    以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計,在 1 月份以太坊網絡合并后,持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
  • 我們為什么需要Web3,距離Web3的實現還有多遠?

    當今技術正在經歷著重要的變革,許多公司正在改變他們的經營模式以求變得更加的靈活,其中有很大一部分公司采用了不同的方式來發展自己的業務。其中之一就是Web3,
Top