當(dāng)前位置：首頁 > 元宇宙 > AI

DeepSeek 開源進(jìn)度 2 5：首個(gè)用于 MoE 模型訓(xùn)練和推理的 EP 通信庫 DeepEP

來源：責(zé)編：時(shí)間：2025-02-26 12:23:46 105觀看

導(dǎo)讀 2 月 25 日消息，DeepSeek 的“開源周”活動(dòng)今日已經(jīng)來到第二天，今天發(fā)布的是首個(gè)開源的用于 MoE 模型訓(xùn)練和推理的 EP 通信庫 ——DeepEP。附開源地址：https://github.com/deepseek-ai/DeepEP官方表示其具備如下

2 月 25 日消息，DeepSeek 的“開源周”活動(dòng)今日已經(jīng)來到第二天，今天發(fā)布的是首個(gè)開源的用于 MoE 模型訓(xùn)練和推理的 EP 通信庫 ——DeepEP。

附開源地址：https://github.com/deepseek-ai/DeepEP

官方表示其具備如下特征：

高效優(yōu)化的全到全通信方式

支持節(jié)點(diǎn)內(nèi)外通信，兼容 NVLink 和 RDMA 技術(shù)

提供高吞吐量的內(nèi)核，提升訓(xùn)練和推理前期填充效率

提供低延遲內(nèi)核，優(yōu)化推理解碼速度

完全支持 FP8 數(shù)據(jù)格式調(diào)度

提供靈活的 GPU 資源管理，支持計(jì)算與通信的重疊執(zhí)行

詳細(xì)介紹的大意如下：

DeepEP 是一款專為混合專家（MoE）和專家并行（EP）設(shè)計(jì)的通信庫，提供了高吞吐量和低延遲的 all-to-all GPU 內(nèi)核，常用于 MoE 派發(fā)和合并操作。該庫還支持低精度計(jì)算，包括 FP8。

為了與 DeepSeek-V3 論文中提出的組限制門控算法兼容，DeepEP 提供了一些針對不對稱帶寬轉(zhuǎn)發(fā)優(yōu)化的內(nèi)核，比如將數(shù)據(jù)從 NVLink 域轉(zhuǎn)發(fā)到 RDMA 域。這些優(yōu)化的內(nèi)核能夠提供高吞吐量，適合用于訓(xùn)練和推理的預(yù)填充任務(wù)，同時(shí)支持 SM（流式多處理器）數(shù)量控制。

對于延遲敏感型的推理解碼任務(wù)，DeepEP 提供了一套低延遲內(nèi)核，采用純 RDMA 技術(shù)以最大程度減少延遲。此外，該庫還采用了一種基于 Hook 的通信與計(jì)算重疊方法，不會占用任何 SM 資源。

需求：

Hopper GPUs (may support more architectures or devices later)

Python 3.8 及以上版本

CUDA 12.3 及以上版本

PyTorch 2.1 及以上版本

使用 NVLink 進(jìn)行節(jié)點(diǎn)間通信

基于 RDMA 網(wǎng)絡(luò)的節(jié)點(diǎn)間通信

本文鏈接：http://www.tebozhan.com/showinfo-45-11125-0.htmlDeepSeek 開源進(jìn)度 2 5：首個(gè)用于 MoE 模型訓(xùn)練和推理的 EP 通信庫 DeepEP

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：上海明星 AI 公司“瀾碼科技”曝“員工停薪社保停繳”，創(chuàng)始人周健回應(yīng)稱“借錢賣房補(bǔ)償，正尋求被并購的可能性”

下一篇：阿里 Qwen Chat 平臺上線“深度思考”功能：基于 QwQ-Max-Preview 推理模型，支持聯(lián)網(wǎng)搜索

標(biāo)簽：

熱門焦點(diǎn)

AI界地震！美國對OpenAI展開調(diào)查！監(jiān)管風(fēng)暴來襲！

來源：清元宇宙還記得5月OpenAI在國會山聽證會上的自信、坦誠、游刃有余的問答嗎？那時(shí)的Sam Altman可謂意氣風(fēng)發(fā)，在耐心、友好的國會議員面前，就AI立法、大模型安全性問題侃侃而
元宇宙的文旅賽道，還能如何發(fā)力？

來源：X增強(qiáng)現(xiàn)實(shí)蘋果推出Vision Pro，為XR行業(yè)注入一劑強(qiáng)心針。而在蘋果開發(fā)者大會上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達(dá)成合作，其Disney+流媒體服務(wù)將于Vision Pro
冰墩墩NFT遇冷，價(jià)格跌80%，日成交僅3筆。

“兩日上漲千倍”并不存在，且冰墩墩NFT的市場熱度遠(yuǎn)不及社交媒體所稱的那樣高。2月11日，獲得國際奧委會授權(quán)的2022冬奧會吉祥物冰墩墩相關(guān)NFT產(chǎn)品在nWayPlay上線
從虛擬餐廳到虛擬時(shí)裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

自從 Facebook 更名為 Meta 后，關(guān)于元宇宙的討論愈發(fā)激烈，這一詞匯也越來越多的出現(xiàn)在我們的視野里。這是一個(gè)非常有趣的話題。伴隨著爭論，有些人認(rèn)為是馬克·扎
全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

作者：袁佳琦沈黎暉不怎么打游戲，但許多事兒在他眼里都“有意思”。好玩，有意思，是他的口頭禪，在接受娛樂獨(dú)角獸的采訪過程中，他多次提到，做虛擬音樂人，“是件挺好玩的
紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

2 月 22 日，紐約證券交易所 (NYSE) 的母公司洲際交易所 (ICE) 宣布，它將持有私人數(shù)字證券市場 tZERO 的所有權(quán)。根據(jù)公告，ICE 將成為 tZero 的“重要”少數(shù)股東，但
以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

作者：三黎過去的一年里，除了 BTC 一如既往穩(wěn)坐王位，DEFI 則是貫穿一整年的狂歡熱點(diǎn)。 DeFi 在讓 ETH 實(shí)現(xiàn)價(jià)值增長的同時(shí)，也使得其網(wǎng)絡(luò)日漸擁堵、交易費(fèi)用增高，成為
Web 3如何改變傳統(tǒng)HR

互聯(lián)網(wǎng)自誕生以來，經(jīng)歷了三次迭代。Web1是第一階段，包括ISP服務(wù)器上的個(gè)人網(wǎng)頁或免費(fèi)的虛擬主機(jī)服務(wù)。然后Web2出現(xiàn)了，它引入了動(dòng)態(tài)的用戶生成內(nèi)容、互操作性、增
知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個(gè)DAO

根據(jù)市場追蹤網(wǎng)站 DappRadar 的數(shù)據(jù)，隨著 NFT 的“出圈”與加密貨幣的普及，NFT 市場在 2021 年的銷售額達(dá)到約 250 億美元，而 2020 年僅為 9490 萬美元，同比增超 2

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

DeepSeek 開源進(jìn)度 2 5：首個(gè)用于 MoE 模型訓(xùn)練和推理的 EP 通信庫 DeepEP

AI界地震！美國對OpenAI展開調(diào)查！監(jiān)管風(fēng)暴來襲！

元宇宙的文旅賽道，還能如何發(fā)力？

冰墩墩NFT遇冷，價(jià)格跌80%，日成交僅3筆。

從虛擬餐廳到虛擬時(shí)裝秀，行業(yè)巨頭掀起元宇宙商標(biāo)注冊潮

全面擁抱“虛擬世界”，摩登天空要打造“音樂元宇宙”

紐約證券交易所母公司ICE收購tZero股份以探索代幣化股票

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

Web 3如何改變傳統(tǒng)HR

知名藝術(shù)家打造去中心化“好萊塢”：一部電影一個(gè)DAO

最新推薦

錯(cuò)過了BRC20還有eths,eth銘文協(xié)議

元宇宙這一年：技術(shù)加速落地，助傳統(tǒng)行業(yè)走向新階段

元宇宙風(fēng)口下，視覺中國如何重估？

英特爾首款加密芯片將于今年上市｜國際動(dòng)態(tài)

韓國建立元宇宙生態(tài)系統(tǒng)，智度股份發(fā)布元宇宙社區(qū)Meta彼岸

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

猜你喜歡

熱門推薦

相關(guān)資訊