近日,DeepSeek宣布啟動“開源周”活動,并陸續釋放了三個重要的代碼庫資源。國產GPU領域的佼佼者摩爾線程迅速響應,成功完成了對FlashMLA和DeepGEMM兩大開源項目的適配工作。7Cj28資訊網——每日最新資訊28at.com
摩爾線程此番適配的GPU產品,基于其自主研發的MUSA Compute Capability 3.1計算架構。這一架構不僅提供了原生的FP8精度計算能力,還對高性能線性代數模板庫MUTLASS進行了全面升級,從而快速支持了FlashMLA的應用。7Cj28資訊網——每日最新資訊28at.com
不僅如此,摩爾線程還充分利用了MUTLASS的優勢,在新一代GPU架構上實現了FP8矩陣乘法的優化。這一成果使得摩爾線程的GPU能夠完美支持DeepGEMM的相關功能,進一步提升了其在大規模模型訓練和推理方面的性能。7Cj28資訊網——每日最新資訊28at.com
FlashMLA是一個專注于加速MLA推理的內核開源項目,特別適用于DeepSeek系列模型,如DeepSeek-V2、V3和R1等。而DeepGEMM則是一個專為密集矩陣與混合專家(MoE)矩陣乘法設計的FP8 GEMM庫,能夠為V3/R1的訓練與推理提供強大的計算支持。7Cj28資訊網——每日最新資訊28at.com
這兩個開源項目均基于高性能通用矩陣乘法(GEMM)的C++模板庫進行開發,具有極高的靈活性和可擴展性。摩爾線程能夠快速適配這些項目,得益于其GPU架構的創新設計和MUTLASS庫的強大支持。7Cj28資訊網——每日最新資訊28at.com
摩爾線程的新一代GPU不僅具備全新的Tensor計算引擎和數據搬運引擎,還提供了原生FP8計算能力。這使得摩爾線程的GPU在處理前沿算法時,能夠保持足夠高的累加精度,無需額外的二次精度修正。7Cj28資訊網——每日最新資訊28at.com
MUTLASS 0.2.0版本的發布,更是為摩爾線程的開源生態注入了新的活力。借助這一版本,摩爾線程推出了MT-FlashMLA開源倉庫,實現了對DeepSeek FlashMLA的快速兼容部署。同時,MUTLASS還提供了一個全新的參考實現,充分借鑒了FlashAttention3的先進算法思想,為摩爾線程GPU設計了高效的計算流水線。7Cj28資訊網——每日最新資訊28at.com
7Cj28資訊網——每日最新資訊28at.com
這一計算流水線的設計,有效隱藏了數據搬運的延遲和Softmax計算的開銷,充分發揮了摩爾線程MUSA Compute Capability 3.1全功能GPU的Tensor計算效率。這無疑為摩爾線程在AI計算領域的競爭力注入了強勁的動力。7Cj28資訊網——每日最新資訊28at.com
對于開發者而言,摩爾線程的開源資源無疑是一筆寶貴的財富。他們可以通過訪問以下鏈接,獲取MT-FlashMLA和MUTLASS的相關資源:7Cj28資訊網——每日最新資訊28at.com
MT-FlashMLA開源地址:https://github.com/MooreThreads/MT-flashMLA7Cj28資訊網——每日最新資訊28at.com
MUTLASS FlashAttention3地址:https://github.com/MooreThreads/mutlass/tree/main/experimental/mp31_flash_attention_fwd7Cj28資訊網——每日最新資訊28at.com
舉報 0收藏 0打賞 0分享 0 更多>同類資訊
中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!02-26

be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場02-26

EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效02-26

海南商業航天發射場二期:可復用火箭測控船項目正式簽約!02-26

天智航2024年業績快報:營收下滑,凈虧損收窄至1.23億元02-26

攀枝花光解水制氫項目落地,綠氫產業迎來商業化新篇章!02-26

邁信林2024年凈利大增近2倍,業績快報亮點搶先看!02-26

《哪吒2》IP衍生品火爆,品牌廠商加速生產沖刺“千戶千吒”市場02-26

天智航2024年財報:手術機器人“第一股”業績初現曙光,凈虧損大幅收窄02-26

RTX 5060 Ti即將發布:功耗升至180W,顯存配置仍為8GB/16GB02-26

smart精靈#1黑金靈限量版來襲!21.99萬僅售500臺,你心動了嗎?02-26

威高血凈IPO過會,年營收達36億,擬募資13.5億,華興資本持股其中02-26

smart精靈#1黑金靈限量版來襲!21.99萬僅500臺,你會搶購嗎?02-26掌閱科技股東量子躍動計劃減持股份 不超過公司總股本1%02-26

小米15 Ultra影像旗艦來襲!2億像素長焦+驍龍8 Elite,性能與影像巔峰對決?02-26點擊查看更多 +
全站最新
奇瑞艾瑞澤8 PRO新車型預售在即,A+級家轎外觀內飾全面升級!

be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場

極氪智能科技離線部署AI大模型,8295座艙平臺車型年內全落地

上汽安吉物流“兩港三地”汽車吞吐量領跑全球,年吞吐363萬輛!

無極SR250GT雙版本煥新來襲,DeepSeek大模型賦能,售價15980元起!

EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效
熱門內容- 《哪吒之魔童降世》票房破110億,全球影史排名第十二!《美國隊長4》上映票房如何?
- 2025春節檔火爆!《哪吒之魔童鬧海》領跑,總票房直逼55億大關
- 浙大智能體“浙大先生”上線,全國829所高校師生可免費共享DeepSeek
- 《唐探1900》春節檔上映,豆瓣評分6.7,口碑兩極分化?
- 金價飆升!847元/克金飾創新高,黃金牛市還能走多遠?
- 浙大DeepSeek全國高校開放!829所學子免費用,告別系統繁忙
- 《哪吒2》票房高歌猛進,全球動畫電影榜沖進前三!
- 《哪吒之魔童鬧海》票房破20億,領跑春節檔,第三部還會遠嗎?
- 《哪吒之魔童鬧海》春節檔大捷,單日票房破17億刷新動畫電影紀錄!
- 《蛟龍行動》遇一星差評潮,于冬怒批豆瓣粉圈互黑,誓言影片絕不撤檔!
- 美攝科技勝訴!字節跳動8款產品被判代碼抄襲賠償8266萬
- 《熊出沒》動畫電影系列十一部齊發力,總票房突破80億大關!
- 2025年春節檔電影盛宴:六部大片齊賀歲,哪部將成票房黑馬?
- 導演票房榜大洗牌:餃子躋身前三,張藝謀緊隨其后
- 短劇熱度榜揭曉!《行道者之劍二十四》登頂,大盤熱度破6000萬
本欄最新
中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!

be quiet! Pure Base 501機箱新增LX、DX版,ARGB燈效亮眼登場

EK發布RTX 5090 FE定制水冷頭,329.9歐,高性能散熱還帶RGB燈效

海南商業航天發射場二期:可復用火箭測控船項目正式簽約!

天智航2024年業績快報:營收下滑,凈虧損收窄至1.23億元

攀枝花光解水制氫項目落地,綠氫產業迎來商業化新篇章!
本文鏈接:http://www.tebozhan.com/showinfo-16-134118-0.html摩爾線程GPU實力展現:快速適配DeepSeek開源庫,原生FP8計算能力引關注!
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 涂鴉智能Q4財報亮點:營收增27%,利息收入助盈利,派息達3700萬美元
下一篇: 中科曙光FlashNexus刷新SPC-1基準測試紀錄,登頂全球存儲性能巔峰!