當前位置：首頁 > 科技 > 數碼

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

來源：責編：時間：2025-06-13 11:28:57 46觀看

導讀快科技6月13日圣何塞現場報道——2023年發布的Instinct MI300X，可以說是AMD成功的AI GPU加速卡，甚至稱得上AMD歷史上成功的產品之一，用快的速度拿到了1億美元收入。更重大的意義在于，它在幾乎被NVIDI

快科技6月13日圣何塞現場報道——

2023年發布的Instinct MI300X，可以說是AMD成功的AI GPU加速卡，甚至稱得上AMD歷史上成功的產品之一，用快的速度拿到了1億美元收入。

更重大的意義在于，它在幾乎被NVIDIA完全壟斷的高端AI芯片市場上，撕開了一道口子，為行業提供了更多選擇。

2024年，AMD再接再厲發布了升級版的Instinct MI325X，主要提升了HBM3E內存，核心規格沒變。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

北京時間6月13日，AMD在美國圣何塞舉辦新一屆Advancing AI 2025大會。

會上，AMD正式發布了全新一代“Instinct MI350系列”，包括MI350X、MI355X兩款型號。

無論性能還是技術特性，新卡都再次取得了長足的進步，完全可以和NVIDIA Blackwell系列掰一掰手腕。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350系列核心的變化，就是升級了新一代CDNA 4架構(可能也是后一代CDNA)，同時采用了新的N3P工藝。

從大的方向上講，這一代的提升主要有四個方面，首要的自然是更好的AI能力，針對生成式AI和LLM大語言模型增強了數學矩陣模型。

另外，支持新的混合精度數據格式、增強Infinity Fabric互連總線和高級封裝互連、改進能效，也都是重中之重。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350系列繼續采用延續多代的chiplets芯粒設計，仍然分為頂層的XCD(加速器計算模塊)、底部的IOD(輸入輸出模塊)和周圍的HBM3E內存模塊。

其中，XCD工藝從5nm升級為N3P 3nm級工藝高性能版本，IOD則維持在6nm工藝。

它采用了非常復雜的多重先進封裝技術，不同模塊之間使用了2.5D、3D混合鍵合，整體則用了臺積電的CoWoS-S晶圓級封裝，使用硅中介層作為主要的連接媒介——NVIDIA也在大面積使用它，不過已經開始向更高級的CoWoS-L過渡。

上代MI300X就使用了1530億個晶體管，創下新高，MI350系列進一步增加到1850億個晶體管。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

這是MI350系列的內部架構和布局圖。

XCD模塊一共有8個，每個內部分為4組著色器引擎，下轄36組CU計算單元，還有4MB二級緩存，配有一個全局資源調度分配單元。

整體合計288個CU單元、32MB二級緩存，但是MI350系列每個XCD中屏蔽了4組CU單元，實際開啟了256組(1024個矩陣核心)，反而少于MI300X/MI325X 304組(另屏蔽16組)，而每個單元的二級緩存容量沒變。

IOD模塊一共2個，集成128個通道HBM3E內存控制器、256MB Infinity Cache無限緩存，容量和上代相同，還支持第四代Infinity Fabric互連總線，雙向帶寬提升至1075GB/s。

HBM3E內存仍然是8顆，每一顆都是12Hi堆疊，和MI325X相同而高于MI300X 8Hi，只是這次開放了全部容量，單顆是完整的36GB而非32GB，因此總計多達288GB。

內存傳輸率8Gbps，總帶寬高達8TB/s，顯著高于MI300X 5.3TB/s、MI325X 6TB/s，尤其是平均到每個CU單元的內存帶寬提升了多達50％。

每一個IOD上堆疊四個XCD、四顆HBM3E，而兩個IOD之間使用5.5TB/s高帶寬的Infinity Fabric AP進行互連整合封裝。

整個MI350系列芯片與AMD EPYC處理器之間的通道，走的是完整的PCIe 5.0 x16，帶寬128GB/s。

功耗方面，風冷模組高1000W，水冷模組則可以做到1400W。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

在裸金屬、SR-IOV虛擬化應用中，為了實現大化利用，MI350系列支持對計算資源進行空域分區，多可以分成8個。

不同分區可以支持多種使用模式，但不同于前代的NSP1、NSP4，這次改為NSP1(單個分區)、NSP2(雙/四/八個分區)，看似降級了，AMD解釋說NSP4模式的性能提升其實比較有限。

MI350系列在單分區＋NSP1模式下，高可以支持5200億參數的AI模型，而在八分區＋NSP2模式下，可以支持多8個700億參數Llama 3.1模型的并發。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350系列針對生成式AI、LLM的具體改進，包括矩陣核心的提升和更靈活的量化機制，過于專業就不一一解釋了。

注意這次支持行業標準的PF6、FP4格式，支持從FP16/BF16到FP32的基于硬件的Stochastic Rounding量化。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350系列支持豐富的數據格式，包括FP64、FP32、FP16、BF16、FP8、MXFP8、MXFP6、MXFP4、INT8、INT4。

通過提升每個CU單元每時鐘周期的性能，FP16、BF16、FP8、FP6、FP4的單位性能都得到了顯著提升。

正因此如，MI355X在核心數更少的情況下，性能基本追上甚至超過了MI300X，其中矢量FP64、FP32、FP16和矩陣FP32下都基本一致，矩陣FP64下約為一半(單位性能也是一半)，矩陣FP16/BF16、FP8、INT8/INT4下的稀疏性性能則幾乎翻了一倍，還新增支持了矩陣FP6/FP4稀疏性。

可以看到，MIX350系列的性能并非全方位飛躍，有些數據格式下甚至更弱了，因為這代更注重支持更多更靈活的數據格式、單位性能的提升(類似提升IPC)，以及對于AI訓推更關鍵的矩陣稀疏性能。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

Instinct MI350系列有兩款型號MI350X、MI355X，都配備完整的288GB HBM3E內存，帶寬均為8TB/s。

區別在于，MI355X是滿血性能，峰值可達FP64 79TFlops(79萬億次每秒)、FP16 5PFlops(5千萬億次每秒)、FP8 10PFlops(1億億次每秒)、FP6/FP4 20PFlops(2億億次每秒)，整卡功耗高達1400W。

MI350X的性能削減了8％，FP4峰值可達18.4PFlops，整卡功耗高1000W，和MI325X持平。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

當然更關鍵的是實際性能，官方宣稱MI355X對比MI300X在不同AI大模型中的推理性能普遍提升了3倍甚至更多。

在AI助手/對話、內容創作、內容摘要、對話式AI等應用中，性能同樣全面提升，高幅度甚至超過4倍。

大模型預訓練與微調中，提升幅度也不容小覷，高達3.5倍。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350X對比NVIDIA B200/GB200，內存容量多出60％(后者192GB)，內存帶寬持平。

FP64/FP32性能領先約1倍，FP6性能領先多約1.2倍，FP16、FP8、FP4領先多約10％。

除了理論性能，大模型推理性能也處在同一水平，或者領先多約30％，訓練性能BF16/FP8預訓練基本同一檔次，FP8微調則有10％以上的領先。

更關鍵的是高性價比，單位價格可以多生成多40％的Tokens。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

MI350系列依然支持多GPU平臺化部署，單個節點還是多八卡，總計就有2304GB HBM3E內存，FP16/BF16性能高40.2PFlops(4.02億億次每秒)，FP8性能高80.5PFlops(8.05億億次每秒)、FP6/FP4 161PFlops(16.1億億次每秒)。

八卡并行時，每兩者之間都是153.6GB/s雙向帶寬的Infinity Fabric通道互連，而每塊卡和CPU之間都是128GB/s雙向帶寬的PCIe 5.0通道連接。

MI350系列支持風冷、機架部署，其中風冷下多64塊并行，液冷時支持2U到5U，多128塊并行，也可以96塊。

128卡就能帶來36TB HBM3E內存，性能更是達到恐怖的FP16/BF16 644PFlops(64.4億億次每秒)、FP8 1.28EFlops(128億億次每秒)、FP6/FP4 2.57EFlops(257億億次每秒)。

AMD聲稱，AMD致力于在5年內將AI計算平臺的能效提升30倍，MI350系列終做到了38倍！

下一步，從2024年到2030年，AMD將再次把AI系統的能效提升20倍，屆時只需一臺機架即可完成如今275臺的工作，節省多達95％的能源。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

特別值得一提的是，作為AI加速系統平臺的一部分，AMD此前還發布了一款超高性能網卡Pensando 400 AI(代號“Pollara”)，首次與EPYC CPU、Instinct GPU一起組成完整的平臺方案。

這是業界第一個符合超剛剛發布的以太網聯盟(Ultra Ethernet)規范的網卡，支持PCIe 5.0，帶寬達400G(40萬兆)，完全可編程可定制，可卸載和加速AI處理。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

現在，AMD有了新一代全部基于自家技術和產品的AI加速系統平臺級解決方案。

EPYC CPU處理器、Instinct GPU加速卡、Pensando網卡無縫配合，尤其是網卡可以卸載接手并高效處理CPU、GPU的部分工作，釋放平臺的大性能潛力。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

M350系列方案將從第三季度開始供應客戶，可以看到各大OEM、ODM廠商基本都在名單之中了。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

生態與應用合作伙伴方面，AMD Instinct的朋友圈正在快速擴大，全球十大AI企業中已經有七家用上了Instinct，包括微軟、Meta、OpenAI、特斯拉、xAI、甲骨文等。

Meta Llama 3/4模型推理廣泛部署了MI300X，還在與AMD共同研發下一代MI450。

甲骨文率先引入MI355X，新一代AI集群正在部署多達131072塊。

微軟Azure私有和開源模型都用上了MI300X。

還有紅帽、Mavell、Cohere、Astera Labs等等，甚至提到了華為，其正在與AMD探討共同利用AMD平臺打造開放的、可擴展的、高性價比的AI基礎設施。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

后順帶一提，新發布的TOP500超級計算機排行榜上，AMD EPYC＋Instinct平臺支撐了全球快的兩臺超算，還在各個國家的不同項目中得到了廣泛的部署。

位居榜首的是位于加州勞倫斯利弗莫爾國家實驗室的El Capitan，采用第四代EPYC處理器、MI300A加速器的組合，擁有超過1100萬個核心，大性能達到1.742 EFlops(147.2億億次每秒)。

緊隨其后的是田納西州橡樹嶺國家實驗室的Frontier，第三代EPYC、MI250X的組合，大性能1.353EFlops(135.3億億次每秒)。

這兩臺超級計算機均由美國能源部實驗室運營，均屬于百億億次級的超算系統。

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

延伸閱讀——

AMD預告下代AI加速卡MI400系列：432GB HBM4內存！配80萬兆網卡

https://news.mydrivers.com/1/1053/1053507.htm

AMD正式發布ROCm 7開發平臺：AI訓練、推理性能暴漲至高3.8倍

https://news.mydrivers.com/1/1053/1053506.htm

AMD MI350系列AI服務器真機展示：八卡2.3TB內存、每秒16億億次算力

https://news.mydrivers.com/1/1053/1053518.htm

本文鏈接：http://www.tebozhan.com/showinfo-24-159066-0.htmlAMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：先馬驚鴻系列機箱首發249元起：270°全視海景房可選屏顯版

下一篇：顯卡怎么選 IGN權威報告：這款顯卡是優選！

標簽：

熱門焦點

六大權益！華為8月服務日開啟：手機免費貼膜、維修免人工費

8月5日消息，一年一度的華為開發者大會2023（Together）日前在松山湖拉開帷幕，與此同時，華為8月服務日也式開啟，到店可享六大專屬權益。華為用戶可在華為商城Ap
十個簡單但很有用的Python裝飾器

裝飾器（Decorators）是Python中一種強大而靈活的功能，用于修改或增強函數或類的行為。裝飾器本質上是一個函數，它接受另一個函數或類作為參數，并返回一個新的函數或類。它們通常用
如何使用JavaScript創建一只圖像放大鏡？

譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站，可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域，以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
JVM優化：實戰OutOfMemoryError異常

一、Java堆溢出堆內存中主要存放對象、數組等，只要不斷地創建這些對象，并且保證 GC Roots 到對象之間有可達路徑來避免垃圾收集回收機制清除這些對象，當這些對象所占空間超過
Temu起訴SHEIN，跨境電商戰事升級

來源 | 伯虎財經（bohuFN）作者 | 陳平安日前據外媒報道，拼多多旗下跨境電商平臺Temu正對競爭對手SHEIN提起新訴訟，訴狀稱Shein“利用市場支配力量強迫服裝廠商與之簽訂獨家
新電商三兄弟，“抖快紅”成團！

來源：價值研究所作者：Hernanderz 隨著內容電商的概念興起，抖音、快手、小紅書組成的“新電商三兄弟”成為業內一股不可忽視的勢力，給阿里、京東、拼多多帶去了巨大壓
馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

來源：直播觀察提起“馮提莫”這個名字，很多網友或許聽過，但應該不記得她是哪位主播了。其實，作為曾經的“斗魚一姐”，馮提莫在游戲直播的年代影響力不輸于現
由于成本持續增加，筆記本產品價格預計將明顯上漲

根據知情人士透露，由于材料、物流等成本持續增加，筆記本產品價格預計將在2021年下半年有明顯上漲。進入6月下旬以來，全球半導體芯片缺貨情況加劇，顯卡、處理器
北京：科技教育體驗基地開始登記

　　北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌，后續還將開展常態化登記?！　”本┛萍冀逃w驗基

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

六大權益！華為8月服務日開啟：手機免費貼膜、維修免人工費

十個簡單但很有用的Python裝飾器

如何使用JavaScript創建一只圖像放大鏡？

JVM優化：實戰OutOfMemoryError異常

Temu起訴SHEIN，跨境電商戰事升級

新電商三兄弟，“抖快紅”成團！

馮提莫簽約抖音公會前“斗魚一姐”消失在直播間

由于成本持續增加，筆記本產品價格預計將明顯上漲

北京：科技教育體驗基地開始登記

最新推薦

猜你喜歡

熱門推薦

相關資訊

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸

最新推薦

猜你喜歡

熱門推薦

相關資訊

AMD發布全新AI加速卡Instinct MI350系列：288GB HBM3E海量內存、1400W功耗野獸