北京時間 6 月 13 日 00:30 消息,AMD Advancing AI 2025 正式開啟,AMD 董事長兼首席執行官蘇姿豐博士同公司高管、AI 生態系統合作伙伴、客戶、開發人員,共同討論了 AMD 的產品和軟件將如何發展人工智能生態和高性能計算 (HPC) 領域的格局。
在本次大會上,AMD 全面展示了“端到端”的集成人工智能平臺發展愿景,并推出了面向 AI 的可擴展機架級基礎設施產品組合。
首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計算領域實現了性能、能效與可擴展性的全方位提升。
Instinct MI350 系列包括 MI350X 和 MI355X 2 款 GPU 產品。在性能方面,較上一代產品實現了每代 4 倍的 AI 計算能力提升和 35 倍的推理性能飛躍,此次全新發布的 Instinct GPU 基于 AMD CDNA 4 架構,3nm 制程工藝打造,集成了 1850 億個晶體管,支持 FP4 & FP6 新一代 AI 數據類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運行高達 520B 參數的 AI 模型,支持 UBB8 行業標準 GPU 節點,可以幫助企業實現快速部署基礎設施。
AMD Instinct MI355X GPU 在 AI 和高性能計算領域都有著出色的表現。據 AMD 的介紹,在與 NVIDIA B200 和 GB200 的對比中,MI355X 的顯存約為競品的 1.6 倍,內存帶寬則基本持平。針對 FP64 和 FP32 運算,MI355X 的峰值性能領先優勢達到了競品的 2 倍。對于 FP16 和 FP8 運算,其峰值性能與競品相當或略有勝出,而 FP6 的性能則也達到了競品 2 倍以上。此外,在 FP4 運算上,MI355X 與競品的峰值性能相近。而在性價比方面,另外相比 B200,采用 Instinct MI355X 的企業或開發者可獲得 40% Tokens/$ 性價比優勢。
相較于上一代的 MI300X ,MI355X 運行 Llama 3.1 405B 時,其智能體性能是前者的 4.2 倍,“內容生成能力”是上一代( MI300X)的 2.9 倍,“摘要生成”能力是上一代( MI300X)的 3.8 倍,“對話式人工智能”性能表現則為上一代( MI300X)的 2.6 倍。
AMD Instinct MI350 系列構建基于開放標準的機架級 AI 基礎設施,支持高密度擴展與先進網絡互聯。
AMD Instinct? MI350 系列平臺采用開放標準設計,全面支持 UEC(Universal Baseboard for Edge Computing)與 OCP(Open Compute Project)規范,構建面向下一代 AI 工作負載的高性能機架級基礎設施。該系列結合了 Instinct MI350 系列加速器與第五代 AMD EPYC? x86 處理器,支持多種規模配置選項,包括搭載 128、96 或 64 顆 GPU 的系統,分別集成高達 36TB、27TB 和 18TB 的 HBM3E 高帶寬內存資源。平臺在 FP8、FP6 和 FP4 等多種精度下均具備卓越的 AI 運算能力,可滿足大規模模型訓練、推理與部署需求,特別適用于超大規模數據中心與云端 AI 集群的橫向擴展。相關系統方案預計將于 2025 年第三季度起,通過 AMD 合作伙伴生態體系全面推出。
AMD 預告下一代 AI 機架架構“Helios”,引領未來高性能計算基礎設施發展
在 Advancing AI 2025 活動上,AMD 預告了其下一代機架級 AI 系統架構“Helios”,該架構將集成多項先進計算組件,進一步拓展高性能 AI 基礎設施的邊界。Helios 架構將采用即將發布的 AMD Instinct MI400 系列 GPU、基于“Zen 6”微架構的 AMD EPYC “Venice”處理器,以及 AMD Pensando “Vulcano”智能網卡,構建具備高帶寬、高互聯與高能效特性的開放式平臺,旨在滿足下一代大規模 AI 模型的訓練與部署需求。
AMD 預覽下一代“Helios”機架級 AI 架構,搭載 Instinct MI400 加速器與 Zen 6 平臺,面向 2026 年全面部署、
與此同時,AMD 也向大家預覽了 Instinct MI400 系列加速器的核心規格,該系列預計將于 2026 年正式推出。MI400 將配備高達 432GB 的 HBM4 高帶寬顯存,實現 19.6 TB/s 的顯存帶寬與每卡 300 GB/s 的擴展互聯帶寬。在 AI 運算能力方面,MI400 系列提供高達 40 PFLOPS(FP4 精度)和 20 PFLOPS(FP8 精度)的峰值性能,進一步鞏固 AMD 在生成式 AI 和高性能計算領域的技術領先地位,延續 MI300X 與 MI325X 平臺在能效、規模與靈活性方面的優勢。
全新 ROCm 7 發布!助力開發效率提升,加速 AI 應用落地
在硬件產品穩步發展的同時,最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了科技行業和開發者們的關注。全新的 ROCm 7 其旨在滿足生成式人工智能和高性能計算工作負載不斷增長的需求。并在整體功能與生態兼容性上實現全面增強。新版本帶來對主流行業標準 AI 框架的更強支持,顯著擴展硬件適配范圍,并引入全新開發工具鏈、驅動程序、API 與加速庫,進一步優化開發者體驗,加速 AI 應用的開發、調試與部署流程。
AMD Developer Cloud 面向全球開發者全面開放,助力高效 AI 開發與無縫擴展
最后,AMD 宣布將進一步擴大 AMD Developer Cloud 的可用性,面向全球開發者與開源社區開放訪問權限。該平臺專為快速、可擴展的高性能 AI 開發而打造,提供完全托管的云端環境,集成豐富的開發工具與資源,支持用戶快速啟動 AI 項目并實現靈活擴展,滿足從原型驗證到大規模部署的全流程需求。通過 AMD Developer Cloud 搭配 ROCm? 7 軟件棧,AMD 正在持續降低 AI 計算門檻,加速創新落地。
6 月 13 日消息,AMD 在北京時間今日凌晨 00:30 舉辦了其年度人工智能直播活動 Advancing AI 2025,AMD 董事長兼首席執行官蘇姿豐同其它高管以及 AI 生態系統合作伙伴、客戶、開發人員一起,共同討論了 AMD 的產品和軟件如何重塑 AI 和高性能計算(HPC)格局。
在本次大會上,AMD 展示了其全面的端到端集成人工智能平臺愿景,并推出了全新基于行業標準的開放、可擴展的機架級人工智能基礎設施產品。
首先,AMD 推出了全新一代 Instinct MI350 系列 GPU,在生成式人工智能和高性能計算的性能、效率和可擴展性方面得到全面提升。
Instinct MI350 系列包括 Instinct MI350X 和 MI355X GPU 及平臺,實現了每代 4 倍的 AI 計算能力提升和 35 倍的推理性能飛躍。
新的 GPU 基于 AMD CDNA 4 架構,3nm 制程工藝打造,集成了 1850 億個晶體管,支持 FP4 & FP6 新一代 AI 數據類型,可提供 288GB HBM3E 顯存,支持單 GPU 上運行高達 520B 參數的 AI 模型,支持 UBB8 行業標準 GPU 節點,提供風冷和直液冷兩種版本,可以幫助企業實現快速部署基礎設施。
AMD Instinct MI355X GPU 在 AI 和 HPC 領域性能有出色表現,根據 AMD 的介紹,在與 NVIDIA B200 和 GB200 的對比中:
在內存容量方面,MI355X 約為競品的 1.6 倍,內存帶寬則基本持平。
針對 FP64 和 FP32 運算,MI355X 的峰值性能接近競品的兩倍。
對于 FP16 和 FP8 運算,其峰值性能與競品相當或略高,FP6 性能則達到 2 倍以上。
在 FP4 運算上,MI355X 與競品的峰值性能相近,小幅領先。
另外相比 B200,使用 Instinct MI355X 可獲得 40% Tokens/$ 性價比提升。
而在和上一代 MI300X 的對比中,MI355X 運行 Llama 3.1 405B 模型,在 AI 智能體性能表現上是前者的 4.2 倍,內容生成能力是上一代 MI300X 的 2.9 倍,摘要能力是上一代的 3.8 倍,對話式人工智能表現則為 2.6 倍。
AMD 表示,Instinct MI350 系列超出了 AMD 設定的五年目標,即將 AI 訓練和高性能計算節點的能效提高 30 倍,最終實現了 38 倍的提升。
AMD Instinct MI350 系列提供基于開放標準的機架基礎設施和網絡解決方案。
該系列產品支持 UEC、OCP 設計,搭載 Instinct GPU 與第五代 EPYC x86 CPU,不同配置包括 128 顆 GPU、96 顆 GPU 和 64 顆 GPU,分別具備 36TB、27TB 和 18TB HBM3E 內存,性能指標涵蓋 FP8、FP6 和 FP4 精度,適用于大規模機架擴展方案,預計從 Q3 開始通過 AMD 解決方案合作伙伴提供相關產品。
從活動獲悉,AMD 還預告了其下一代 AI 機架架構“Helios”。它將基于下一代 AMD Instinct MI400 系列 GPU、基于“Zen 6”架構的 AMD EPYC “Venice” CPU 以及 AMD Pensando “Vulcano”網卡構建。
同時 AMD 更預告了 Instinct MI400 系列 GPU,預計 2026 年上市。該系列配備 432GB HBM4 顯存,帶寬達 19.6TB/s,每 GPU 擴展帶寬為 300GB/s;提供 40PF FP4 和 20PF FP8 的 AI 計算性能,延續 MI300X、MI325X 等系列優勢。
AMD 還公布了一個新的 2030 年目標,即從 2024 年基準年起,將機架級能效提高 20 倍,屆時,現在需要超過 275 個機架才能訓練的典型 AI 模型,在 2030 年時僅需一個完全利用的機架即可完成訓練,同時耗電量減少 95%。
此外最新版本的 AMD 開源 AI 軟件棧 ROCm 7 也受到了不少網友的關注,其旨在滿足生成式人工智能和高性能計算工作負載不斷增長的需求 —— 同時全面提升開發者體驗。ROCm 7 具有改進的行業標準框架支持、擴展的硬件兼容性以及新的開發工具、驅動程序、API 和庫,以加速 AI 的開發和部署。
最后值得一提的是,AMD 將為面向全球開發者和開源社區的 AMD 開發者云帶來更廣泛的使用權限。該平臺專為快速、高性能的 AI 開發而構建,用戶在 AMD 開發者云上將能夠訪問一個完全托管的云環境,包括擁有啟動 AI 項目所需的工具和靈活性,并能夠無限制擴展。
本文鏈接:http://www.tebozhan.com/showinfo-45-13810-0.htmlAMD Advancing AI 2025 大會如期而至:重磅發布 Instinct MI350 系列 GPU 產品,推理性能提升達 35 倍
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com