TechWeb 文 / 新喀鴉
隨著一些模型(例如大型語言模型)達到數萬億參數,AI、高性能計算和數據分析變得日益復雜。以英偉達為首的很多公司都推出了一系列用于AI計算的相關芯片。
而在近期美國加州圣何塞的AMD Advancing AI大會上,AMD正式公布了Instinct MI300系列加速器的詳細規格與性能,以及眾多的應用部署案例。那么AMD新發布的Instinct MI300到底怎么樣?
AMD Instinct MI300系列
MI300系列包含MI300A和MI300X兩款產品,其中MI300A是集成了CPU+GPU的APU(Accelerated Processing Units)產品。MI300X則是采用了純GPU設計的GPU產品。
目前MI300系列在市場上的競爭對手無疑是英偉達的H100。在AMD官網上具體對比參數如下:
MI300A與H100相比,在AI算力方面兩者幾乎不分上下。
MI300A與H100相比,在高性能計算方面MI300A有著相對明顯的優勢。
MI300A與H100相比,在內存容量和帶寬方面MI300A有著相對明顯的優勢。
MI300X與H100相比,在AI算力方面MI300X有著一定的優勢。
MI300X與H100相比,在高性能計算方面MI300X有著相對明顯的優勢。
MI300A與H100相比,在內存容量和帶寬方面MI300A有著相對明顯的優勢。
不過值得一提的是,MI300X有著304個CU(計算單元),而H100則只有132個SM(流式多處理器)。這樣看來MI300X其實是靠“堆規格”把算力堆上去的。這就會造成在同樣的成本下,算力方面H100比起MI300X更有優勢。不過鑒于目前英偉達憑借各種優勢把H100賣得很貴,AMD“堆規格”的策略也許是個不錯的競爭方式。
ROCm 6
AMD在這次大會上還宣布將推出最新的AMD ROCm 6開放軟件平臺,不僅能提升AI加速性能,還增加了對生成式AI多項新功能的支持,包括FlashAttention、HIPGraph和vLLM等。
在生態系統層面,AMD的合作伙伴數量不斷增加,除了Pytorch和Hugging Face外,OpenAI Triton 3.0版本也將支持AMD GPU。
AMD的軟件生態圈ROCm(Radeon Open Compute Ecosystem)于2016年4月發布,相比2007年發布的英偉達CUDA起步較晚。因此目前從軟件生態角度看,英偉達CUDA仍然具有相當的優勢。
重要客戶
根據目前的消息顯示Meta、微軟、甲骨文以及服務器供應商戴爾、惠普、聯想、超微等將成為MI300系列的重要客戶。這些公司的具體動向如下:
Meta正在新增AMD Instinct MI300X加速器至其數據中心。
微軟近期發布Azure ND MI300x v5虛擬機(VM)系列產品。
甲骨文計劃引入搭載AMD MI300X的裸機實例用于其高性能計算,且該基于MI300X的實例預計將支援配備高速RDMA網絡的OCI Supercluster。
戴爾展示了Dell PowerEdge XE9680服務器,其配備8個MI300系列加速器。
惠普近期發布首款搭載AMD MI300A APU的超算加速器HPE Cray Supercomputing EX255a,預計于2024年上半年上市。
聯想宣布計劃將在2024年上半年推出基于AMD MI300系列加速器的創新設計。
超微推出基于第4代AMD EPYC處理器和AMD Instinct MI300系列加速器的H13系列新產品。
AMD中國官網
AMD美國官網
另外,目前在AMD中國官網AMD Instinct 加速器頁面中還沒有出現MI300系列的相關介紹,在“產品陣容”部分還是MI200系列的介紹信息。因此,MI300系列產品可能暫時不會向中國出售。
本文鏈接:http://www.tebozhan.com/showinfo-21-52159-0.htmlAMD新發布的Instinct MI300到底怎么樣?
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com