AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 科技  > 網(wǎng)絡(luò)

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”

來源: 責(zé)編: 時間:2023-09-22 20:10:36 404觀看
導(dǎo)讀 AI時代根本的是什么?是算力。隨著AI模型、訓(xùn)練數(shù)據(jù)規(guī)模的不斷膨脹,對于算力的渴求也是空前高漲,沒有盡頭。強大的AI算力可以來自CPU,可以來自GPU,可以來自FPGA,可以來自ASIC,各有各的優(yōu)勢,其中的王者毋庸置疑就是GP

AI時代根本的是什么?是算力。sav28資訊網(wǎng)——每日最新資訊28at.com

隨著AI模型、訓(xùn)練數(shù)據(jù)規(guī)模的不斷膨脹,對于算力的渴求也是空前高漲,沒有盡頭。sav28資訊網(wǎng)——每日最新資訊28at.com

強大的AI算力可以來自CPU,可以來自GPU,可以來自FPGA,可以來自ASIC,各有各的優(yōu)勢,其中的王者毋庸置疑就是GPU加速器。sav28資訊網(wǎng)——每日最新資訊28at.com

如今的AI GPU加速器市場,呈現(xiàn)著明顯的“一家獨大、兩家追趕”的態(tài)勢:NVIDIA有著無可比擬的市場地位,尤其是軟件生態(tài)遙遙領(lǐng)先;AMD、Intel都有各自的獨特方案,也都有了不俗的成果。sav28資訊網(wǎng)——每日最新資訊28at.com

NVIDIA的大家都比較熟了,Intel的才剛剛起步,今天我們重點聊聊AMD Instinct系列加速器,看看它能不能真正挑戰(zhàn)NVIDIA。sav28資訊網(wǎng)——每日最新資訊28at.com

畢竟,任何市場領(lǐng)域一家獨大,都不是什么好事兒,都需要你來我往的競爭,才是對用戶利益、對行業(yè)發(fā)展為有利的。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

AMD Instinct很多人可能不太熟悉,但其實歷史也很優(yōu)秀了,可以追溯到2017年。sav28資訊網(wǎng)——每日最新資訊28at.com

不過那時候,它還叫Radeon Instinct,基礎(chǔ)架構(gòu)也是和Radeon游戲顯卡通用的,包括Polaris、GCN、Vega,一直到2020年的RDNA都用過。sav28資訊網(wǎng)——每日最新資訊28at.com

這么做的好處是開發(fā)成本低、推進速度快,但缺點也很明顯,就是在計算方面缺乏針對性和高效率。sav28資訊網(wǎng)——每日最新資訊28at.com

2020年誕生的Instinct MI100,成為這條產(chǎn)品線的一個轉(zhuǎn)折點,因為它首次采用了專門設(shè)計的CNDA計算架構(gòu),和RDNA圖形架構(gòu)徹底分道揚鑣,同時去掉了名字中的Radeon字樣,踏上了新的征程。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

2021年的Instinct MI200系列又達到了全新的高度,這是AMD第一款ExaScale百億億次計算性能級別的加速器產(chǎn)品,號稱在同類產(chǎn)品中擁有世界上快的HPC性能、AI性能。sav28資訊網(wǎng)——每日最新資訊28at.com

它升級到了第二代CDNA 2架構(gòu),首創(chuàng)MCM多芯整合封裝,擁有Infinity Fabric高速互連通道、矩陣核心、128GB HBM2e高帶寬內(nèi)存等等,性能異常強大,浮點性能約48萬億次每秒。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

該系列包括MI250X、MI250、MI210三款型號,在諸多高性能計算、機器學(xué)習(xí)、人工智能、超級計算機中都有普遍應(yīng)用。sav28資訊網(wǎng)——每日最新資訊28at.com

尤其是頂級滿血的MI250X戰(zhàn)績彪炳,目前公開性能世界第一、已經(jīng)三連冠的超算“Frontier”,就是基于它打造的,大性能高達119.4億億次浮點每秒,是第二名的多達2.7倍,峰值性能更是168億億次浮點每秒,是第二名的3倍還多!sav28資訊網(wǎng)——每日最新資訊28at.com

第三名的“LUMI”同樣是采用了MI250X,大性能30.9億億次浮點每秒,峰值性能42.9億億次浮點每秒,相當(dāng)于第二名的七八成。sav28資訊網(wǎng)——每日最新資訊28at.com

值得一提的是,韓國電信運營商Kt還使用AMD Instinct平臺運行了該國第一個大語言模型,支持110億參數(shù)。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

新一代的Instinct MI300系列再次實現(xiàn)跨越,并開辟了全新的方向,有了兩款不同的產(chǎn)品。sav28資訊網(wǎng)——每日最新資訊28at.com

其中,MI300A是全球首款面向HPC、AI的APU加速器,基于AMD的成熟經(jīng)驗,開創(chuàng)了CPU、GPU合體加速的先河。sav28資訊網(wǎng)——每日最新資訊28at.com

它采用了先進的Chiplet芯粒設(shè)計,一共有多達13顆小芯片,其中計算部分9顆,都是5nm工藝制造,基底和擴展部分4顆,都是6nm工藝制造,集成多達1460億個晶體管。sav28資訊網(wǎng)——每日最新資訊28at.com

CPU部分為Zen 4架構(gòu),三組CCD共24個核心,GPU為新的CDNA3架構(gòu),還有128GB大容量的HBM3高帶寬內(nèi)存,可以為CPU、GPU所共享。sav28資訊網(wǎng)——每日最新資訊28at.com

MI300A使用了標準的Socket獨立封裝,因此不再需要單獨的CPU處理器,自己就能組建一整套加速平臺,大大簡化系統(tǒng)設(shè)計。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

MI300X則是純GPU加速器,相當(dāng)于把MI300A里的CPU模塊也替換成GPU,同時將HBM3內(nèi)存容量增加到史無前例的192GB,帶寬達到驚人的5.2TB/s。sav28資訊網(wǎng)——每日最新資訊28at.com

整體集成的晶體管數(shù)量,也達到了同樣史無前例的1530億個。sav28資訊網(wǎng)——每日最新資訊28at.com

作為對比,NVIDIA新的H100加速器也只有800億個晶體管,只有MI300X的一半多點,不在一個層級上。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

為方便客戶部署,AMD全新設(shè)計了Instinct平臺,基于行業(yè)標準的OCP計算標準,單系統(tǒng)可集成多八塊OAM形態(tài)的MI300X,HBM3內(nèi)存總?cè)萘窟_1.5TB。sav28資訊網(wǎng)——每日最新資訊28at.com

Instinct MI300系列也已經(jīng)開始投入商用,比如美國勞倫斯利弗莫爾實驗室的新一代超級計算機EI Capitan,已開始安裝MI300A加速器,搭檔第四代AMD EPYC處理器。sav28資訊網(wǎng)——每日最新資訊28at.com

它將在明年上線,預(yù)計性能超過200億億次浮點計算每秒,也就是可以超越當(dāng)今第一的Frontier。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

MI300X的強勁性能和超高能效,使之可以輕松應(yīng)對當(dāng)今AI對強算力的需求,搞定各種幾百上千億參數(shù)的大語言模型,F(xiàn)alcon、GPT-3、PaLM 2、PaLM等等都不在話下。sav28資訊網(wǎng)——每日最新資訊28at.com

甚至,MI300X單卡就能運行800億參數(shù)的大語言模型,尤其是得益于超大容量的HBM3內(nèi)存,大模型可以完全在HBM3內(nèi)存中運行,無需動用系統(tǒng)內(nèi)存,從而省去數(shù)據(jù)傳輸與拷貝,大大降低延遲、提升性能。sav28資訊網(wǎng)——每日最新資訊28at.com

相比于 NVIDIA 80GB HBM內(nèi)存加速器,運行同樣參數(shù)規(guī)模模型,MI300X所需要的GPU數(shù)量也更少,自然成本更低。sav28資訊網(wǎng)——每日最新資訊28at.com

更關(guān)鍵的是,NVIDIA H100/A100加速器過于火爆,價格一路飆升,比如應(yīng)用多的H100目前已經(jīng)要到4.5萬美元一塊,相當(dāng)于30多萬人民幣,新一代的A100也需要十幾萬。sav28資訊網(wǎng)——每日最新資訊28at.com

甚至,就算你舍得花錢,也不一定買到。負責(zé)代工的臺積電也承認,H100/A100的緊缺狀況還要持續(xù)大約一年半之久。sav28資訊網(wǎng)——每日最新資訊28at.com

相比之下,AMD的一貫優(yōu)良傳統(tǒng)恰恰就是高性價比,正好可以給客戶提供更豐富的選擇空間,而不是吊在一棵樹上。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)然了,作為AI加速器,不但需要硬件設(shè)計強大,更需要足夠高效的開發(fā)平臺、足夠優(yōu)化的軟件和應(yīng)用適配,才能徹底釋放潛力。sav28資訊網(wǎng)——每日最新資訊28at.com

NVIDIA在這方面無疑做得相當(dāng)透徹,這也是其贏得開發(fā)者和市場的一大關(guān)鍵。sav28資訊網(wǎng)——每日最新資訊28at.com

AMD ROCm開發(fā)平臺同樣歷史悠久,只是在技術(shù)特性、生態(tài)適配上一直有待進一步拓展,而今在AI的驅(qū)動下正在努力追趕。sav28資訊網(wǎng)——每日最新資訊28at.com

比如新一代ROCm 5.x版本,針對HPC、AI做了全方位優(yōu)化,支持各種流行的AI模型、框架和算法,諸如PyTorch、TensorFlow、ONNX、OpenXLA、Triton、DeepSpeed……方便開發(fā)者根據(jù)自己的實際需要選擇,靈活滿足不同場景。sav28資訊網(wǎng)——每日最新資訊28at.com

值得一提的是,現(xiàn)在部署MI210,AMD還會提供軟件層面的搭建支持,讓客戶的安裝、使用更加簡單、省心。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

說到這里順帶一提,除了高性能計算GPU方面,AMD還正在不斷釋放消費級游戲GPU的AI潛力,比如大火的文生圖應(yīng)用Stable Diffusion,已經(jīng)可以在Windows系統(tǒng)下跑在AMD Radeon顯卡上。sav28資訊網(wǎng)——每日最新資訊28at.com

如今,你可以在Automatic1111(Xformer)下使用微軟的Microsoft Olive(一個可用于轉(zhuǎn)換、優(yōu)化、量化和自動調(diào)整模型以通過DirectML等ONNX運行時執(zhí)行提供程序獲得佳推理性能的Python工具),來啟用Stable Diffusion,從而在Windows系統(tǒng)上通過Microsoft DirectML,獲得顯著的加速。sav28資訊網(wǎng)——每日最新資訊28at.com

AMD也一直在與微軟合作優(yōu)化AMD硬件上的Olive路徑,通過微軟DirectML API,以及用于DirectML的AMD用戶模式驅(qū)動程序的ML層加速,從而允許用戶訪問AMD GPU的AI功能和性能。sav28資訊網(wǎng)——每日最新資訊28at.com

按照AMD實測的數(shù)據(jù),RX 7900 XTX在默認PyTorch路徑上運行,每秒可提供1.87次迭代,而換到Microsoft Olive的優(yōu)化模型上運行,每秒可提供18.59次迭代,也就是性能提升多達9.9倍!sav28資訊網(wǎng)——每日最新資訊28at.com

相信像這樣的生態(tài)適配和合作,未來勢必也會越來越多地體現(xiàn)在AMD Instinct上。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

后,AMD Instinct還有一個任何對手都無法匹及的優(yōu)勢,那就可以是背靠完整的AI產(chǎn)品矩陣,提供一整套一站式解決方案。sav28資訊網(wǎng)——每日最新資訊28at.com

尤其是高性能的EPYC處理器,經(jīng)過幾年的迭代,計算性能已經(jīng)遙遙領(lǐng)先,新一代EPYC 9004系列已經(jīng)升級到Zen 4架構(gòu)、96核心192線程、12通道DDR5內(nèi)存、160條PCIe 5.0總線,還衍生出了Zen 4c高能效核心、3D V-Cache 1GB+緩存等不同版本。sav28資訊網(wǎng)——每日最新資訊28at.com

事實上,當(dāng)今的眾多高性能計算平臺尤其是超級計算機,都部署了AMD EPYC、AMD Instinct這一對黃金組合,效果拔群,在各種科學(xué)與學(xué)術(shù)研究中貢獻力量。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

總的來說,在這個AI蓬勃發(fā)展的時代,對于強大算力的需求只會越發(fā)高漲,其中蘊含著前所未有的機遇。sav28資訊網(wǎng)——每日最新資訊28at.com

NVIDIA的強大和領(lǐng)先毋庸置疑,軟硬件結(jié)合更是做得十分到位,但一花獨放不是春、百花齊放春滿園,我們同時也非常希望AMD、Intel能把握住這個風(fēng)口,拿出同樣優(yōu)秀的方案,讓開發(fā)者和用戶受益。sav28資訊網(wǎng)——每日最新資訊28at.com

AMD更是尤為值得期待。Instinct系列加速器發(fā)展多年,屢屢實現(xiàn)創(chuàng)新突破,性能上絕對不是問題,能在超算的世界里脫穎而出就是明證,只要在開發(fā)和生態(tài)上多下一番功夫,勢必更受歡迎。sav28資訊網(wǎng)——每日最新資訊28at.com

同時,AMD還有著全套解決方案的支撐,特別是強大的EPYC處理器現(xiàn)在讓Intel都不得不仰視,可以和Instinct珠聯(lián)璧合,再加上一貫以來的高性價比,前途必然是相當(dāng)光明的。sav28資訊網(wǎng)——每日最新資訊28at.com

“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”sav28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-17-11145-0.html“饑渴”的AI時代:AMD Instinct加速器面前是一條“星光大道”

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 孫女買衣服 爺爺邊說不要邊報體重:收到后很開心

下一篇: 阿里六大業(yè)務(wù)集團IPO第一槍即將打響 菜鳥計劃正式交表: 官方回應(yīng)

標簽:
  • 熱門焦點
  • 7月安卓手機好評榜:三星S23Ultra好評率第一

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數(shù)據(jù)來源安兔兔評測,收集時間2023年7月1日至7月31日,僅限國內(nèi)市場。第一名:三星Galaxy S23 Ultra好評率:95.71%在即將迎來新
  • 6月安卓手機性能榜:vivo/iQOO霸占旗艦排行榜前三

    2023年上半年已經(jīng)正式過去了,我們也迎來了安兔兔V10版本,在新的驍龍8Gen3和天璣9300發(fā)布之前,性能榜的榜單大體會以驍龍8Gen2和天璣9200+為主,至于那顆3.36GHz的驍龍8Gen2領(lǐng)先
  • 女孩租房開2小時空調(diào)用完100元電費引熱議:5級能耗惹不起 月薪過萬電費也交不起

    近日,江蘇蘇州一女孩租房當(dāng)天充值了100元電費,開著空調(diào)不到2小時發(fā)現(xiàn)電費已用完。對于為什么這個快,房東表示,電表壞了這種情況很多,之前也遇到過,給租客換
  • 摸魚心法第一章——和配置文件說拜拜

    為了能摸魚我們團隊做了容器化,但是帶來的問題是服務(wù)配置文件很麻煩,然后大家在群里進行了“親切友好”的溝通圖片圖片圖片圖片對比就對比,簡單對比下獨立配置中心和k8s作為配
  • 19個 JavaScript 單行代碼技巧,讓你看起來像個專業(yè)人士

    今天這篇文章跟大家分享18個JS單行代碼,你只需花幾分鐘時間,即可幫助您了解一些您可能不知道的 JS 知識,如果您已經(jīng)知道了,就當(dāng)作復(fù)習(xí)一下,古人云,溫故而知新嘛。現(xiàn)在,我們就開始今
  • 破圈是B站頭上的緊箍咒

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之每年的暑期檔都少不了瞄準追劇女孩們的古偶劇集,2021年有優(yōu)酷的《山河令》,2022年有愛奇藝的《蒼蘭訣》,今年卻輪到小破站抓住了追
  • ESG的面子與里子

    來源 | 光子星球撰文 | 吳坤諺編輯 | 吳先之三伏大幕拉起,各地高溫預(yù)警不絕,但處于厄爾尼諾大“烤”之下的除了眾生,還有各大企業(yè)發(fā)布的ESG報告。ESG是“環(huán)境保
  • 造車兩年股價跌六成,小米的估值邏輯變了嗎?

    如果從小米官宣造車后的首個交易日起持有小米集團的股票,那么截至2023年上半年最后一個交易日,投資者將浮虧59.16%,同區(qū)間的恒生科技指數(shù)跌幅為52.78%
  • iQOO Neo8 Pro評測:旗艦雙芯加持 最強性能游戲旗艦

    【Techweb評測】去年10月,iQOO推出了一款Neo7手機,該機搭載了聯(lián)發(fā)科天璣9000+,配備獨顯芯片Pro+,帶來了同價位段最佳的游戲體驗,一經(jīng)上市便受到了諸多用
Top