當前位置：首頁 > 科技 > 測評

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

來源：責編：時間：2023-09-28 15:52:12 400觀看

導讀 AI大模型的推理訓練，最渴求的就是強勁的算力，可以來自CPU通用處理器，可以來自GPU加速器，可以來自ML/DL加速器，也可以是多種異構硬件的組合。當下最火的當然是NVIDIA GPU加速器，但一花獨放不是春，能夠提

AI大模型的推理訓練，最渴求的就是強勁的算力，可以來自CPU通用處理器，可以來自GPU加速器，可以來自ML/DL加速器，也可以是多種異構硬件的組合。

當下最火的當然是NVIDIA GPU加速器，但一花獨放不是春，能夠提供強勁算力硬件方案的廠商很多。

縱觀整個AI江湖，唯一擁有全套方案、可真正替代NVIDIA的，只能是Intel：至強處理器、GPU Max、Gaudi加速器多管齊下，再加上強大豐富的開發(fā)工具、開放生態(tài)的開發(fā)平臺，要啥有啥，表現還相當不賴。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

今年6月，機器學習與人工智能開放產業(yè)聯盟MLCommons公布了AI性能基準測試MLPerf Training 3.0的結果。

結果顯示，Intel四代至強內置的各種加速器，使其成為在通用CPU處理器上運行大量AI工作負載的理想方案，Gaudi2加速器則在生成式AI、LLM大語言模型方面有著優(yōu)秀的性能。

此外，Intel還提供了經過優(yōu)化的、易于編程的開放軟件，降低AI部署門檻。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

8月份，MLCommons又公布了針對60億參數大語言模型、計算機視覺與自然語言處理模型GPT-J的 MLPerf 3.1基準測試結果，Intel的表現依然值得稱道。

其中在GPT-J模型上，Gaudi2加速器的GPT-J-99、GPT-J-99.9服務器查詢和離線樣本的推理性能分別為78.58次/秒、84.08 次/秒。

與競品比較，Gaudi2相對于NVIDIA上一代A100的性能優(yōu)勢可達2.4倍（服務器）、2倍（離線），而最新一代的H100相對于Gaudi2也只有1.09 倍（服務器）、1.28 倍（離線）的微弱優(yōu)勢。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

同時，Intel四代至強在視覺、語言處理、語音、音頻翻譯模型，以及更大的DLRM v2深度學習推薦模型、ChatGPT-J模型上處理通用AI負載時，性能都非常出色。

比如使用GPT-J對大約1000-1500字新聞稿進行100字總結的任務，四代至強在離線模式下每秒完成兩段，實時服務器模式下則可完成每秒一段。

此外，Intel還首次提交了至強CPU Max處理器的MLPerf測試結果，其集成最多64GB HBM3高帶寬內存，對于GPT-J而言是唯一能夠達到99.9％準確度的CPU，非常適合精度要求極高的應用。

還有非常關鍵的一點：迄今為止，Intel是唯一一個使用行業(yè)標準深度學習生態(tài)軟件并公開提交CPU結果的廠商，Gaudi2是僅有的兩個向GPT-3大模型訓練基準提交性能結果的解決方案之一。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

那么，Intel Gaudi2加速器、至強處理器為何能在AI算力上如此彪悍？Habana Labs中國區(qū)總經理于明揚做出了詳細解讀。

據介紹，MLPerf 3.1推理測試中，Gaudi2和H100一樣都采用了FP8精度，GPT-J測試結果非常令人滿意，準確率高達99.9％，和H100的差距非常小。

這主要是因為Gaudi2 MME支持FP8、BF16精度加速，而且結構設計合理，可以高效提升推理能力。

同時，Gaudi2也和H100一樣使用了HBM高帶寬內存，Intel也很好地預測了市場，并預估了額外的需求，因此基本保證了供應和生產，可以滿足市場需求，不像NVIDIA那么頭疼產能。

至于A100，它并不支持FP8而僅支持FP16，所以Gaudi2比之優(yōu)勢非常明顯，這也顯示了Gaudi2架構和軟件設計的領先性，以及資源利用率的高效性。

非常關鍵的是，Intel Gaudi2的性價比優(yōu)勢明顯，不像A100、H100那樣動不動幾十萬一塊，讓中小企業(yè)和個人開發(fā)者望洋興嘆。

Intel也已經開放了開發(fā)者云，讓不同客戶可以訪問不同的Intel AI硬件，大大降低AI工作成本。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

除了硬件性能的比拼，Intel也在軟件生態(tài)上持續(xù)大力投入，雖然暫時還做不到NVIDIA CUDA生態(tài)那樣有著獨一無二的優(yōu)勢，但也有自己的突出特點。

于明揚強調，在軟件生態(tài)上，Intel一直主張開放，比如通過開發(fā)者社區(qū)與開發(fā)者互動，提供優(yōu)化后的模型、開源驅動和工具庫，并支持Pytorch、Deepspeed等開源框架，加入和維護開放生態(tài)，為客戶、合作伙伴和開發(fā)人員提供早期訪問和便捷、迅速的途徑。

Intel oneAPI也能提供更為開放的環(huán)境，支持不同層面的定制化開發(fā)，Intel和客戶都可以在軟件中添加新的加速算子，并且upstreaming到框架開源社區(qū)中。

值得一提的是，在軟件上CUDA的影響已經大大縮小，對整體開發(fā)和應用環(huán)境更加有利。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

事實上，NVIDIA目前的強大只是GPU一條腿走路，CPU通用處理器是欠缺的。

雖然NVIDIA也開發(fā)了Grace CPU，并打造了所謂的“超級芯片”，可以將兩顆Grace CPU或一顆Grace CPU加一顆H100 GPU進行整合，但畢竟是基于Arm架構，性能較弱，而且缺乏通用性。

Intel則憑借多管齊下的多硬件組合，可以構建強大、靈活異構計算平臺，從而支持更大的模型規(guī)模，滿足更廣泛的系統需求。

于明揚指出，至強可擴展處理器有著最好的通用性，可以運行各種AI工作負載。

四代至強還衍生出了的至強CPU Max系列，是行業(yè)唯一一款具有HBM高帶寬內存的x86處理器，無需更改代碼，即可加速多種HPC、AI工作負載。

Gaudi系列加速器則專注于機器學習、深度學習的環(huán)境，以及未來對大語言模型的需求。

當然還有數據中心GPU Max系列，雖然才剛剛誕生，但是擁有47個功能模塊、1000多億晶體管的它，有著巨大的潛力和廣闊的前景，在各種科學負載中相比H100可綜合領先30％，還已經用于百億億次超級計算機“Aurora”。

這樣的豐富組合，別說NVIDIA，在整個行業(yè)內都沒有可與之匹配的。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

面向未來，Intel也自信滿滿地公布了Gaudi加速器、至強處理器的多年路線圖，讓人充滿期待。

Gaudi 3將把制造工藝從7nm升級到5nm，帶來的性能提升堪稱一次飛躍：

BF16算力提升4倍，計算性能提升2倍，網絡帶寬提升1.5倍，HBM高帶寬內存容量提升1.5倍。

從示意圖上看，Gaudi3的主芯片將從單顆升級為兩顆整合，HBM內存則從6顆增加到8顆。

再往后更是革命性的變化：Falcon Shores將是Intel第一次把x86 CPU、Xe GPU雙架構融合在一起，官方稱之為XPU，類似AMD Instinct MI300A。

按照Intel之前給出的數字，對比當今水平，Falcon Shores的能耗比提升超過5倍，x86計算密度提升超過5倍，內存容量與密度提升超過5倍。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

Emerald Rapids五代至強將在12月14日正式發(fā)布，這是至強歷史上第一次一年內更新兩代，增加到最多64核心128線程，同樣功耗水平下可提供更高的性能和存儲速度。

2024年上半年，至強將首次采用E核能效核設計，代號Sierra Forest，最多達到驚人的288核心288線程，而且首次引入Intel 3制造工藝，預計可使機架密度提升2.5倍、每瓦性能(能效)提高2.4倍。

緊隨其后的是同樣Intel 3工藝、全部P核性能核設計的Granite Rapids，AI性能對比四代至強預計可提高2-3倍。

2025年，我們將看到代號Clearwater Forest的再下一代至強，純能效核設計，升級為Intel 18A制造工藝。

按照規(guī)劃，那個時候，Intel將重新奪回制程工藝的領先地位，對于提高AI硬件的能效大有裨益。

總之，未來在AI計算領域，Intel將會提供更加強大、可滿足不同應用場景和TCO成本的AI產品組合，為客戶打造統一的開發(fā)平臺，形成完整的產品生態(tài)鏈。

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

本文鏈接：http://www.tebozhan.com/showinfo-25-11789-0.htmlAI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：銘凡V3官宣：全球首款銳龍8000二合一筆記本

下一篇： 100%原生木漿！原木日記抽紙大促：100抽僅1元

標簽：

熱門焦點

K60至尊版剛預熱一加Ace2 Pro正面硬剛

Redmi這邊剛如火如荼的宣傳了K60 Ultra的各種技術和硬件配置，作為競品的一加也坐不住了。一加中國區(qū)總裁李杰發(fā)布了兩條微博，表示在自家的一加Ace2上早就已經采用了和PixelWo
5月安卓手機好評榜：魅族20 Pro奪冠

性能榜和性價比榜之后，我們來看最后的安卓手機好評榜，數據來源安兔兔評測，收集時間2023年5月1日至5月31日，僅限國內市場。第一名：魅族20 Pro好評率：97.50%不得不感慨魅族老品牌還
消息稱迪士尼要拍真人版《魔發(fā)奇緣》：女主可能也找黑人演員

8月5日消息，迪士尼確實有點忙，忙著將不少動畫改成真人版，繼《美人魚》后，真人版《白雪公主》、《魔發(fā)奇緣》也在路上了。據外媒消息稱，迪士尼將打造真人版
K6：面向開發(fā)人員的現代負載測試工具

K6 是一個開源負載測試工具，可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上，它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序，包括 Web
.NET 程序的 GDI 句柄泄露的再反思

一、背景1. 講故事上個月我寫過一篇如何洞察 C# 程序的 GDI 句柄泄露文章，當時用的是 GDIView + WinDbg 把問題搞定，前者用來定位泄露資源，后者用來定位泄露代碼，后面有朋友反
iQOO Neo8系列新品發(fā)布會

旗艦雙芯更強更Pro
iQOO Neo8系列今日官宣：首發(fā)天璣9200+ 全球安卓最強芯！

在昨日舉行的的聯發(fā)科新一代旗艦芯片天璣9200+的發(fā)布會上，iQOO官方也正式宣布，全新的iQOO Neo8系列新品將全球首發(fā)搭載這款當前性能最強大的移動平臺
上海舉辦人工智能大會活動，建設人工智能新高地

人工智能大會在上海浦江兩岸隆重拉開帷幕，人工智能新技術、新產品、新應用、新理念集中亮相。8月30日晚，作為大會的特色活動之一的上海人工智能發(fā)展盛典人工
北京：科技教育體驗基地開始登記

　　北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌，后續(xù)還將開展常態(tài)化登記。　　北京科技教育體驗基

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

AI算力巔峰之戰(zhàn)！Intel憑啥唯一能替代NVIDIA？獨有全平臺

K60至尊版剛預熱一加Ace2 Pro正面硬剛

5月安卓手機好評榜：魅族20 Pro奪冠

消息稱迪士尼要拍真人版《魔發(fā)奇緣》：女主可能也找黑人演員

K6：面向開發(fā)人員的現代負載測試工具

.NET 程序的 GDI 句柄泄露的再反思

iQOO Neo8系列新品發(fā)布會

iQOO Neo8系列今日官宣：首發(fā)天璣9200+ 全球安卓最強芯！

上海舉辦人工智能大會活動，建設人工智能新高地

北京：科技教育體驗基地開始登記

最新推薦

猜你喜歡

熱門推薦

相關資訊