AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 數碼

國產GPU進化!打造先進好用的“AI訓練工廠”

來源: 責編: 時間:2025-07-30 14:22:44 39觀看
導讀 我們正站在AI狂飆的黃金時代——短短半年,全球頂尖模型“智力”飆升50%;2025年幾乎每周都有重磅模型登場;從大語言模型到多模態架構,七類模型架構全速迭代。當傳統“暴力堆卡”

我們正站在AI狂飆的黃金時代——短短半年,全球頂尖模型“智力”飆升50%;2025年幾乎每周都有重磅模型登場;從大語言模型到多模態架構,七類模型架構全速迭代。MoQ28資訊網——每日最新資訊28at.com

當傳統“暴力堆卡”的訓練模式,越來越難以滿足指數級增長的智能生產需求。AI產業亟需要一場“效率革命”,即構建新一代大型人工智能計算基礎設施,以應對生成式AI進化。MoQ28資訊網——每日最新資訊28at.com

國內GPU廠商摩爾線程在WAIC 2025前夕出招了,要用國產全功能GPU打造一個AI“超級工廠”,直擊大模型訓練效率的瓶頸。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

這座AI工廠的“產能”,有一道硬核公式來衡量:MoQ28資訊網——每日最新資訊28at.com

AI工廠生產效率 = 加速計算通用性 x 單芯片有效算力 × 單節點效率 × 集群效率 × 集群穩定性MoQ28資訊網——每日最新資訊28at.com

摩爾線程的殺手锏“全功能GPU”,就是這座“AI工廠”的心臟。MoQ28資訊網——每日最新資訊28at.com

根據功能結構劃分,GPU可分為圖形GPU、GPGPU(通用計算GPU)與全功能GPU。既然是全功能GPU,你可以理解為,既能做圖形,也能做AI,還可以做通用計算、科學計算等。全球范圍內,也僅有NVIDIA掌握的尖端技術。而摩爾線程是國內唯一從功能上可以對標英偉達的國產全功能GPU企業。MoQ28資訊網——每日最新資訊28at.com

自2020年成立以來,摩爾線程一直致力于全功能GPU的研發與創新。全功能GPU具備更強的通用性,不僅可以服務數據中心,也具備下沉至消費端的潛力,是真正的全能型選手。MoQ28資訊網——每日最新資訊28at.com

截至目前,摩爾線程已完成了四代全功能GPU的迭代,其中包括支持FP8精度的新智算卡MTT S5000、訓推一體全功能智算卡MTT S4000、支持千卡互聯的第一代超大規模智算融合中心產品KUAE1,以及第二代萬卡集群KUAE2,這些產品已實際交付多個智算中心。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

那么,摩爾線程如何打造世界先進的AI工廠?MoQ28資訊網——每日最新資訊28at.com

這是一項系統級創新工程,主要體現在五個關鍵方面:加速計算通用性、單芯片有效算力、單節點效率、集群效率和集群穩定性,這些因素環環相扣缺一不可。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

在加速計算通用性方面,摩爾線程自主研發的多引擎全功能GPU,率先實現在單芯片架構,同時支持AI計算加速、圖形渲染、物理仿真和科學計算、超高清視頻編解碼,并覆蓋從FP8到FP64的全計算精度。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

不同精度的計算適用于不同的應用場景,例如FP8用于混合精度訓練和大語言模型推理,INT8用于量化推理和CV推理,BF16/FP16用于機器學習和大語言模型訓練,FP32/TF32用于3D渲染、游戲和高精度推理訓練等,而FP64則主要用于科學計算,如天氣預報和氣候仿真等。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

摩爾線程的全功能GPU能夠支持以上全部精度的訓練推理,從而實現AI訓練推理、科學計算、工業智能、自動駕駛、具身智能、生物制藥、AIGC、AI智能體、游戲等全場景AI加速。MoQ28資訊網——每日最新資訊28at.com

有了應用場景,性能跟不上那也是白搭,摩爾線程自研的MUSA架構從底層基礎設施到中間層管理平臺,再到上層應用,實現了全面覆蓋,通過計算、通信、存儲技術創新,有效提升了單芯片有效算力。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

MUSA架構,是創新的多引擎、可伸縮GPU架構,通過硬件資源池化及動態資源調度技術,構建了全局共享的計算、內存與通訊資源池。這一設計不僅突破了傳統GPU功能單一的限制,還在保障通用性的同時顯著提升了資源利用率。MoQ28資訊網——每日最新資訊28at.com

在計算層面,摩爾線程的AI加速系統(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多種混合精度計算。作為國內首批實現FP8算力量產的GPU廠商,其FP8技術通過快速格式轉換、動態范圍智能適配和高精度累加器等創新設計,在保證計算精度的同時,將Transformer計算性能提升約30%。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

此外,DeepSeek曾在技術報告中提到,在通信過程中約15%的流式多處理器被占用,也就是差不多15%的算力沒有用到訓練中,而是被用于通信。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

摩爾線程是如何解決這個問題的呢,基于自研的MTLINK 2.0實現的集合通信庫,實現卡間高速互聯,高出國內行業平均水平60%的帶寬;同時基于MTT S5000的異步通信引擎,從而實現高效計算與通信并行,減少了15%的計算資源損耗,為大規模集群部署奠定了堅實基礎。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

內存系統方面,通過多精度近存規約引擎、低延遲Scale-Up、通算并行資源隔離等技術,實現了50%的帶寬節省和60%的延遲降低。MoQ28資訊網——每日最新資訊28at.com

有了單芯片的算力,還需要實現單節點的高效率,摩爾線程的MUSA全棧系統軟件,通過高效的基礎軟件庫,框架算法創新和完備的開發工具鏈提升了單節點計算效率。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

在GPU驅動任務調度優化方面,摩爾線程的核函數啟動時間僅為業界平均耗時的1/2,核函數啟動是指計算任務從CPU主機傳輸到GPU設備并執行的過程,傳統方法中,較高的啟動延遲會導致算力資源浪費。而摩爾線程則支持千次計算指令并行下發,從而大幅減少GPU等待時間。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

摩爾線程還對核心算子庫進行了極致優化,比如GEMM算子算力利用率達98%,Flash Attention 算子算力利用率突破95%。MoQ28資訊網——每日最新資訊28at.com

在通信效率上,MCCL通信庫實現RDMA網絡97%帶寬利用率;基于異步通信引擎優化計算通信并行,集群性能提升10%。MoQ28資訊網——每日最新資訊28at.com

在開發生態兼容上,基于Triton-MUSA編譯器 + MUSA Graph 實現DeepSeek R1推理加速1.5倍,全面兼容Triton等主流框架。MoQ28資訊網——每日最新資訊28at.com

此外,摩爾線程還提供了完整的開發者工具套件,如深度監控GPU并收集硬件性能數據的Torch Profiler,以及可以一鍵部署MUSA軟件棧和AI服務程序的MUSA Deploy等。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

正是這種軟硬協同與系統優化,實現了極致性能和效率,從平湖和國際主流GPU產品的實測對比數據中,我們可以直觀地看到摩爾線程產品的優勢。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

在集群方面,如前文所述,摩爾線程擁有支持千卡互聯的KUAE1和支持萬卡互聯的第二代方案KUAE2,并實現了模型種類全支持,無論何種類型的模型都能適用,這也是真正滿足AI工廠使用和實現的地方。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

根據官方分享的數據,KUAE2在不同架構模型的實測MFU數據對比中,性能和效率均處于行業領先水平。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

后也是重要的一點,那就是穩定性,集群不穩定的話,再高的性能再快的效率也沒有任何意義,為此摩爾線程推出了零中斷容錯技術,故障發生時僅隔離受影響節點組,其余節點繼續訓練,備機無縫接入,全程無中斷,這也使得KUAE集群有效訓練時間占比超99%。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

針對集群中的慢節點,摩爾線程開發了一套多維度Training Insight,將異常處理效率提升了50%,結合集群巡檢與起飛檢查,訓練成功率及速度提高了10%。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

綜合來看,摩爾線程的高效AI工廠結合了全功能GPU、MUSA架構、MUSA軟件棧、KUAE集群和零中斷技術,為AI大模型訓練提供了強大可靠的基礎設施支持,而且只有這樣的組合,才能確保每一個環節都達到佳狀態。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

大模型訓練完成后,還需要進行推理驗證,摩爾線程的推理解決方案基于MT Transformer自研推理引擎、TensorX自研推理引擎和vLLM-MUSA推理框架,為模型驗證和部署提供極致性能支持。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

通過實測,MTT S5000樹立了DeepSeek全量模型推理速度的新標桿:跑滿血DeepSeek R1推理模型,速度達到100 tokens/s。MoQ28資訊網——每日最新資訊28at.com

國產GPU進化!打造先進好用的“AI訓練工廠”MoQ28資訊網——每日最新資訊28at.com

GPU可以說是AI時代稀缺的資源之一,也是大國科技競爭的焦點,其重要性不言而喻。我們深知硬科技研發的艱難,但摩爾線程還是選擇了通用性強、難度高的全功能GPU路線。MoQ28資訊網——每日最新資訊28at.com

從全功能GPU的研發,到“AI工廠”概念的提出與實踐,摩爾線程這條道路雖然充滿挑戰,但它無疑是能夠走得長遠的路徑。未來,我們期待摩爾線程能夠持續突破技術瓶頸,以更強大的算力、更高效的架構、更穩定的性能,為國產AI的發展注入強勁動力。MoQ28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-24-174289-0.html國產GPU進化!打造先進好用的“AI訓練工廠”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 15999元碾壓10萬!當貝S7 Ultra Max發布:5800 CVIA行業亮、高對比度

下一篇: 中國首款6nm游戲GPU發布 性能超越RTX 4060

標簽:
  • 熱門焦點
  • Find N3入網:最高支持16+1TB

    OPPO將于近期登場的Find N3折疊屏目前已經正式入網,型號為PHN110。本次Find N3在外觀方面相比前兩代有很大的變化,不再是小號的橫向折疊屏,而是跟別的廠商一樣采用了較為常見的
  • 一加Ace2 Pro真機揭曉 鈦空灰配色質感拉滿

    終于,在經過了幾波預熱之后,一加Ace2 Pro的外觀真機圖在網上出現了。還是博主數碼閑聊站曝光的,這次的外觀設計還是延續了一加11的方案,只是細節上有了調整,例如新加入了鈦空灰
  • 紅魔電競平板評測:大屏幕硬實力

    前言:三年的疫情因為要上網課的原因激活了平板市場,如今網課的時代已經過去,大家的生活都恢復到了正軌,這也就意味著,真正考驗平板電腦生存的環境來了。也就是面對著這種殘酷的
  • 6月安卓手機好評榜:魅族20 Pro蟬聯冠軍

    性能榜和性價比榜之后,我們來看最后的安卓手機好評榜,數據來源安兔兔評測,收集時間2023年6月1日至6月30日,僅限國內市場。第一名:魅族20 Pro好評率:95%5月份的時候魅族20 Pro就是
  • 6月安卓手機性能榜:vivo/iQOO霸占旗艦排行榜前三

    2023年上半年已經正式過去了,我們也迎來了安兔兔V10版本,在新的驍龍8Gen3和天璣9300發布之前,性能榜的榜單大體會以驍龍8Gen2和天璣9200+為主,至于那顆3.36GHz的驍龍8Gen2領先
  • 印度登月最關鍵一步!月船三號今晚進入環月軌道

    8月5日消息,據印度官方消息,月船三號將于北京時間今晚21時30分左右開始近月制動進入環月軌道。這是該探測器能夠成功的最關鍵步驟之一,如果成功將開始圍
  • 只需五步,使用start.spring.io快速入門Spring編程

    步驟1打開https://start.spring.io/,按照屏幕截圖中的內容創建項目,添加 Spring Web 依賴項,并單擊“生成”按鈕下載 .zip 文件,為下一步做準備。請在進入步驟2之前進行解壓。圖
  • 東方甄選單飛:有些鳥注定是關不住的

    作者:彭寬鴻來源:華爾街科技眼‍‍‍‍‍‍‍‍‍‍東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一
  • 蘋果140W USB-C充電器:采用氮化鎵技術

    據10 月 30 日 9to5 Mac 消息報道,當蘋果推出新的 MacBook Pro 2021 時,該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機型的盒子里,也支
Top