AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 手機

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構

來源: 責編: 時間:2025-02-05 15:43:37 42觀看
導讀 快科技2月5日消息,華為(昇騰+CANN)+Deepseek,能解決英偉達GPU+CUDA的“卡脖子”嗎?據tomshardware等多家媒體報道,華為新的AI處理器昇騰910C(Ascend 910C)的推理性能已達NVIDIA H100 GPU的六成。根據Deep

快科技2月5日消息,華為(昇騰+CANN)+Deepseek,能解決英偉達GPU+CUDA的“卡脖子”嗎?ACK28資訊網——每日最新資訊28at.com

據tomshardware等多家媒體報道,華為新的AI處理器昇騰910C(Ascend 910C)的推理性能已達NVIDIA H100 GPU的六成。ACK28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構ACK28資訊網——每日最新資訊28at.com

根據DeepSeek 研究人員的測試,在推理任務中,昇騰910C性能可達H100的60%。據悉,升騰910C采用chiplet封裝,第二代7nm級(N+2)工藝,整合約530億個晶體管。 ACK28資訊網——每日最新資訊28at.com

雖然昇騰910C并非當前強AI芯片,但它有助于降低中國對NVIDIA GPU的依賴。ACK28資訊網——每日最新資訊28at.com

此外,通過手動優化CANN內核,其效率可以進一步提高。DeepSeek對昇騰處理器及其 PyTorch存儲庫的原生支持允許以小的的資源代價,實現CUDA到CANN的無縫轉換,從而更容易將華為的硬件集成到AI工作流程中。ACK28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構ACK28資訊網——每日最新資訊28at.com

據了解,DeepSeek的支持為華為芯片帶來了關鍵優勢:從第一天起就支持華為昇騰芯片,自主維護PyTorch倉庫,只需一行代碼就能將CUDA轉換為CANN;而且性能優化潛力巨大,通過定制優化可達到更高性能。ACK28資訊網——每日最新資訊28at.com

據華為官網介紹,CANN(Compute Architecture for Neural Networks)是昇騰針對AI場景推出的異構計算架構,對上支持多種AI框架,對下服務AI處理器與編程,發揮承上啟下的關鍵作用,是提升昇騰AI處理器計算效率的關鍵平臺。同時針對多樣化應用場景,提供高效易用的編程接口,支持用戶快速構建基于昇騰平臺的AI應用和業務。ACK28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構ACK28資訊網——每日最新資訊28at.com

據了解,CANN分社區版和商用版。前者是快速提供新特性的體驗版,供開發者提前試用;而后者是滿足商用標準的穩定版本。ACK28資訊網——每日最新資訊28at.com

目前,CANN社區版已經來到了8.0.0.alpha003版本,針對Ascend C進行了特性增強。而商用版CANN 8.0.RC3版本也已經發布,新增適配7個操作系統,簡化了CANN安裝流程。ACK28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構ACK28資訊網——每日最新資訊28at.com

DeepSeek的Yuchen Jin表示,長期訓練可靠性是中國處理器的一個關鍵弱點。ACK28資訊網——每日最新資訊28at.com

主要是NNVIDIA硬件和軟件生態系統的深度集成,該生態系統已經發展了二十多年。雖然推理性能可以優化,但持續的訓練工作負載需要華為的硬件和軟件堆棧進一步改進。ACK28資訊網——每日最新資訊28at.com

而隨著AI模型架構向Transformer收斂,CUDA和PyTorch編譯器的重要性將降低。DeepSeek團隊的加入將顯著降低對NVIDIA的依賴,大幅節省成本。ACK28資訊網——每日最新資訊28at.com

華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構ACK28資訊網——每日最新資訊28at.com

無獨有偶。此前有消息稱,DeepSeek開發的大語言模型繞過了英偉達的CUDA框架,正為未來兼容國產GPU芯片做準備。ACK28資訊網——每日最新資訊28at.com

新發現顯示,DeepSeek使用英偉達的H800芯片訓練時,使用英偉達底層硬件指令PTX(Parallel Thread Execution)語言,而非高級編程語言CUDA。ACK28資訊網——每日最新資訊28at.com

這樣意味著DeepSeek繞過了CUDA,使用更底層的編程語言做優化。ACK28資訊網——每日最新資訊28at.com

對于程序開發人員來說,CUDA是一種更加友好的高級語言,開發者只需要專注于程序和算法相關的運行邏輯,而不太需要考慮具體的程序是如何在GPU等硬件上具體如何執行計算的,從而能夠降低開發難度。ACK28資訊網——每日最新資訊28at.com

而PTX在接近匯編語言的層級運行,允許進行細粒度的優化,如寄存器分配和Thread / Warp級別的調整。這種編程非常復雜且難以維護,所以行業通用的做法是使用CUDA這樣的高級編程語言。ACK28資訊網——每日最新資訊28at.com

換句話說,DeepSeek把優化做到了極致。ACK28資訊網——每日最新資訊28at.com

北京航空航天大學副教授黃雷表示,繞過CUDA可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細粒度的操作。ACK28資訊網——每日最新資訊28at.com

這也說明DeepSeek擁有一些擅長寫PTX語言的內部開發者。假如它之后使用國產GPU,其在硬件適配方面將會更得心應手,其只要了解這些硬件驅動提供的一些基本函數接口就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產硬件。ACK28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-22-128723-0.html華為與DeepSeek聯手會發生什么:算力已達英偉達60%、CANN取代CDUA架構

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OPPO Find N5官宣:全球薄折疊屏 兩周后亮相

下一篇: 小米手機官方換電池限時8折:79.2元起!覆蓋38款機型

標簽:
  • 熱門焦點
Top