4 月 10 日消息,在今日舉行的華為云生態(tài)大會 2025 上,華為常務董事、華為云計算 CEO 張平安公布了 AI 基礎設施架構(gòu)進展,推出 CloudMatrix 384 超節(jié)點,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
據(jù)介紹,華為云 CloudMatrix 384 超節(jié)點可實現(xiàn)從服務器級到矩陣級的資源供給模式轉(zhuǎn)變,具備“高密”“高速”“高效”的特點,通過架構(gòu)創(chuàng)新,在算力、互聯(lián)帶寬、內(nèi)存帶寬等方面實現(xiàn)領先。
華為云還表示,對昇騰 AI 云服務進行持續(xù)優(yōu)化,目前其已全面適配包含 DeepSeek 在內(nèi)的 160 多個第三方大模型,為大模型訓推提供可靠保障,支撐行業(yè)應用快速落地。此外,華為云盤古大模型已在 30 多個行業(yè)、400 多個場景中落地,在城市治理、智慧金融、醫(yī)療健康、氣象預測等領域廣泛應用。
IT酷哥注意到,硅基流動今日也宣布聯(lián)合華為云基于 CloudMatrix 384 超節(jié)點昇騰云服務和高性能推理框架 SiliconLLM ,用大規(guī)模專家并行最佳實踐正式上線 DeepSeek-R1。
硅基流動介紹稱,該服務在保證單用戶 20 TPS 水平前提下,單卡 Decode 吞吐突破 1920 Tokens / s,可比肩 H100 部署性能。同時,經(jīng)過主流測試集驗證及大規(guī)模線上盲測,在昇騰算力部署 DeepSeek-R1 的模型精度與 DeepSeek 官方保持一致。
本文鏈接:http://www.tebozhan.com/showinfo-26-143080-0.html華為云發(fā)布 CloudMatrix 384 超節(jié)點,硅基流動宣布上線對應 DeepSeek-R1
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 海辰儲能∞Cell 587Ah 電池登場 或?qū)⒊蔀榇笕萘績δ茈姵爻叽缧聵藴?/a>
下一篇: 鴻蒙生態(tài)邁入規(guī)模化發(fā)展新階段 華為云與終端云協(xié)同釋放產(chǎn)業(yè)新動能