新華網北京7月9日電(記者 陳聽雨) 實現"國產算力自主可控"是確保信息安全和經濟持續健康發展的關鍵,需要企業研發投入、人才培養以及創新生態構建等多方面的努力。7月5日,北電數智召開“前進·AI異構平臺”發布會。會上,政產學研各領域嘉賓從不同角度、不同層面出發,就優化算力資源配置,推動行業高質量發展提供了寶貴的思路和建議。
北京電子數智科技有限責任公司首席科學家竇德景教授對前進·AI異構計算平臺進行了介紹。
竇德景首先介紹了北電數智的產品矩陣,按照AI產業的技術棧,包括五大部分,分別是:星火智算、前進平臺、寶塔框架、垂類模型矩陣,以及紅湖數據可信空間。
他介紹,前進·AI異構計算平臺是一個算力納管、調度平臺,主要工作是對國產算力進行管理,保障這些國產芯片能夠有序、高效地為智算中心提供算力。
“前進·AI異構計算平臺堅持全棧國產化,旨在高效管理和調度多種類型AI計算資源,以滿足不同應用場景下的計算需求。”竇德景說。
同時,為加速人工智能產業發展,平臺還圍繞智算芯片、AI框架、基礎模型開展全面驗證,通過場景化牽引持續優化場景AI服務能力,推動AI芯片快速成熟,大模型場景加速市場化應用。
針對前進·AI異構計算平臺的技術領先性,竇德景稱,前進平臺可以實現對國產芯片的統一調度和納管,具體有三個技術特色:一是前進平臺可以納管多種國產算力芯片,實現算力統一管理,通過一個平臺就可以運維、管理多種國產算力。其次,前進平臺提供多種調度策略,充分發揮硬件能力,釋放智算中心產能,調度策略的優劣,尤其是精細化調度,可以提升智算中心的運行效率,效率越高也就意味著同樣的硬件設備可以服務更多的客戶。第三,平臺充分照顧廣大用戶的使用習慣,對智算中心進行云化管理,用戶可以像使用云資源一樣靈活、彈性的使用算力資源。
竇德景表示,目前,前進平臺已經可以納管、調度多種國產芯片,算力在前進平臺的管理下,可以更高效、穩定地為智算中心提供服務。用戶可以采用實例租用的形式,即在平臺上開一個虛擬機,自行部署開發環境。
此外,前進平臺還提供模型適配和遷移能力,平臺提供了一個適配層,可向上兼容Pytorch、DeepSpeed等開源框架,提供兼容這些框架的接口,向下自動適配用戶所選的國產算力,這樣就可以讓模型在多種國產算力之間自由的進行遷移,且這種遷移用戶是完全沒有感知的。
與此同時,前進平臺提供了類似生產環境的評測、適配、技術驗證平臺,可以評測國產芯片的基礎性能,給出近似生產的環境的真實評測、驗證數據。結合國內主流芯片能力以及大模型參數規模,以千卡混合集群構建近似生產環境驗證平臺,全面測評 “千億參數模型”、“復雜場景”、“規模化集群”下的性能表現,為業界提供權威參考,為萬卡萬億大模型的演進方向提供經驗。
這些查詢接口已正式發布,用戶可以通過北京數字經濟算力中心訪問。包括芯片的基礎性能、算力性能、負載性能等,都可進行評測和查詢。
竇德景表示,目前北電數智已經將前進平臺部署到北京數字經濟算力中心,一方面可以對外提供算力租用服務,另一方面可以提供適配以及迭代驗證服務。平臺初步具備國產“算力四力”迭代驗證條件,并進一步推進迭代驗證方法體系,形成業界認可的公正性、權威性測試認證品牌。
具體而言,何為“四力”呢?竇德景對此表示,一是算力,驗證確定小規模、中規模、大規模集群場景下,芯片的計算能力;二是聯力,驗證國產芯片生態算子情況,是否支持在指定、合理時間內完成對模型和業務的支持;三是生態力,驗證卡間通信、機間通信功能,配合網絡環境檢測國產算力網絡連接情況;四是供力,通過大規模芯片供應情況,檢測國產算力產能和供應鏈健康程度。
促進技術創新與產業協同,充分發揮國產化軟硬件協同優勢,以北電數智為代表的人工智能原生國企企業,未來將持續以創新驅動,共同拓展行業生態合作圈,持續賦能人工智能產業發展。
本文鏈接:http://www.tebozhan.com/showinfo-16-99878-0.html竇德景:“前進·AI異構計算平臺”推動大模型場景加速市場化應用
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com