7 月 20 日消息,在 2025 中國聯通合作伙伴大會期間,中國聯通研究院聯合上海人工智能實驗室等合作伙伴,于 7 月 19 日正式發布了全球最長距離大模型異構混訓試驗成果。
隨著人工智能技術的高速發展和大模型時代的加速來臨,模型訓練對算力基礎設施的高吞吐、低時延、高性能提出了更高要求。然而,當前算力資源呈現出異構化和多中心化的格局,面臨著跨域資源互聯互通機制不健全、長距離傳輸存在帶寬與時延瓶頸、異構資源統一調度與高效融合能力有限等挑戰。
在此背景下,中國聯通聯合上海人工智能實驗室,阿里云、浪潮、基流科技、加佳科技等行業合作伙伴,面向國產異構 GPU 環境,針對超大模型跨域訓練和碎片化算力整合需求,依托“算力智聯網 AINet”長距無損傳輸技術優勢,結合上海人工智能實驗室“DeepLink”超大規模跨域混訓技術方案,在上海臨港和山東濟南鮑山數據中心間構建長度超 1500 公里的跨域異構混訓系統。
從大會獲悉,通過自動調整多種并行策略和跨域收斂比下 MoE 模型和 Dense 模型的參數配置,聯合團隊完成了超 1500 公里跨域的千億參數 AI 大模型異構混訓試驗,經驗證等效算力可達單芯片單集群等效算力的 95% 以上。
在算力互聯層面,采用聯通自研內置長距 RDMA 協議棧的 RoCE 交換機,兼顧 DC 內和 DC 間高性能網絡需求;
在算力調度與資源管理層面,通過聯通“智馭”平臺實現對跨域網絡和集群的統一管控及任務調度;
在算力協同層面,基于 DeepLink 在訓練加速、異構通信、并行策略等核心技術,實現千億參數大模型在超長距離異構 GPU 環境下的高效訓練。
中國聯通表示,上述成果標志著中國聯通在算力基礎設施跨域協同調度、異構資源融合與高性能分布式訓練等關鍵領域實現了實質性技術突破,為下一代互聯網產業發展奠定基礎。
本文鏈接:http://www.tebozhan.com/showinfo-45-14793-0.html中國聯通發布全球最長距離大模型異構混訓成果:超 1500 公里跨域,僅損失不到 5% 算力
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com