AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 知識百科

霸榜GitHub熱門第一多日后,Colossal-AI正式版發布

來源: 責編: 時間:2023-08-07 16:30:08 293觀看
導讀 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。大規模并行AI訓練系統Colossal-AI,旨在作為深度學習框架的內核,幫助用戶便捷實現最大化提升AI部署效率,同時最小

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。7Nn28資訊網——每日最新資訊28at.com

大規模并行AI訓練系統Colossal-AI,旨在作為深度學習框架的內核,幫助用戶便捷實現最大化提升AI部署效率,同時最小化部署成本。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

開源地址:https://github.com/hpcaitech/ColossalAI7Nn28資訊網——每日最新資訊28at.com

Colossal-AI一經開源便受到廣泛關注,連續多日登頂GitHub熱榜Python方向世界第一,與眾多已有數萬star的明星開源項目一起受到海內外關注!7Nn28資訊網——每日最新資訊28at.com

經過開發者們的不斷努力,Colossal-AI在數月的密集測試后迎來正式版!此版本由300多次commits組成。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

本次正式版更新重點優化了分布式訓練性能及開發者的易用性,主要亮點包括:7Nn28資訊網——每日最新資訊28at.com

重構ZeRO以改善性能和易用性;添加細粒度Profiler TensorBoard監控插件,監測訓練過程中內存、網絡等狀態;更靈活的checkpoint策略,可擴展的pipeline模塊;開源蛋白質預測FastFold等豐富行業解決方案;添加中文教程,MOE、BERT等實例,開放用戶社群及論壇。專業助力大模型訓練7Nn28資訊網——每日最新資訊28at.com

近年來,隨著深度學習的興起及大模型橫掃各大性能榜單,前沿AI模型的大小在短短幾年內便已增大萬倍,遠超硬件數倍的緩慢增長。前沿AI大模型不僅遠超單個GPU的容納能力,所需算力也往往需要單個GPU運行數百甚至上千年。7Nn28資訊網——每日最新資訊28at.com

因此,如何提升單個GPU的容納能力,如何高效利用分布式技術,聯合多個GPU低成本實現并行訓練加速已成為AI大模型的關鍵痛點。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

針對現有方案并行維度有限、效率不高、通用性差、部署困難、缺乏維護等痛點,Colossal-AI通過高效多維并行、顯存優化、大規模優化庫、細粒度監測等方式,讓用戶僅需極少量修改,即可高效快速部署AI大模型訓練。7Nn28資訊網——每日最新資訊28at.com

多維并行7Nn28資訊網——每日最新資訊28at.com

相比現有方案中并行維度僅包括數據并行、一維張量并行、流水并行三種方案,Colossal-AI進一步提供2/2.5/3維張量并行和序列并行,以及便捷的多維混合并行解決方案。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△ViT張量并行為64時,可提升14倍批大小和5倍訓練速度7Nn28資訊網——每日最新資訊28at.com

其中,高維張量并行能極大減輕顯存消耗,提升通信效率,使得計算資源利用更加高效。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△序列并行幫助BERT提升2倍訓練速度,或1.5倍序列長度7Nn28資訊網——每日最新資訊28at.com

而序列并行針對大圖片、視頻、長文本、長時間醫療監測等數據,可以幫助突破原有機器能力限制,直接處理長序列數據。7Nn28資訊網——每日最新資訊28at.com

顯存優化7Nn28資訊網——每日最新資訊28at.com

Colossal-AI綜合了多重顯存優化技術,包含多維并行,ZeRO冗余內存消除,CPU offload,Gradient Checkpoint,自動混合精度(AMP)等前沿技術,最大限度幫助用戶避免顯存瓶頸,降低訓練的硬件需求。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△GPT-2使用Colossal-AI,同樣硬件下提升24倍可訓練模型大小,或3倍訓練速度7Nn28資訊網——每日最新資訊28at.com

靈活易用7Nn28資訊網——每日最新資訊28at.com

Colossal-AI接口設計與PyTorch風格保持一致,降低學習和使用成本,僅需極少量修改,便可將已有項目與Colossal-AI結合,便捷擴展至大規模并行。此外,該系統還保持了優秀的擴展性,便于根據需求添加新功能,與已有功能模塊兼容。7Nn28資訊網——每日最新資訊28at.com

細粒度監測:細粒度Profiler TensorBoard插件,相較于PyTorch僅能以iteration為單位進行記錄訓練過程,Colossal-AI能夠監測iteration內的網絡、通信、內存等狀態,方便開發者進行精確分析和調試,提高開發效率。7Nn28資訊網——每日最新資訊28at.com

大規模優化庫:Colossal-AI提供大規模并行優化器LAMB、LARS等,首次將訓練batch size擴展到65536。Colossal-AI還與PyTorch自帶各類optimizer兼容,并不斷探索添加最新前沿優化技術,滿足各類模型需求。7Nn28資訊網——每日最新資訊28at.com

豐富的行業解決方案7Nn28資訊網——每日最新資訊28at.com

Colossal-AI目前已與自動駕駛、云計算、零售、醫藥、芯片等行業知名廠商達成合作,與AI領域頂級開源組織Hugging Face等建立合作。7Nn28資訊網——每日最新資訊28at.com

蛋白質結構預測加速方案:FastFold7Nn28資訊網——每日最新資訊28at.com

AlphaFold因強大的AI預測蛋白質結構能力被Science和Nature評選為2021年十大科學突破之首,但存在訓練時間長、成本高等問題。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△圖片來源:https://arxiv.org/pdf/2203.00854.pdf7Nn28資訊網——每日最新資訊28at.com

基于Colossal-AI的加速方案FastFold,將GPU優化和大模型訓練技術引入AlphaFold的訓練和推理,成功超越谷歌和哥倫比亞大學的方案,將AlphaFold訓練時間從11天減少到67小時,且總成本更低,在長序列推理中也實現9.3~11.6倍的速度提升。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△長序列推理性能對比7Nn28資訊網——每日最新資訊28at.com

半數GPU訓練GPT-37Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

對于超大AI模型,如GPT-3,相比英偉達方案,Colossal-AI僅需一半的計算資源,即可啟動訓練;若使用相同計算資源,則能提速11%,可降低GPT-3訓練成本超百萬美元。7Nn28資訊網——每日最新資訊28at.com

Colossal-AI注重開源社區建設,提供中文教程,開放用戶社群及論壇,對于用戶反饋進行高效交流與迭代更新,不斷添加MoE等前沿應用。7Nn28資訊網——每日最新資訊28at.com

項目團隊7Nn28資訊網——每日最新資訊28at.com

潞晨技術團隊的核心成員均來自美國加州大學伯克利分校,斯坦福大學,清華大學,北京大學,新加坡國立大學,新加坡南洋理工大學等國內外知名高校;擁有Google Brain、IBM、Intel、 Microsoft、NVIDIA等知名廠商工作經歷。公司成立即獲得創新工場、真格基金等多家頂尖VC機構種子輪投資。7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△潞晨科技創始人尤洋教授:加州大學伯克利分校博士、IPDPS/ICPP最佳論文、ACM/IEEE George Michael HPC Fellowship、福布斯30歲以下精英(亞洲 2021)、IEEE-CS超算杰出新人獎、UC伯克利EECS Lotfi A. Zadeh優秀畢業生獎7Nn28資訊網——每日最新資訊28at.com

7Nn28資訊網——每日最新資訊28at.com

△潞晨CSO Prof. James Demmel:加州大學伯克利分校杰出教授、ACM/IEEE Fellow,美國科學院、工程院、藝術與科學院三院院士7Nn28資訊網——每日最新資訊28at.com

傳送門7Nn28資訊網——每日最新資訊28at.com

論文地址:https://arxiv.org/abs/2110.148837Nn28資訊網——每日最新資訊28at.com

項目地址:https://github.com/hpcaitech/ColossalAI7Nn28資訊網——每日最新資訊28at.com

文檔地址:https://www.colossalai.org/7Nn28資訊網——每日最新資訊28at.com

 7Nn28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-119-2261-0.html霸榜GitHub熱門第一多日后,Colossal-AI正式版發布

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 使用Linode引擎實現Kubernetes自動縮放的優秀實踐 譯文

下一篇: 使用 Howdy 為 Linux 增加人臉識別登錄

標簽:
  • 熱門焦點
  • 7月安卓手機性價比榜:努比亞+紅魔兩款新機入榜

    7月登場的新機有努比亞Z50S Pro和紅魔8S Pro,除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產品,而且努比亞和紅魔也一貫有著不錯的性價比,所以在本次的性價比榜單
  • K6:面向開發人員的現代負載測試工具

    K6 是一個開源負載測試工具,可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上,它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序,包括 Web
  • 得物效率前端微應用推進過程與思考

    一、背景效率工程隨著業務的發展,組織規模的擴大,越來越多的企業開始意識到協作效率對于企業團隊的重要性,甚至是決定其在某個行業競爭中突圍的關鍵,是企業長久生存的根本。得物
  • 微信語音大揭秘:為什么禁止轉發?

    大家好,我是你們的小米。今天,我要和大家聊一個有趣的話題:為什么微信語音不可以轉發?這是一個我們經常在日常使用中遇到的問題,也是一個讓很多人好奇的問題。讓我們一起來揭開這
  • WebRTC.Net庫開發進階,教你實現屏幕共享和多路復用!

    WebRTC.Net庫:讓你的應用更親民友好,實現視頻通話無痛接入! 除了基本用法外,還有一些進階用法可以更好地利用該庫。自定義 STUN/TURN 服務器配置WebRTC.Net 默認使用 Google 的
  • 雅柏威士忌多款單品價格大跌,泥煤頂流也不香了?

    來源 | 烈酒商業觀察編 | 肖海林今年以來,威士忌市場開始出現了降溫跡象,越來越多不斷暴漲的網紅威士忌也開始悄然回歸市場理性。近日,LVMH集團旗下蘇格蘭威士忌品牌雅柏(Ardbeg
  • 阿里大調整

    來源:產品劉有媒體報道稱,近期淘寶天貓集團啟動了近年來最大的人力制度改革,涉及員工績效、層級體系等多個核心事項,目前已形成一個初步的“征求意見版”:1、取消P序列
  • 小米MIX Fold 3下月亮相:今年唯一無短板的全能折疊屏

    這段時間以來,包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都有新的進展,其中榮耀、三星都已陸續發布了最新的折疊屏旗艦,尤其號榮耀Magi
  • 華為Mate60系列模具曝光:采用碩大圓形后置相機模組+拼接配色方案

    據此前多方爆料,今年華為將開始恢復一年雙旗艦戰略,除上半年推出的P60系列外,往年下半年的Mate系列也將迎來更新,有望在9-10月份帶來全新的華為Mate60
Top