AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

PyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

來源: 責編: 時間:2024-10-05 19:24:56 65觀看
導讀 10 月 2 日消息,據 PyTorch 新聞稿,PyTorch 旗下架構優化庫 torchao 現已正式發布,該優化庫主要專注于模型的量化和稀疏性優化,能夠在保證性能的同時降低模型的計算成本和 RAM 用量,從而提升模型運行效率,附 GitHub

10 月 2 日消息,據 PyTorch 新聞稿,PyTorch 旗下架構優化庫 torchao 現已正式發布,該優化庫主要專注于模型的量化和稀疏性優化,能夠在保證性能的同時降低模型的計算成本和 RAM 用量,從而提升模型運行效率,附 GitHub 頁面地址(點此訪問)。XGb28資訊網——每日最新資訊28at.com

據介紹,torchao 提供了一系列優化工具集,可以幫助 LLaMA 3等流行的 AI 模型提升性能,其支持 float8、int4 等低精度數據類型,能夠有效減少硬件開銷和RAM用量。XGb28資訊網——每日最新資訊28at.com

XGb28資訊網——每日最新資訊28at.com

官方舉例,在 LLaMA 3 70B 模型的預訓練中,torchao 提供的 float8 訓練流程可將模型計算速度提升 1.5 倍。開發者只需利用 convert_to_float8_training 函數,即可將模型訓練轉換為 float8,從而輕松實現模型高效訓練。XGb28資訊網——每日最新資訊28at.com

在推理方面,torchao 提供多種量化方法,包括權重量化(Weight-Only Quantization)和動態激活量化(Dynamic Activation Quantization),用戶可以自有選擇適合的量化策略,以獲得最佳的模型推理性能。XGb28資訊網——每日最新資訊28at.com

在稀疏性優化方面,torchao 可以優化模型參數計算效率,據稱可讓 ViT-H 模型的推理速度提升 5%。同時,torchao 還可以將權重量化為 int4,并將鍵值緩存量化為 int8,可令 LLaMA 3.1 8B 在完整的 128K 上下文長度下僅占用 18.9GB 的顯存。XGb28資訊網——每日最新資訊28at.com

XGb28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8027-0.htmlPyTorch 架構優化庫 torchao 正式發布,可大幅提升 AI 模型效率

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 發布 Realtime API,助力第三方應用集成其語音合成技術

下一篇: 非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

標簽:
  • 熱門焦點
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內容~大家掌聲歡迎~~~本次更
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 中國區塊鏈產業生態地圖報告(2021)

    區塊鏈是技術整合創新、金融創新、組織方式創新、產業應用創新的多維度創新,以服務實體經濟、政務民生以及公共服務等領域為落腳點,以期實現整個地區和產業的資
  • 《刀劍神域》VR展開幕;《Puzzling Places》發布第二個付費DLC

    今日熱點:《刀劍神域:Ex-Chronicle Online Edition》VR展開幕;虛擬活動平臺EventX再獲800萬美元B輪融資;VR射擊游戲《Outlier》確認將于3月17日登陸Steam平臺等。
  • 韓國國民銀行將推出韓國首個加密貨幣 ETF

    韓國國民銀行(Kookmin Bank)計劃發行該國首個以散戶投資者為主要關注點的加密貨幣投資基金。根據公告,該銀行正在等待政府批準,并已建立一個準備就緒的數字資產
  • 量子計算在未來能否提高區塊鏈技術的效率

    區塊鏈技術的主要成功之處在于對不透明的金融流程進行了去中心化的訪問量子計算機的內在目標是解決傳統計算機不可能解決的問題隨著區塊鏈技術的使用案例逐漸
  • 參加元宇宙里的招聘會是什么樣一種體驗?

    求職者可以在活動中走動,就像他們在現實生活中一樣。長話短說看亮點:招聘公司Hirect為Y-combinator支持的初創公司舉辦了一場元宇宙招聘會。這里有一個大廳、一
  • 知識產權可能在元宇宙中“消失”?

    開篇老雅痞先來劃重點:一些公司開始采取積極的方式來保護他們在元宇宙的知識產權。耐克、愛馬仕和米拉麥克斯最近提起訴訟,聲稱NFT侵犯了他們的知識產權。Inside
  • 虛擬人的3大紀律和6種品牌孵化模式

    作者:陳格雷(老小格)及團隊虛擬人很熱,我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點,整理出6種最主要的品牌虛擬人模式,后面一一介紹。
Top