當前位置：首頁 > 元宇宙 > AI

Meta 推出 Llama 3.2 1B 3B 模型量化版：功耗更低、可適用更多輕量移動設備

來源：責編：時間：2024-10-30 15:57:54 73觀看

導讀 10 月 27 日消息，繼今年 9 月開源 Llama 3.2 的 1B 與 3B 模型之后，Meta 于 10 月 24 日發布了這兩個模型的量化版本，量化后的模型大小平均減少了 56%，RAM 使用量平均減少了 41%，模型速度提高了 2 至 4 倍，同時降低

10 月 27 日消息，繼今年 9 月開源 Llama 3.2 的 1B 與 3B 模型之后，Meta 于 10 月 24 日發布了這兩個模型的量化版本，量化后的模型大小平均減少了 56%，RAM 使用量平均減少了 41%，模型速度提高了 2 至 4 倍，同時降低了功耗，使這些模型能夠部署到更多移動設備上。

注：模型量化（Model Quantization）就是通過各種訓練方式將浮點模型轉為定點模型，可以壓縮模型參數，降低模型的復雜性，以便于在更輕量的平臺運行。

Meta 表示，他們采用了量化感知訓練（Quantization-Aware Training，QAT）和后訓練量化（SpinQuant）兩種方法對模型進行量化，其中“量化感知訓練”更重視模型的準確性，而“后訓練量化”更強調模型的可移植性。

據介紹，研究人員一共為 Llama 3.2 的 1B 和 3B 模型各推出了兩款量化版本，分別為 Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA 和 Llama 3.2 3B SpinQuant。

Meta 聲稱，這些量化模型比非量化的 Llama BF16 模型速度更快，占用更少的 RAM，并且功耗更低，同時保持與 Llama BF16 版本幾乎相同的精度。

盡管量化后的 Llama 3.2 1B 和 3B 模型僅支持 8000 個 Token 的上下文（原版模型支持 12.8 萬個 Token），但 Meta 的測試發現，無論是 Llama QLoRA 還是 Llama SpinQuant 等量化版本的基準測試結果實際上與原來的 Llama BF16 版本相差不遠。

目前，Meta 已在一加12、三星 S24+/S22 及蘋果 iOS 設備（未公布具體型號）等移動平臺測試這些經過量化后模型，測試“運行結果良好”，研究人員未來還計劃通過神經處理單元（NPU）提升這些量化模型的性能。

本文鏈接：http://www.tebozhan.com/showinfo-45-9329-0.htmlMeta 推出 Llama 3.2 1B 3B 模型量化版：功耗更低、可適用更多輕量移動設備

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌 DeepMind 開源 SynthID Text 工具，可辨別 AI 生成的文字

下一篇：消息稱 Meta 正開發自家 AI 搜索引擎：追趕 OpenAI，降低對微軟、谷歌的依賴

標簽：

熱門焦點

元宇宙這一年：技術加速落地，助傳統行業走向新階段

美國當地時間1月8日，2023年CES（消費電子展覽會）完美落幕。而在這項一年一度的科技圈盛事中，元宇宙仍是主角和焦點之一。索尼在1月6日發布了備受關注的PS VR 2頭顯
元宇宙帶來沉浸式智能登錄？你學會了嗎？

備受資本市場寵愛的元宇宙概念，正掀起一番番波瀾。元宇宙作為虛實相融的互聯網應用和社會形態，與沉浸式體驗緊密相關。多重路徑，打造無感知沉浸式智能登錄《設計
挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“被曝光”的才是最吸引人的產品，相信有關注過蘋果硬件消息的朋友們都明白這樣的道理。往近了說有蘋果“即將發布”的iPhone SE 3和M2芯片，往遠了說有“折疊屏iP
“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

今日《元宇宙新鮮事》有：“元宇宙第一股”Roblox首份年報未達預期致盤后股價暴跌15.28%；YouTube宣布進軍區塊鏈和元宇宙；摩根大通成為首家進入元宇宙的銀行。【中
元宇宙是數字共識生態的集成邏輯表達

作者: 李鳴元宇宙是數字共識生態的集成邏輯表達，是以區塊鏈技術為核心的可信數字化價值交互網絡，是基于Web3.0技術體系和運作機制支撐下的數字新生態。本體論是
暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造，該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
解決NFT流動性問題：一文了解Floor DAO

流動性是證券市場上的一個術語，流動性是指資產在不影響其市場價格的情況下可以轉換為現成現金的效率，流動性最強的資產是現金本身。現在讓我們試著從流動性的角
以用戶為中心，Web3和區塊鏈如何將用戶放在首位

競爭優勢正在改變競爭優勢是每個企業都在努力爭取的，由谷歌、Facebook和Netflix等大型科技公司主導的市場中，兩大重要類別的競爭優勢十分突出。第一個競爭優勢來
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發，以保護用戶

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Meta 推出 Llama 3.2 1B 3B 模型量化版：功耗更低、可適用更多輕量移動設備

元宇宙這一年：技術加速落地，助傳統行業走向新階段

元宇宙帶來沉浸式智能登錄？你學會了嗎？

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“元宇宙第一股”Roblox首份年報未達預期，摩根大通成為首家進入元宇宙的銀行

元宇宙是數字共識生態的集成邏輯表達

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

解決NFT流動性問題：一文了解Floor DAO

以用戶為中心，Web3和區塊鏈如何將用戶放在首位

元宇宙需要的5個重要安全功能

最新推薦

風口已至，多領域平臺融入社交元素！

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

萬字專訪Vitalik Buterin：以太坊將成為主流和最安全的基礎層

Steam 禁止NFT和加密貨幣原因曝光

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

猜你喜歡

熱門推薦

相關資訊