當前位置：首頁 > 元宇宙 > AI

27B 顯存需求 54 → 14.1GB：谷歌發(fā)布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

來源：責編：時間：2025-04-22 07:26:17 72觀看

導讀 4 月 19 日消息，谷歌公司昨日（4 月 18 日）發(fā)布博文，發(fā)布了量化感知訓練（QAT）優(yōu)化版 Gemma 3 模型，在保持高質量的同時，降低內(nèi)存需求。谷歌上月推出 Gemma 3 開源模型，能在單臺 NVIDIA H100 GPU 上以 BFloat16（BF16）精度

4 月 19 日消息，谷歌公司昨日（4 月 18 日）發(fā)布博文，發(fā)布了量化感知訓練（QAT）優(yōu)化版 Gemma 3 模型，在保持高質量的同時，降低內(nèi)存需求。

谷歌上月推出 Gemma 3 開源模型，能在單臺 NVIDIA H100 GPU 上以 BFloat16（BF16）精度高效運行。

援引博文介紹，谷歌為響應用戶需求，致力于讓 Gemma 3 的強大性能適配普通硬件。量化技術是關鍵，通過降低模型參數(shù)的數(shù)值精度（如從 BF16 的 16 位降至 int4 的 4 位），類似圖像壓縮減少顏色數(shù)量，大幅減少數(shù)據(jù)存儲量。

以 int4 量化為例，Gemma 3 27B 顯存需求從 54GB 銳減至 14.1GB，Gemma 3 12B 則從 24GB 降至 6.6GB；Gemma 3 1B 僅需 0.5GB 顯存。

這意味著用戶可在桌面（NVIDIA RTX 3090）或筆記本（NVIDIA RTX 4060 Laptop GPU）上運行強大 AI 模型，甚至手機也能支持小型模型。

為避免量化導致性能下降，谷歌采用量化感知訓練（QAT）技術，在訓練過程中模擬低精度運算，確保模型在壓縮后仍保持高準確性。Gemma 3 QAT 模型在約 5000 步訓練中，將困惑度下降減少了 54%。

Ollama、LM Studio 和 llama.cpp 等主流平臺已集成該模型，用戶可通過 Hugging Face 和 Kaggle 獲取官方 int4 和 Q4_0 模型，輕松在 Apple Silicon 或 CPU 上運行。此外，Gemmaverse 社區(qū)提供了更多量化選項，滿足不同需求。

本文鏈接：http://www.tebozhan.com/showinfo-45-12448-0.html27B 顯存需求 54 → 14.1GB：谷歌發(fā)布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI 競賽壓力山大：Meta 被曝資金缺口，向微軟、亞馬遜求援

下一篇：微軟推動 AI 互操作性，發(fā)布兩大 MCP 服務器

標簽：

熱門焦點

虛擬人再升級，企業(yè)可以解放雙手了？

來源：伯虎財經(jīng)今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
拯救XR，蘋果力不從心

來源 | 光子星球撰文 | 文燁豪編輯 | 吳先之蘋果終于呈上了它的“答卷”。北京時間6月6日凌晨，蘋果2023年全球開發(fā)者大會（WWDC）如期舉行。作為蘋果CEO庫克口中&ld
2022 區(qū)塊鏈 50 強榜單；垃圾NFT項目的十三個特性

本期關鍵字TerraZero在Decentraland完成元宇宙住房抵押貸款；騰訊發(fā)行齊白石畫作數(shù)字藏品；Ripple成為數(shù)字歐元協(xié)會成員；Gem上線稀有度排名功能；2022 區(qū)塊鏈 50 強榜
傳騰訊已推出全新XR業(yè)務；摩托羅拉正打造5GXR頸戴式計算組件

今日熱點：傳騰訊已推出全新XR業(yè)務；摩托羅拉與Verizon合作打造5G XR頸戴式計算組件；小米AR購物導航專利獲授權；VR一體機Simula One放棄眾籌并開放直接預訂；VR游戲《
高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

擴展現(xiàn)實（XR）通過計算機將真實與虛擬相結合，打造了一個可人機交互的虛擬環(huán)境，將AR、VR、MR多種技術相融合，為體驗者帶來了虛擬世界與現(xiàn)實世界之間無縫轉換的“沉浸
中國銀保監(jiān)管委提示：謹慎投資，勿做接盤俠

中國銀保監(jiān)管委，發(fā)布一則風險提示，內(nèi)容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名
從冰墩墩到無聊猿，解秘未來IP爆款的模因

打造IP，是建設元宇宙的剛需。NFT能直接讓IP的價值變現(xiàn)；虛擬人IP是元宇宙的第一入口，而元宇宙要搭建的，就是一個個品牌IP星球，考驗的是IP世界觀的建設能力。如果說在
紐約街頭出現(xiàn)NFT自動販賣機

一家初創(chuàng)公司宣布在紐約市開放一臺NFT自動售貨機，允許任何人——即使是沒有加密資產(chǎn)的人也能購買NFT。該交易平臺名為Neon，上個月完成了一輪300萬美元的種子募捐
76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

“元宇宙的開拓者”是我們針對元宇宙的發(fā)展而設立的專欄，主要面向那些深挖元宇宙產(chǎn)業(yè)或者在元宇宙進行“淘金”的從業(yè)者，分享這些企業(yè)或者創(chuàng)業(yè)者們的故事，以獨特

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

27B 顯存需求 54 → 14.1GB：谷歌發(fā)布 Gemma 3 QAT AI 模型，RTX 3090 顯卡可運行

虛擬人再升級，企業(yè)可以解放雙手了？

拯救XR，蘋果力不從心

2022 區(qū)塊鏈 50 強榜單；垃圾NFT項目的十三個特性

傳騰訊已推出全新XR業(yè)務；摩托羅拉正打造5GXR頸戴式計算組件

高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

中國銀保監(jiān)管委提示：謹慎投資，勿做接盤俠

從冰墩墩到無聊猿，解秘未來IP爆款的模因

紐約街頭出現(xiàn)NFT自動販賣機

76億美金估值、2022年最具創(chuàng)新力公司，Dapper Labs如何做到？

最新推薦

風口已至，多領域平臺融入社交元素！

“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現(xiàn)嗎？

以太坊升級將會帶來的5個改變

頭頂光環(huán)無數(shù)卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

知識產(chǎn)權可能在元宇宙中“消失”？

元宇宙的應用行業(yè)研究：娛樂可能是元宇宙落地最快的場景之一

猜你喜歡

熱門推薦

相關資訊