當前位置：首頁 > 元宇宙 > AI

微軟 BitNet b1.58 2B4T 登場：內存占用僅 0.4GB，20 億參數模型顛覆 AI 計算

來源：責編：時間：2025-04-20 07:23:39 23觀看

導讀 4 月 18 日消息，科技媒體 WinBuzzer 昨日（4 月 17 日）發布博文，報道稱微軟研究團隊推出了一款開源大型語言模型 BitNet b1.58 2B4T，區別于傳統訓練后量化的方式，這款擁有 20 億參數的大型語言模型（LLM）以 1.58 位低精

4 月 18 日消息，科技媒體 WinBuzzer 昨日（4 月 17 日）發布博文，報道稱微軟研究團隊推出了一款開源大型語言模型 BitNet b1.58 2B4T，區別于傳統訓練后量化的方式，這款擁有 20 億參數的大型語言模型（LLM）以 1.58 位低精度架構原生訓練而成。

援引技術報告介紹，該模型性能直追同規模全精度模型，但計算資源需求大幅縮減。尤其令人矚目的是，其非嵌入內存占用僅 0.4GB，遠低于競品 Gemma-3 1B 的 1.4GB 和 MiniCPM 2B 的 4.8GB。

BitNet 的高效秘訣在于其創新架構。模型摒棄傳統 16 位數值，采用定制 BitLinear 層，將權重限制為-1、0、+1 三種狀態，形成三值系統，每權重僅需約 1.58 位信息存儲。

此外，層間激活值以 8 位整數量化，形成 W1.58A8 配置。微軟還調整了 Transformer 架構，引入平方 ReLU 激活函數、標準旋轉位置嵌入（RoPE）以及 subln 歸一化，確保低位訓練穩定性。技術報告稱，這種原生 1 位訓練避免了傳統后訓練量化（PTQ）帶來的性能損失。

BitNet b1.58 2B4T 的開發歷經三階段：首先基于 4 萬億 token 的網絡數據、代碼和合成數學數據集進行預訓練；隨后通過公開及合成指令數據集（如 WizardLM Evol-Instruct）進行監督微調（SFT）；最后采用直接偏好優化（DPO）方法，利用 UltraFeedback 等數據集提升對話能力和安全性。

微軟測試顯示，該模型在 GSM8K（數學）、PIQA（物理常識）等基準測試中表現優異，整體性能媲美主流 1B-2B 參數全精度模型，同時在能耗（每 token 0.028 焦耳）和 CPU 解碼延遲（29 毫秒）上占據顯著優勢。

盡管 BitNet 潛力巨大，但其高效性需依賴微軟提供的專用 C++ 框架 bitnet.cpp 實現。標準工具如 Hugging Face transformers 庫無法展現其速度與能耗優勢。

微軟還計劃優化 GPU 和 NPU 支持，延長上下文窗口至 4096 token，并探索更大規模模型、多語言功能及硬件協同設計。目前，BitNet b1.58 2B4T 已以 MIT 許可證在 Hugging Face 發布，供社區測試與應用。

參考

BitNet b1.58 2B4T Technical Report

hugging face 模型頁面

本文鏈接：http://www.tebozhan.com/showinfo-45-12381-0.html微軟 BitNet b1.58 2B4T 登場：內存占用僅 0.4GB，20 億參數模型顛覆 AI 計算

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：微軟 AI 負責人預測：未來“智能”成為新貨幣，知識和能力比錢更重要

下一篇： OpenAI 上線 Flex 處理模式：API 費用減半，但犧牲響應速度及穩定性

標簽：

熱門焦點

數字人的AB面：在元宇宙中過氣，在AIGC中重生

來源：光錐智能作者：郝鑫“29800元一年的虛擬主播，號稱24小時不停播，月入十幾萬，實際上卻是關鍵詞都不能回復，播了半個月，直播間還因違規被快手封禁，最終投訴無門、退款無果。&
字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

正當互聯網商業躊躇不前，互聯網大廠為了在存量中的增長擠破頭皮之時，元宇宙的概念被資本點燃。先是Facebook更名Meta正式進軍元宇宙，然后字節跳動收購了一家VR硬
如何對一款 NFT 項目進行價值評估？

原文作者 | Othmane Senhaji Rhazi，Web 3 企業家.編譯整理 | 黑米@白澤研究院我之所以成為一位大力倡導 Web3 和 NFT 領域的企業家，因為我相信我們正在見證社會
高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

擴展現實（XR）通過計算機將真實與虛擬相結合，打造了一個可人機交互的虛擬環境，將AR、VR、MR多種技術相融合，為體驗者帶來了虛擬世界與現實世界之間無縫轉換的“沉浸
8個最適合藝術家發行NFT的交易市場

近年來，加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries，NFT 已成為藝術家和藝術鑒賞家的
權限風波過后 X2Y2如何挑戰OpenSea？

繼LooksRare之后，又一個OpenSea挑戰者X2Y2來了。上周，X2Y2宣布向超過86萬個OpenSea交易用戶發放X2Y2通證空投，并啟動了「掛單挖礦」的獎勵機制。這場早期激勵活動
暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造，該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
Staking 收益翻倍？

以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計，在 1 月份以太坊網絡合并后，持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

六月的第一個周六，一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數43.6萬

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

微軟 BitNet b1.58 2B4T 登場：內存占用僅 0.4GB，20 億參數模型顛覆 AI 計算

數字人的AB面：在元宇宙中過氣，在AIGC中重生

字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

如何對一款 NFT 項目進行價值評估？

高通成立歐洲XR實驗室；ICICB計劃進軍元宇宙......

8個最適合藝術家發行NFT的交易市場

權限風波過后 X2Y2如何挑戰OpenSea？

暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎？

Staking 收益翻倍？

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

最新推薦

新周期，誰在堅守窄門？

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

2022年中國元宇宙系列報告：底層架構研究：虛擬引擎，擎動未來

知識產權可能在元宇宙中“消失”？

元宇宙需要的5個重要安全功能

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

猜你喜歡

熱門推薦

相關資訊