當(dāng)前位置：首頁 > 元宇宙 > AI

英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推動(dòng) AI 高效部署

來源：責(zé)編：時(shí)間：2025-04-15 07:13:00 71觀看

導(dǎo)讀 4 月 12 日消息，科技媒體 marktechpost 昨日（4 月 11 日）發(fā)布博文，報(bào)道稱英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1，這款 2530 億參數(shù)的大型語言模型在推理能力、架構(gòu)效率和生產(chǎn)準(zhǔn)備度上實(shí)現(xiàn)重大突破。隨著 AI

4 月 12 日消息，科技媒體 marktechpost 昨日（4 月 11 日）發(fā)布博文，報(bào)道稱英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1，這款 2530 億參數(shù)的大型語言模型在推理能力、架構(gòu)效率和生產(chǎn)準(zhǔn)備度上實(shí)現(xiàn)重大突破。

隨著 AI 在數(shù)字基礎(chǔ)設(shè)施中的普及，企業(yè)與開發(fā)者需在計(jì)算成本、性能與擴(kuò)展性間尋找平衡。大型語言模型（LLM）的快速發(fā)展提升了自然語言理解和對(duì)話能力，但其龐大規(guī)模常導(dǎo)致效率低下，限制大規(guī)模部署。

英偉達(dá)最新發(fā)布的 Llama-3.1-Nemotron-Ultra-253B-v1（簡(jiǎn)稱 Nemotron Ultra）直面這一挑戰(zhàn)，該模型基于 Meta 的 Llama-3.1-405B-Instruct 架構(gòu)，專為商業(yè)和企業(yè)需求設(shè)計(jì)，支持從工具使用到多輪復(fù)雜指令執(zhí)行等任務(wù)。

援引博文介紹，Nemotron Ultra 采用僅解碼器的密集 Transformer 結(jié)構(gòu)，通過神經(jīng)架構(gòu)搜索（NAS）算法優(yōu)化，其創(chuàng)新之處在于采用跳躍注意力機(jī)制，在部分層中省略注意力模塊或替換為簡(jiǎn)單線性層。

此外，前饋網(wǎng)絡(luò)（FFN）融合技術(shù)將多層 FFN 合并為更寬但更少的層，大幅縮短推理時(shí)間，同時(shí)保持性能。模型支持 128K token 的上下文窗口，可處理長(zhǎng)篇文本，適合高級(jí) RAG 系統(tǒng)和多文檔分析。

在部署效率上，Nemotron Ultra 也實(shí)現(xiàn)突破。它能在單 8xH100 節(jié)點(diǎn)上運(yùn)行推理，顯著降低數(shù)據(jù)中心成本，提升企業(yè)開發(fā)者的可及性。

英偉達(dá)通過多階段后訓(xùn)練進(jìn)一步優(yōu)化模型，包括在代碼生成、數(shù)學(xué)、對(duì)話和工具調(diào)用等任務(wù)上的監(jiān)督微調(diào)，以及使用群體相對(duì)策略優(yōu)化（GRPO）算法進(jìn)行強(qiáng)化學(xué)習(xí)（RL）。這些步驟確保模型在基準(zhǔn)測(cè)試中表現(xiàn)出色，并與人類交互偏好高度契合。

本文鏈接：http://www.tebozhan.com/showinfo-45-12242-0.html英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推動(dòng) AI 高效部署

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌計(jì)劃融合 Gemini 與 Veo 模型，打造全能 AI 助手

下一篇：因用歐洲用戶數(shù)據(jù)訓(xùn)練 Grok，馬斯克的 X 公司遭愛爾蘭調(diào)查

標(biāo)簽：

熱門焦點(diǎn)

一份全面清單：Web3行業(yè)高薪酬的13種工作

來源：區(qū)塊鏈騎士這可能會(huì)讓許多人感到震驚，但除了成為開發(fā)人員之外，Web3還有其他高薪工作。Web3可能是現(xiàn)代就業(yè)市場(chǎng)中跨學(xué)科最多的領(lǐng)域，換句話說，它由許多個(gè)在不同領(lǐng)域中具有不同
茅臺(tái)的元宇宙App火了，也被罵慘了

元宇宙從概念走向大眾生活，并不是一件簡(jiǎn)單的事情。技術(shù)、世界觀、填充內(nèi)容、載體形式，每一個(gè)環(huán)節(jié)都需要層層疊疊的邏輯。但正如賽博朋克奠基人威廉·吉布
游戲玩家才是最“元宇宙”的

01元宇宙的概念，最早由科幻作家尼爾·斯蒂芬森于1992年在其著作《雪崩》中提出。它指的是一個(gè)脫胎于現(xiàn)實(shí)世界，又與現(xiàn)實(shí)世界平行、相互影響，并且始終在線的虛擬世
AI特效、虛擬人、數(shù)字盲盒，來看看元宇宙如何融合冬奧會(huì)！

今天是冬奧會(huì)比賽的第12天，截至目前所累計(jì)的成績(jī)，中國(guó)代表團(tuán)已經(jīng)取得了冬奧歷史最佳戰(zhàn)績(jī)。全世界的人都在關(guān)注著這場(chǎng)盛事，為奧運(yùn)健兒吶喊助威。谷愛凌、徐夢(mèng)桃、
Web 3如何改變傳統(tǒng)HR

互聯(lián)網(wǎng)自誕生以來，經(jīng)歷了三次迭代。Web1是第一階段，包括ISP服務(wù)器上的個(gè)人網(wǎng)頁或免費(fèi)的虛擬主機(jī)服務(wù)。然后Web2出現(xiàn)了，它引入了動(dòng)態(tài)的用戶生成內(nèi)容、互操作性、增
王老吉啟動(dòng)元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

今日《元宇宙新鮮事》有：王老吉啟動(dòng)元宇宙“吉空間”；HTC發(fā)布元宇宙應(yīng)用VIVERSE；Meta將在馬德里構(gòu)建一個(gè)元宇宙創(chuàng)新中心；央視網(wǎng)《新聞+》推出系列視頻《聊聊元宇宙
技術(shù)賦能，國(guó)內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開啟虛擬養(yǎng)寵新方式

作者:易明未來，Pet Meta數(shù)字寵物藏品將是鏈接全球數(shù)億愛寵人群與元宇宙世界獨(dú)一無二的身份象征。首家面向國(guó)內(nèi)的寵物元宇宙平臺(tái)Pet Meta生長(zhǎng)于“寵物經(jīng)濟(jì)”快速
這場(chǎng)虛擬發(fā)布會(huì)，當(dāng)面“造假”！

英偉達(dá)去年4月份那場(chǎng)發(fā)布會(huì)，你曾看出什么不對(duì)勁的地方嗎？你品，你細(xì)品——在計(jì)算機(jī)圖形學(xué)頂會(huì)SIGGRAPH 2021上，英偉達(dá)通過一部紀(jì)錄片自曝：那場(chǎng)發(fā)布會(huì)內(nèi)藏玄機(jī)~你看到
PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

PayPal 近年來一直是加密行業(yè)的倡導(dǎo)者。這個(gè)本身擁有超過 3.5 億名活躍用戶的支付巨頭，已經(jīng)允許美國(guó)和英國(guó)的用戶交易或持有比特幣（BTC）、以太坊（ETH）、比特現(xiàn)金（BCH

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達(dá)發(fā)布 Llama-3.1-Nemotron-Ultra-253B-v1 模型，推動(dòng) AI 高效部署

一份全面清單：Web3行業(yè)高薪酬的13種工作

茅臺(tái)的元宇宙App火了，也被罵慘了

游戲玩家才是最“元宇宙”的

AI特效、虛擬人、數(shù)字盲盒，來看看元宇宙如何融合冬奧會(huì)！

Web 3如何改變傳統(tǒng)HR

王老吉啟動(dòng)元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

技術(shù)賦能，國(guó)內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開啟虛擬養(yǎng)寵新方式

這場(chǎng)虛擬發(fā)布會(huì)，當(dāng)面“造假”！

PayPal CEO 的加密語錄：加密貨幣將重新定義金融世界

最新推薦

“啫喱”超越微信登頂：首款“元宇宙社交App”會(huì)曇花一現(xiàn)嗎？

Meta證實(shí)Quest 2無法實(shí)現(xiàn)全身追蹤，未來將為虛擬化身配備“假腿”

字節(jié)覓《原神》，騰訊元宇宙，游戲新王戰(zhàn)舊神？

《刀劍神域》VR展開幕；《Puzzling Places》發(fā)布第二個(gè)付費(fèi)DLC

FTX 加密貨幣交易所開始向游戲公司提供加密服務(wù)

元宇宙專題二：GameFi 深度解析，元宇宙內(nèi)容雛形顯現(xiàn)

猜你喜歡

熱門推薦

相關(guān)資訊