當前位置：首頁 > 元宇宙 > AI

英偉達發布 Llama-3.1-Nemotron-51B AI 模型：創新神經架構搜索等技術讓單 H100 GPU 運行 4 倍以上負載

來源：責編：時間：2024-09-27 16:34:24 96觀看

導讀 9 月 25 日消息，英偉達 9 月 23 日發布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不過創新使用神經架構搜索（NAS）方法，建立了一個高度準確和高效的模型。Llama-3.1-Nemotron-51

9 月 25 日消息，英偉達 9 月 23 日發布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不過創新使用神經架構搜索（NAS）方法，建立了一個高度準確和高效的模型。

Llama-3.1-Nemotron-51B 簡介

Llama-3.1-Nemotron-51B AI 模型基于Meta 公司 2024 年 7 月發布的 Llama-3.1-70B 模型，共有 510 億參數。

該 AI 模型主要采用了神經架構搜索（NAS）技術微調，平衡性能和效率，在高工作負荷下，只需要一片 H100 GPU 即可運行，大大降低了內存消耗、計算復雜性以及與運行此類大型模型相關的成本。

英偉達認為這種方式在保持了出色的精度前提下，顯著降低了內存占用、內存帶寬和 FLOPs，并證明可以在創建另一個更小、更快的變體來加以推廣。

Llama-3.1-Nemotron-51B 性能

相比較 Meta 的 Llama-3.1-70B 模型，Llama-3.1-Nemotron-51B 在保持了幾乎相同的精度情況下，推理速度提高了 2.2 倍。

準確率能效 MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8.9980.2%6472653Llama 3.1-70B- Instruct8.9381.66%2975339Llama 3.1-70B- Instruct (single GPU)——1274301Llama 3-70B8.9480.17%2975339效率和性能方面的突破

開發 LLM 過程中面臨的主要挑戰之一是如何平衡精度與計算效率。許多大規模模型都能提供最先進的結果，但卻需要耗費大量的硬件和能源資源，這限制了它們的適用性。

英偉達的新模型在這兩個相互競爭的因素之間取得了微妙的平衡。

Llama-3.1-Nemotron-51B 實現了令人印象深刻的精度與效率權衡，減少了內存帶寬，降低了每秒浮點運算次數 (FLOP)，并減少了總體內存占用，同時不影響模型執行推理、總結和語言生成等復雜任務的能力。

改進工作量管理，提高成本效益

Llama-3.1-Nemotron-51B 的一個突出特點是能夠在單個 GPU 上管理更大的工作負載。該型號允許開發人員在更具成本效益的環境中部署高性能 LLMs，在一個 H100 設備上運行以前需要多個 GPU 才能完成的任務。

Llama-3.1-Nemotron-51B 模型還減少了內存占用，在推理過程中可以在單個 GPU 上運行 4 倍以上的工作負載，從而帶來了一系列新的機遇。

架構優化：成功的關鍵

Llama-3.1-Nemotron-51B 的成功主要歸功于一種新穎的結構優化方法。傳統上，LLMs 是使用相同的塊構建的，這些塊在整個模型中重復出現。

這雖然簡化了構建過程，但也帶來了效率低下的問題，特別是在內存和計算成本方面。

英偉達通過采用 NAS 技術來優化推理模型，從而解決了這些問題。該團隊采用了分塊蒸餾過程，即訓練更小、更高效的學生模型（student model），以模仿更大的教師模型（teacher model）的功能。

通過完善這些學生模型并評估其性能，英偉達開發出了 Llama-3.1 版本，在大幅降低資源需求的同時，還能提供類似的準確度。

Puzzle 算法和知識蒸餾

Llama-3.1-Nemotron-51B 有別于其他模型的另一個關鍵組件，就是 Puzzle 算法。

該算法對模型中的每個潛在區塊進行評分，并確定哪些配置能在速度和精度之間取得最佳平衡。

跑分 Llama-3.1 70B-instructLlama-3.1-Nemotron-51B- Instruct 準確率winogrande85.08%84.53%99.35%arc_challenge70.39%69.20%98.30%MMLU81.66%80.20%98.21%hellaswag86.44%85.58%99.01%gsm8k92.04%91.43%99.34%truthfulqa59.86%58.63%97.94%xlsum_english33.86%31.61%93.36%MMLU Chat81.76%80.58%98.55%gsm8k Chat81.58%81.88%100.37%Instruct HumanEval (n=20)75.85%73.84%97.35%MT Bench8.938.99100.67%

通過使用知識蒸餾技術，Nvidia 縮小了參考模型（Llama-3.1-70B）與 Nemotron-51B 之間的精度差距，同時顯著降低了訓練成本。

場景 Input/Output Sequence LengthLlama-3.1- Nemotron- InstructLlama-3.1-70B-InstructRatioLlama (TP1)Chatbot128/1285478 (TP1)2645 (TP1)2.072645Text generation128/10246472 (TP1)2975 (TP4)2.171274Long text generation128/20484910 (TP2)2786 (TP4)1.76646System 2 reasoning128/40963855 (TP2)1828 (TP4)2.11313Summarization/ RAG2048/128653 (TP1)339 (TP4)1.92300Stress test 12048/20482622 (TP2)1336 (TP4)1.96319

附上參考地址

Advancing the Accuracy-Efficiency Frontier with Llama-3.1-Nemotron-51B

Nvidia AI Releases Llama-3.1-Nemotron-51B: A New LLM that Enables Running 4x Larger Workloads on a Single GPU During Inference

本文鏈接：http://www.tebozhan.com/showinfo-45-7797-0.html英偉達發布 Llama-3.1-Nemotron-51B AI 模型：創新神經架構搜索等技術讓單 H100 GPU 運行 4 倍以上負載

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：星紀魅族正在開發星紀戰車、機器人等新品

下一篇：微軟發布新工具，檢測和糾正 AI 幻覺內容

標簽：

熱門焦點

“平均時代”：ChatGPT模仿秀的隱喻

來源：錦緞如果你問ChatGPT，Instagram上最美的女人是誰？它很可能會給你一個名字，叫卡戴珊。如果你觀察過Instagram這個美版小紅書：平臺上的所有網紅，展現的幾乎是統一面孔：統一的醫
不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

作者：中科基大數據元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規則，確保每個元宇宙的參與者通過這個規則都可以掙到錢，他們的利益都可以得到保
【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

虛擬數字人行業未來的主要驅動力包括：用戶代際變化，新一代消費者對內容消費和虛擬世界更為渴求；虛擬數字人相關技術門檻相對降低，成本有所回落；資本熱度上升，受Metav
字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

正當互聯網商業躊躇不前，互聯網大廠為了在存量中的增長擠破頭皮之時，元宇宙的概念被資本點燃。先是Facebook更名Meta正式進軍元宇宙，然后字節跳動收購了一家VR硬
Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

目前來看元宇宙不會影響到小型企業的發展，但在接下來的十年內可能會發生很多變化。很多有商業頭腦的企業家都在密切關注著元宇宙的發展。元宇宙這個詞，你一定或
重溫 1602 年：DAO 是新的企業范式嗎？

作者：Andrew Singer“ 將你的選票委托給行業有能力的專家，將使所有者在這些公司的管理中擁有更強大、更清晰的話語權。”1602 年，荷蘭東印度公司成立，許多人認為
2022年去中心化交易所會崛起嗎？

“在某個時候，去中心化衍生品的交易量可能會超過去中心化現貨交易所。”DEX 越來越多地轉向第二層解決方案。“數字化金融市場的概念以及如何沿著以用戶為中心
獨立故事片“Calladita”將使用 NFT 籌集資金

導演 Miguel Faus 正在轉向加密來資助他的處女作，由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”（導演 Miguel Faus）。圖片：米格爾·福斯在過去的一年
元宇宙存在的意義和價值

科技公司目前都在猶豫，看誰能在元宇宙上押下更大的賭注。然而，除了巨額的資金投入，到底要怎樣才能獲勝在很大程度上還沒有得到證實。它是否僅僅是對當前數字景觀

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

英偉達發布 Llama-3.1-Nemotron-51B AI 模型：創新神經架構搜索等技術讓單 H100 GPU 運行 4 倍以上負載

“平均時代”：ChatGPT模仿秀的隱喻

不同于傳統數字經濟，元宇宙賦予商業生態更多數字資產價值！

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

字節、騰訊、網易鏖戰元宇宙背后，大廠究竟在爭奪什么？

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

重溫 1602 年：DAO 是新的企業范式嗎？

2022年去中心化交易所會崛起嗎？

獨立故事片“Calladita”將使用 NFT 籌集資金

元宇宙存在的意義和價值

最新推薦

拯救XR，蘋果力不從心

現在的元宇宙：一款低配版的科幻游戲

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

與元宇宙美少女藝術家的對話

元宇宙需要的5個重要安全功能

這場虛擬發布會，當面“造假”！

猜你喜歡

熱門推薦

相關資訊