當前位置：首頁 > 元宇宙 > AI

中科大華為發布生成式推薦大模型：昇騰 NPU 可部署，背后認知一同公開

來源：責編：時間：2025-04-08 10:04:22 16觀看

導讀推薦大模型也可生成式，并且首次在國產昇騰 NPU 上成功部署！在信息爆炸時代，推薦系統已成為生活中不可或缺的一部分。Meta 率先提出了生成式推薦范式 HSTU，將推薦參數擴展至萬億級別，取得顯著成果。近期，中科大與華

推薦大模型也可生成式，并且首次在國產昇騰 NPU 上成功部署！

在信息爆炸時代，推薦系統已成為生活中不可或缺的一部分。Meta 率先提出了生成式推薦范式 HSTU，將推薦參數擴展至萬億級別，取得顯著成果。

近期，中科大與華為合作開發了推薦大模型部署方案，可應用于多個場景。探索過程中還有哪些經驗與發現？最新公開分享來了。

報告亮點包括：

總結推薦范式發展歷程，指出具備擴展定律的生成式推薦范式是未來趨勢；

復現并研究不同架構的生成式推薦模型及其擴展定律；通過消融實驗和參數分析，解析 HSTU 的擴展定律來源，并賦予 SASRec 以可擴展性；

驗證 HSTU 在復雜場景和排序任務中的表現及擴展性；

團隊展望并總結未來研究方向。

具備擴展定律的生成式推薦范式正在成為未來趨勢

如圖 1 所示，推薦系統的發展趨勢是逐漸減少對手工設計特征工程和模型結構的依賴。在深度學習興起之前，受限于計算資源，人們傾向于使用手工設計的特征和簡單模型（圖 1A）。

隨著深度學習的發展，研究者專注于復雜模型的設計，以更好地擬合用戶偏好，并提升對 GPU 并行計算的利用率（圖 1B）。

然而，隨著深度學習能力的瓶頸，特征工程再次受到關注（圖 1C）。

如今，大語言模型擴展定律的成功啟發了推薦領域的研究者。擴展定律描述了模型性能與關鍵指標（如參數規模、數據集規模和訓練資源）之間的冪律關系。通過增加模型深度和寬度，并結合大量數據，可以提升推薦效果（圖 1D），這種方法被稱為推薦大模型。

近期，HSTU 等生成式推薦框架在此方向取得了顯著成果，驗證了推薦領域的擴展定律，引發了生成式推薦大模型研究的熱潮。團隊認為，生成式推薦大模型正在成為顛覆當前推薦系統的下一個新范式。

在此背景下，探索哪些模型真正具備可擴展性，理解其成功應用擴展定律的原因，以及如何利用這些規律提升推薦效果，已成為當前推薦系統領域的熱門課題。

基于不同架構的生成式推薦大模型擴展性分析

為了評估生成式推薦大模型在不同架構下的擴展性，團隊對比了 HSTU、Llama、GPT 和 SASRec 四種基于 Transformer 的架構。

在三個公開數據集上，通過不同注意力模塊數量下的性能表現進行分析（見表 1）。結果顯示，當模型參數較小時，各架構表現相似，且最優架構因數據集而異。

然而，隨著參數擴展，HSTU 和 Llama 的性能顯著提升，而 GPT 和 SASRec 的擴展性不足。盡管 GPT 在其他領域表現良好，但在推薦任務上未達預期。團隊認為，這是因為 GPT 和 SASRec 的架構缺乏專為推薦任務設計的關鍵組件，無法有效利用擴展定律。

生成式推薦模型的可擴展性來源分析

為了探究 HSTU 等生成式推薦模型的可擴展性來源，團隊進行了消融實驗，分別去除了 HSTU 中的關鍵組件：相對注意力偏移（RAB）、SiLU 激活函數，以及特征交叉機制。

實驗結果（見表 2）顯示，單一模塊的缺失并未顯著影響模型的擴展性，但 RAB 的移除導致性能明顯下降，表明其關鍵作用。

為了進一步分析賦予模型擴展定律的因素，團隊比較了 SASRec 與擴展性良好的 HSTU 和 Llama 的區別，發現主要差異在于 RAB 和注意力模塊內的殘差連接方式。

為驗證這些差異是否為擴展性的關鍵，團隊為 SASRec 引入了 HSTU 的 RAB，并調整其注意力模塊的實現方式。

實驗結果（見表 3）顯示，單獨添加 RAB 或修改殘差連接并未顯著改善 SASRec 的擴展性。然而，當同時修改兩個組件后，SASRec 展現出良好的擴展性。這表明，殘差連接模式與 RAB 的結合，為傳統推薦模型賦予了擴展性，為未來推薦系統的擴展性探索提供了重要啟示。

生成式推薦模型在復雜場景和排序任務中的表現復雜場景中的表現

HSTU 在多域、多行為和輔助信息等復雜場景中表現出色。以多域為例，HSTU 在 AMZ-MD 的四個域中始終優于基線模型 SASRec 和 C2DSR（見表 4）。

與單域獨立訓練的 HSTU-single 相比，多域聯合訓練的 HSTU 表現更佳，證明了多域聯合建模的優勢。表 5 顯示，HSTU 在多域行為數據上的擴展性顯著，尤其在規模較小的場景如 Digital Music 和 Video Games 上。這表明 HSTU 在解決冷啟動問題上具有潛力。

在排序任務中的表現

排序是推薦系統中重要的一環，團隊深入探討了生成式推薦模型在排序任務中的有效性和擴展性。正如表 6 所示，生成式推薦大模型在性能上顯著優于 DIN 等傳統推薦模型。盡管在小規模模型下，Llama 的表現優于 HSTU，但 HSTU 在擴展性方面更具優勢，而 Llama 在擴展性上顯得不足。

團隊還研究了負采樣率和評分網絡架構對排序任務的影響，并進行了全面分析。此外，還探討了縮減 embedding 維度對性能的影響?？s小 embedding 維度（表 7）提升了小數據集 ML-1M 和 AMZ-Books 的性能，但在大數據集 ML-20M 上則有所下降。這表明，推薦大模型的擴展定律不僅受垂直擴展（注意力模塊數量）影響，也受水平規模（embedding 維度）影響。

未來方向和總結

在技術報告中，團隊指出了數據工程、Tokenizer、訓練推理效率等推薦大模型未來研究的潛力方向，這些方向將幫助解決當前的挑戰并拓寬應用場景。

論文鏈接：https://arxiv.org/abs/2412.00714

主頁鏈接：https://github.com/USTC-StarTeam/Awesome-Large-Recommendation-Models

本文來自微信公眾號：量子位（ID：QbitAI），作者：認知智能全國重點實驗室 & 華為諾亞方舟，原標題《中科大華為發布生成式推薦大模型，昇騰 NPU 可部署，背后認知一同公開》

本文鏈接：http://www.tebozhan.com/showinfo-45-12012-0.html中科大華為發布生成式推薦大模型：昇騰 NPU 可部署，背后認知一同公開

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： Meta重磅推出Llama 4系列AI模型，性能躍升引關注

下一篇： Meta LIama 4 重奪開源第一：DeepSeek 同等代碼能力但參數減半，一張 H100 就能跑，還有兩萬億參數超大杯

標簽：

熱門焦點

雷克薩斯高管，“受賄”5000萬？

來源：毒舌科技作者：潘磊雷克薩斯的高管，好像出事了。五六家日本小媒體，突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元（約合人民幣5000
“任何國產元宇宙都是假元宇宙”

上個月，華語樂壇的優質偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產品分布式大陸(Decentraland)上買了三塊虛擬地產，花了12.3萬美元（也就是人民幣接近80萬）。截至目
【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

虛擬數字人行業未來的主要驅動力包括：用戶代際變化，新一代消費者對內容消費和虛擬世界更為渴求；虛擬數字人相關技術門檻相對降低，成本有所回落；資本熱度上升，受Metav
多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

2月21日，2022中國·金魚嘴元宇宙生態賦能大會在南京建鄴區金魚嘴基金街區舉辦，南京建鄴區金魚嘴基金街區宣布計劃出資1億元，支持元宇宙行業發展。同時，會上發布了
NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

Block-806NFT的增長值得關注。許多人愿意為數字藝術支付數百萬美元，世界正在走向數字化。報告顯示，NFT市場和NFT收藏從2020年的1.06億美元增加到了2021年的442億
頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

作者：五火球教主提起Dfinity（ICP），你的第一感覺可能與我一樣，這是一個讓人十分糾結的項目。之所以糾結，一方面他的團隊陣容強大，各種來自前英特爾、IBM、coinbase、fa
FTX 加密貨幣交易所開始向游戲公司提供加密服務

據媒體報道，業內領先的加密貨幣交易所FTX宣布將涉足游戲領域。該公司表示，計劃推出自己的游戲部門作為中介，專注于為傳統游戲公司提供加密相關服務。此舉將有助于
虛擬鄧麗君后，數字人賽道開啟3.0時代

“如果右腦時代來臨，虛擬世界將是對人類才華的無限放大?！?郭曉喆稱，開發數字人形象時，自己的團隊在內部“卷”了一下：“當我們翻閱大量歷史典籍的時候，蘇小妹找到
2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

UGC作為元宇宙的主要內容創作模式，已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面，UGC模式勾勒了元宇宙的邊界，現今元宇宙UGC模式的主要呈現方式以元宇宙概念

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

中科大華為發布生成式推薦大模型：昇騰 NPU 可部署，背后認知一同公開

雷克薩斯高管，“受賄”5000萬？

“任何國產元宇宙都是假元宇宙”

【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

頭頂光環無數卻估值極低，以太坊這位&——quot;最強殺手&——quot;有望涅槃重生？

FTX 加密貨幣交易所開始向游戲公司提供加密服務

虛擬鄧麗君后，數字人賽道開啟3.0時代

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

最新推薦

數字人的AB面：在元宇宙中過氣，在AIGC中重生

文心一言排名墊底，卻成為百度業績增長杠桿

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

元宇宙存在的意義和價值

MR——元宇宙平臺的下一代入口

初探元宇宙

猜你喜歡

熱門推薦

相關資訊

中科大華為發布生成式推薦大模型：昇騰 NPU 可部署，背后認知一同公開

最新推薦

猜你喜歡

熱門推薦

相關資訊

中科大華為發布生成式推薦大模型：昇騰 NPU 可部署，背后認知一同公開