當(dāng)前位置：首頁 > 元宇宙 > AI

小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

來源：責(zé)編：時(shí)間：2025-06-11 10:03:37 47觀看

導(dǎo)讀近日，國內(nèi)社交內(nèi)容平臺(tái)小紅書在人工智能領(lǐng)域邁出了重要一步，宣布開源其首個(gè)大型語言模型dots.llm1。這一舉動(dòng)不僅為開源社區(qū)增添了一名重量級(jí)的新成員，也彰顯了小紅書在技術(shù)創(chuàng)新上的雄厚實(shí)力。dots.llm1是一個(gè)擁有1420億

近日，國內(nèi)社交內(nèi)容平臺(tái)小紅書在人工智能領(lǐng)域邁出了重要一步，宣布開源其首個(gè)大型語言模型dots.llm1。這一舉動(dòng)不僅為開源社區(qū)增添了一名重量級(jí)的新成員，也彰顯了小紅書在技術(shù)創(chuàng)新上的雄厚實(shí)力。

dots.llm1是一個(gè)擁有1420億參數(shù)的混合專家（MoE）模型，但在實(shí)際應(yīng)用中，它僅需激活140億參數(shù)，便能展現(xiàn)出與阿里Qwen3-32B模型相近的性能。這一特性使得dots.llm1在保持高效能的同時(shí)，也大大降低了運(yùn)算成本。在中文任務(wù)上的表現(xiàn)尤為亮眼，dots.llm1在C-eval評(píng)測中取得了92.2分的高分，超越了包括DeepSeek-V3在內(nèi)的眾多模型。

技術(shù)報(bào)告顯示，小紅書團(tuán)隊(duì)在數(shù)據(jù)處理方面做出了多項(xiàng)創(chuàng)新。他們提出了一個(gè)可擴(kuò)展且細(xì)粒度的三階段數(shù)據(jù)處理框架，旨在提升數(shù)據(jù)的規(guī)模、質(zhì)量和多樣性。團(tuán)隊(duì)還開發(fā)了Web雜亂清除模型和類別平衡技術(shù)，進(jìn)一步確保了數(shù)據(jù)的高質(zhì)量和多樣性。這些努力使得dots.llm1在預(yù)訓(xùn)練階段就能接觸到豐富且高質(zhì)量的數(shù)據(jù)，從而提升了模型的性能。

在模型架構(gòu)方面，dots.llm1采用了僅限解碼器的Transformer架構(gòu)，其中每一層包含一個(gè)注意力層和一個(gè)前饋網(wǎng)絡(luò)（FFN）。與傳統(tǒng)的密集模型不同，dots.llm1的FFN被專家混合（MoE）層所替代。這種架構(gòu)使得dots.llm1能夠在保持經(jīng)濟(jì)成本的同時(shí)，訓(xùn)練出功能強(qiáng)大的模型。在注意力層方面，dots.llm1使用了普通的多頭注意力機(jī)制，而在MoE層則遵循了DeepSeek和Qwen的做法，用包含共享和獨(dú)立專家的MoE層替換了FFN。

為了全面評(píng)估dots.llm1的性能，小紅書團(tuán)隊(duì)在中文和英文上進(jìn)行了預(yù)訓(xùn)練，并評(píng)估了它在多個(gè)領(lǐng)域基準(zhǔn)測試中的表現(xiàn)。結(jié)果顯示，dots.llm1在大多數(shù)領(lǐng)域中表現(xiàn)出了與Qwen2.5-72B相當(dāng)?shù)男阅堋Ｌ貏e是在語言理解任務(wù)上，dots.llm1在中文理解基準(zhǔn)測試中取得了較高性能，這主要得益于其高效的數(shù)據(jù)處理管道。在知識(shí)任務(wù)、代碼和數(shù)學(xué)領(lǐng)域，dots.llm1也展現(xiàn)出了穩(wěn)健的表現(xiàn)。

dots.llm1在預(yù)訓(xùn)練完成后還經(jīng)過了監(jiān)督微調(diào)階段。小紅書團(tuán)隊(duì)基于開源數(shù)據(jù)和內(nèi)部注釋數(shù)據(jù)收集了大約400k個(gè)指令調(diào)優(yōu)實(shí)例，并對(duì)dots.llm1進(jìn)行了兩個(gè)階段的微調(diào)。這些努力進(jìn)一步提升了dots.llm1在特定領(lǐng)域（如數(shù)學(xué)和編碼）的能力。

通過此次開源，小紅書不僅為人工智能領(lǐng)域貢獻(xiàn)了一個(gè)強(qiáng)大的大型語言模型，也展示了其在數(shù)據(jù)處理和模型架構(gòu)方面的創(chuàng)新實(shí)力。dots.llm1的成功推出，無疑將推動(dòng)大型語言模型的發(fā)展和應(yīng)用，為人工智能技術(shù)的進(jìn)步注入新的活力。

舉報(bào) 0收藏 0打賞 0評(píng)論 0

更多>同類資訊

具身智能未來何在？行業(yè)大佬激辯：機(jī)器人“能干活”方顯真功夫

06-10

商湯小浣熊與螞蟻百寶箱聯(lián)手，打造AI數(shù)據(jù)分析助手賦能商家

06-10

字節(jié)AI整合發(fā)力，"可靈們"能否守住市場一席之地？

其AI社交產(chǎn)品“貓箱”與同類產(chǎn)品“星野”之間難分伯仲，AI視頻產(chǎn)品“即夢(mèng)”與快手旗下“可靈”在內(nèi)容創(chuàng)作和商業(yè)生態(tài)上走向分野，即便是用戶數(shù)據(jù)表現(xiàn)最突出的“豆包”，也被DeepSeek、騰訊元寶、KIMI幾大強(qiáng)…

06-10

愛簿智能E300模組：50TOPS國產(chǎn)算力，驅(qū)動(dòng)邊緣AI全場景部署新紀(jì)元

06-10

美圖：AI時(shí)代中廠的逆襲之路？

華泰證券2025年5月的一份研報(bào)提到，美圖旗下美顏相機(jī)海外版通過“AI換裝”功能，在東南亞迅猛拉新，MAU較推出相應(yīng)功能前有階梯式上升表現(xiàn)，提升約36%，說明單點(diǎn)AI爆款功能能夠吸引用戶流向復(fù)用性更高的其他功…

06-10

字節(jié)AI整合發(fā)力，"可靈"等競品能否抵擋字節(jié)攻勢(shì)？

06-10

蘋果AI進(jìn)程緩慢，庫克堅(jiān)持混動(dòng)路線能否跟上AI時(shí)代步伐？

06-10

《2025年云安全報(bào)告》出爐：企業(yè)云安全漏洞頻發(fā)，如何應(yīng)對(duì)成難題

06-10

MiTAC神雲(yún)科技ISC2025大展拳腳：先進(jìn)服務(wù)器平臺(tái)引領(lǐng)HPC未來

06-10

vivo Y400 Pro即將登陸印度：天璣7300+90W快充，配置搶先看！

06-10

直播電商監(jiān)管新規(guī)：黑名單制度出爐，營銷人員信息留存至少三年

第二十四條直播間運(yùn)營者應(yīng)當(dāng)依據(jù)法律、法規(guī)對(duì)直播商品或服務(wù)進(jìn)行準(zhǔn)入把關(guān)，審核查驗(yàn)實(shí)際銷售商品或者提供服務(wù)的平臺(tái)內(nèi)經(jīng)營者的名稱（姓名）、統(tǒng)一社會(huì)信用代碼（身份證件號(hào)碼）、住所或者主要經(jīng)營場所、聯(lián)系方式、行政許…

06-10

淘寶摘得蘋果設(shè)計(jì)大獎(jiǎng)，成國內(nèi)互聯(lián)網(wǎng)平臺(tái)首例！

北京時(shí)間6月10日凌晨，淘寶在蘋果開發(fā)者大會(huì)（WWDC）上榮獲蘋果設(shè)計(jì)大獎(jiǎng)，成為該獎(jiǎng)項(xiàng)設(shè)立28年來首個(gè)獲獎(jiǎng)的國內(nèi)互聯(lián)網(wǎng)平臺(tái)。淘寶憑借其在AppleVision Pro上發(fā)布的“淘寶Vision”應(yīng)用獲獎(jiǎng)，該…

06-10

FUDOKI模型：革新多模態(tài)生成，讓AI理解與創(chuàng)造更靈活高效

06-10

亞馬遜豪擲200億美元，賓州AI基建再添重磅投資！

06-10

TTD推出Deal Desk，革新數(shù)字廣告交易管理新篇章

06-10

點(diǎn)擊查看更多 +

全站最新

一汽豐田bZ5上市，續(xù)航550-630km，售價(jià)12.98-15.98萬元，性價(jià)比高嗎？

2026款沃爾沃XC40煥新上市，26.98萬起售，能否逆襲凱迪拉克XT4？

光谷創(chuàng)業(yè)咖啡孵化項(xiàng)目“車來了”成功上市，天使投資模式再添輝煌篇章！

問界全系重慶車展大放異彩，M9交付里程碑：20萬輛達(dá)成！

混動(dòng)車涉水全攻略：安全通過不慌張，事后三檢保無憂

江淮華為聯(lián)手打造的尊界S800，72小時(shí)大定破2600，開啟中國品牌高端化新征途

熱門內(nèi)容

榮耀“鯤鵬”照片事件真相大白，造謠者道歉遭刑拘
騰訊阿里AI to C戰(zhàn)場“雙吳”爭霸，誰將問鼎AI搜索之巔？
英偉達(dá)全球總部或?qū)⒙鋺糁袊_(tái)灣，黃仁勛下周宣布這一重大決定？
教育部新規(guī)：學(xué)生禁直接復(fù)制AI作業(yè)，強(qiáng)化獨(dú)立思考與批判性思維
聯(lián)發(fā)科天璣9400e發(fā)布：天璣9300+升級(jí)版，藍(lán)牙升級(jí)至6.0
中國知網(wǎng)CNKI AI：重塑知識(shí)服務(wù)新生態(tài)，四大核心力引領(lǐng)未來
中國GPU市場競爭激烈，英偉達(dá)獨(dú)占7成，華為昇騰緊追其后！
華為Mate 40系列（5G）已支持5G-A網(wǎng)絡(luò)，性能再升級(jí)！
華為nova 14系列震撼登場！鴻蒙5直板機(jī)領(lǐng)銜，nova 14僅售2699元起
教育部新規(guī)：中小學(xué)分階段用AI，嚴(yán)禁復(fù)制答案強(qiáng)化獨(dú)立思考
華為nova14 Ultra震撼登場！鴻蒙5系統(tǒng)加持，售價(jià)4199元起
華為昇騰超節(jié)點(diǎn)技術(shù)突破：384卡高速互聯(lián)，引領(lǐng)AI模型訓(xùn)練新紀(jì)元
華為nova 15系列下半年將亮相，自研芯片加持產(chǎn)品力再升級(jí)？
DeepSeek新論文揭秘：梁文鋒領(lǐng)銜探索AI訓(xùn)練推理成本效益之道
榮耀400系列新品發(fā)布會(huì)：4K超清Live拼圖，定格每個(gè)精彩瞬間？

本欄最新

商湯小浣熊與螞蟻百寶箱聯(lián)手，打造AI數(shù)據(jù)分析助手賦能商家

字節(jié)AI整合發(fā)力，"可靈們"能否守住市場一席之地？

美圖：AI時(shí)代中廠的逆襲之路？

字節(jié)AI整合發(fā)力，"可靈"等競品能否抵擋字節(jié)攻勢(shì)？

蘋果AI進(jìn)程緩慢，庫克堅(jiān)持混動(dòng)路線能否跟上AI時(shí)代步伐？

MiTAC神雲(yún)科技ISC2025大展拳腳：先進(jìn)服務(wù)器平臺(tái)引領(lǐng)HPC未來

本文鏈接：http://www.tebozhan.com/showinfo-45-13632-0.html小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇：黃仁勛：AI成平等推進(jìn)器，人類語言成新編程“鑰匙”

下一篇：具身智能未來何在？行業(yè)大佬激辯：機(jī)器人“能干活”方顯真功夫

標(biāo)簽：

熱門焦點(diǎn)

FMIFAwards獎(jiǎng)項(xiàng)即將揭曉！

來源：X增強(qiáng)現(xiàn)實(shí)FMIF Awards未來元宇宙創(chuàng)新獎(jiǎng)是由未來元宇宙創(chuàng)新論壇、ARinChina以及多家投資機(jī)構(gòu)、媒體、研究院聯(lián)合發(fā)起的一項(xiàng)評(píng)選活動(dòng)。旨在推動(dòng)新技術(shù)的融合與集成低成本
AI大模型“戰(zhàn)火”燒到了教育領(lǐng)域

作者：劉曠自2023年開年以來，AI大模型這股風(fēng)是越吹越猛烈了。隨著ChatGPT的出圈爆火，再度掀起了一波AI熱浪，無論是在國內(nèi)還是國外都有不少企業(yè)宣布入局或者跟進(jìn)AI大模型領(lǐng)域。與
“任何國產(chǎn)元宇宙都是假元宇宙”

上個(gè)月，華語樂壇的優(yōu)質(zhì)偶像之一，DOTA2資深玩家林俊杰，在國外元宇宙產(chǎn)品分布式大陸(Decentraland)上買了三塊虛擬地產(chǎn)，花了12.3萬美元（也就是人民幣接近80萬）。截至目
Layer1的新以太坊，更好的以太坊？

以太坊作為區(qū)塊鏈基礎(chǔ)設(shè)施地位看起來已不可動(dòng)搖，但也面臨著費(fèi)用高、效率低、偏離去中心化初衷等問題。平臺(tái)上既得利益群體的形成和固化也逐漸讓革新變得困難。
借VR產(chǎn)業(yè)東風(fēng)，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術(shù)是通往元宇宙的關(guān)鍵接口，使人們可以在數(shù)字空間和物理空間自由穿梭。自2016年起
量子計(jì)算在未來能否提高區(qū)塊鏈技術(shù)的效率

區(qū)塊鏈技術(shù)的主要成功之處在于對(duì)不透明的金融流程進(jìn)行了去中心化的訪問量子計(jì)算機(jī)的內(nèi)在目標(biāo)是解決傳統(tǒng)計(jì)算機(jī)不可能解決的問題隨著區(qū)塊鏈技術(shù)的使用案例逐漸
音樂NFT平臺(tái)里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達(dá)到新的高度。預(yù)測到2025 年N
解決NFT流動(dòng)性問題：一文了解Floor DAO

流動(dòng)性是證券市場上的一個(gè)術(shù)語，流動(dòng)性是指資產(chǎn)在不影響其市場價(jià)格的情況下可以轉(zhuǎn)換為現(xiàn)成現(xiàn)金的效率，流動(dòng)性最強(qiáng)的資產(chǎn)是現(xiàn)金本身。現(xiàn)在讓我們?cè)囍鴱牧鲃?dòng)性的角
王老吉啟動(dòng)元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

今日《元宇宙新鮮事》有：王老吉啟動(dòng)元宇宙“吉空間”；HTC發(fā)布元宇宙應(yīng)用VIVERSE；Meta將在馬德里構(gòu)建一個(gè)元宇宙創(chuàng)新中心；央視網(wǎng)《新聞+》推出系列視頻《聊聊元宇宙

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

小紅書首推大模型dots.llm1，中文性能力壓DeepSeek-V3

FMIFAwards獎(jiǎng)項(xiàng)即將揭曉！

AI大模型“戰(zhàn)火”燒到了教育領(lǐng)域

“任何國產(chǎn)元宇宙都是假元宇宙”

Layer1的新以太坊，更好的以太坊？

借VR產(chǎn)業(yè)東風(fēng)，江西搶灘布局“元宇宙”

量子計(jì)算在未來能否提高區(qū)塊鏈技術(shù)的效率

音樂NFT平臺(tái)里的下一匹黑馬是誰？

解決NFT流動(dòng)性問題：一文了解Floor DAO

王老吉啟動(dòng)元宇宙“吉空間”，HTC發(fā)布元宇宙應(yīng)用VIVERSE

最新推薦

從科幻走進(jìn)現(xiàn)實(shí)，元宇宙概念逐漸清晰

“虛擬人”角斗場，基于“硬實(shí)力”下的人性平衡法則？

2030年的元宇宙產(chǎn)業(yè)將會(huì)如何發(fā)展？

技術(shù)賦能，國內(nèi)首家寵物元宇宙平臺(tái)“Pet Meta”開啟虛擬養(yǎng)寵新方式

NFT行業(yè)周報(bào)：NBA巨星勒布朗·詹姆斯申請(qǐng)NFT相關(guān)商標(biāo)

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

猜你喜歡

熱門推薦

相關(guān)資訊