AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

元象發(fā)布中國最大 MoE 開源大模型:總參數(shù) 255B,激活參數(shù) 36B

來源: 責(zé)編: 時間:2024-09-18 08:56:41 71觀看
導(dǎo)讀 9 月 13 日消息,元象 XVERSE 發(fā)布中國最大 MoE 開源模型 XVERSE-MoE-A36B。該模型總參數(shù) 255B,激活參數(shù) 36B,官方號稱效果能“大致達(dá)到”超過 100B 大模型的“跨級”性能躍升,同時訓(xùn)練時間減少 30%,推理性能提升 1

9 月 13 日消息,元象 XVERSE 發(fā)布中國最大 MoE 開源模型 XVERSE-MoE-A36B。dO828資訊網(wǎng)——每日最新資訊28at.com

該模型總參數(shù) 255B,激活參數(shù) 36B,官方號稱效果能“大致達(dá)到”超過 100B 大模型的“跨級”性能躍升,同時訓(xùn)練時間減少 30%,推理性能提升 100%,使每 token 成本大幅下降。dO828資訊網(wǎng)——每日最新資訊28at.com

MoE(Mixture of Experts)混合專家模型架構(gòu),將多個細(xì)分領(lǐng)域的專家模型組合成一個超級模型,在擴(kuò)大模型規(guī)模的同時,保持模型性能最大化,甚至還能降低訓(xùn)練和推理的計算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、馬斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。dO828資訊網(wǎng)——每日最新資訊28at.com

在多個評測中,元象 MoE 超過多個同類模型,包括國內(nèi)千億 MoE 模型 Skywork-MoE、傳統(tǒng) MoE 霸主 Mixtral-8x22B 以及 3140 億參數(shù)的 MoE 開源模型 Grok-1-A86B 等。dO828資訊網(wǎng)——每日最新資訊28at.com

dO828資訊網(wǎng)——每日最新資訊28at.com

附相關(guān)鏈接:dO828資訊網(wǎng)——每日最新資訊28at.com

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36BdO828資訊網(wǎng)——每日最新資訊28at.com

魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36BdO828資訊網(wǎng)——每日最新資訊28at.com

Github:https://github.com/xverse-ai/XVERSE-MoE-A36BdO828資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-7301-0.html元象發(fā)布中國最大 MoE 開源大模型:總參數(shù) 255B,激活參數(shù) 36B

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: “AI 教母”李飛飛為新公司融資 2.3 億美元,創(chuàng)業(yè)方向瞄準(zhǔn)“空間智能”

下一篇: 美國銀行談 AI 熱潮:當(dāng)前仍處早期階段,才相當(dāng)于互聯(lián)網(wǎng)的 1996 年

標(biāo)簽:
  • 熱門焦點(diǎn)
  • “虛擬人”角斗場,基于“硬實力”下的人性平衡法則?

    在打工人“反內(nèi)卷”的當(dāng)下,一眾虛擬人卻“內(nèi)卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》,央美畢業(yè)的虛擬人夏語冰登上央視節(jié)目《對話》,湖南
  • 中國區(qū)塊鏈產(chǎn)業(yè)生態(tài)地圖報告(2021)

    區(qū)塊鏈?zhǔn)羌夹g(shù)整合創(chuàng)新、金融創(chuàng)新、組織方式創(chuàng)新、產(chǎn)業(yè)應(yīng)用創(chuàng)新的多維度創(chuàng)新,以服務(wù)實體經(jīng)濟(jì)、政務(wù)民生以及公共服務(wù)等領(lǐng)域為落腳點(diǎn),以期實現(xiàn)整個地區(qū)和產(chǎn)業(yè)的資
  • 元宇宙是數(shù)字共識生態(tài)的集成邏輯表達(dá)

    作者: 李鳴元宇宙是數(shù)字共識生態(tài)的集成邏輯表達(dá),是以區(qū)塊鏈技術(shù)為核心的可信數(shù)字化價值交互網(wǎng)絡(luò),是基于Web3.0技術(shù)體系和運(yùn)作機(jī)制支撐下的數(shù)字新生態(tài)。本體論是
  • 本周NFT領(lǐng)域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發(fā)生了一系列有趣的事。與此同時,美聯(lián)社因其最新的NFT銷售被推到了風(fēng)口浪尖,而Opensea正面臨
  • NFT 技術(shù)將傳世之作帶入博物館

    意大利四大博物館已與一個項目合作,該項目將展示和銷售達(dá)芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復(fù)制品。該計劃采用了 科技公司Cincello的國際專
  • 量子計算在未來能否提高區(qū)塊鏈技術(shù)的效率

    區(qū)塊鏈技術(shù)的主要成功之處在于對不透明的金融流程進(jìn)行了去中心化的訪問量子計算機(jī)的內(nèi)在目標(biāo)是解決傳統(tǒng)計算機(jī)不可能解決的問題隨著區(qū)塊鏈技術(shù)的使用案例逐漸
  • 如何在元宇宙中建立品牌忠誠度

    Snoop Dogg、耐克、蘇富比和普華永道都有什么共同點(diǎn)?他們都投資于元宇宙的房地產(chǎn)。除了我們在屏幕上看到的二維世界--手機(jī)、筆記本電腦、臺式機(jī)或iPad--他們決
  • 這場虛擬發(fā)布會,當(dāng)面“造假”!

    英偉達(dá)去年4月份那場發(fā)布會,你曾看出什么不對勁的地方嗎?你品,你細(xì)品——在計算機(jī)圖形學(xué)頂會SIGGRAPH 2021上,英偉達(dá)通過一部紀(jì)錄片自曝:那場發(fā)布會內(nèi)藏玄機(jī)~你看到
  • 虛擬偶像行業(yè)的商用價值逐漸凸顯,IP生態(tài)圈也逐漸成型

    六月的第一個周六,一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行,相較于洛天依、百大UP主泠鳶yousa等,這位虛擬Up主在B站上的粉絲數(shù)43.6萬
Top