AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

“全球首創”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

來源: 責編: 時間:2024-06-06 17:36:32 209觀看
導讀 6 月 3 日消息,昆侖萬維今日宣布開源 2 千億稀疏大模型 Skywork-MoE,基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,號稱是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE 大模型,

6 月 3 日消息,昆侖萬維今日宣布開源 2 千億稀疏大模型 Skywork-MoE,基于之前昆侖萬維開源的 Skywork-13B 模型中間 checkpoint 擴展而來,號稱是首個完整將 MoE Upcycling 技術應用并落地的開源千億 MoE 大模型,也是首個支持用單臺 RTX4090 服務器(8 張 RTX 4090 顯卡)推理的開源千億 MoE 大模型。tdb28資訊網——每日最新資訊28at.com

據介紹,本次開源的 Skywork-MoE 模型隸屬于天工 3.0 的研發模型系列,是其中的中檔大小模型(Skywork-MoE-Medium),模型的總參數量為 146B,激活參數量 22B,共有 16 個 Expert,每個 Expert 大小為 13B,每次激活其中的 2 個 Expert。tdb28資訊網——每日最新資訊28at.com

天工 3.0 還訓練了 75B (Skywork-MoE-Small) 和 400B (Skywork-MoE-Large)兩檔 MoE 模型,并不在此次開源之列。tdb28資訊網——每日最新資訊28at.com

根據官方測試,在相同的激活參數量 20B(推理計算量)下,Skywork-MoE 能力接近 70B 的 Dense 模型,使得模型的推理成本有近 3 倍的下降。同時 Skywork-MoE 的總參數大小比 DeepSeekV2 的總參數大小要小 1/3,用更小的參數規模做到了相近的能力。tdb28資訊網——每日最新資訊28at.com

tdb28資訊網——每日最新資訊28at.com

Skywork-MoE 的模型權重、技術報告完全開源,免費商用,無需申請,附鏈接如下:tdb28資訊網——每日最新資訊28at.com

模型權重下載:tdb28資訊網——每日最新資訊28at.com

https://huggingface.co/Skywork/Skywork-MoE-basetdb28資訊網——每日最新資訊28at.com

https://huggingface.co/Skywork/Skywork-MoE-Base-FP8tdb28資訊網——每日最新資訊28at.com

模型開源倉庫:https://github.com/SkyworkAI/Skywork-MoEtdb28資訊網——每日最新資訊28at.com

模型技術報告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdftdb28資訊網——每日最新資訊28at.com

模型推理代碼:(支持 8 x 4090 服務器上 8 bit 量化加載推理)https://github.com/SkyworkAI/vllmtdb28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-4513-0.html“全球首創”單臺 RTX 4090 服務器推理,昆侖萬維開源 2 千億稀疏大模型天工 MoE

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI 把 GPT-4 原始版給了瑞士洛桑聯邦理工團隊:研究不微調只靠提示詞能走多遠

下一篇: 振興鄉村發展 助力青少年教育 中國三星連續十一年蟬聯企業社會責任榜外企第一

標簽:
  • 熱門焦點
  • AI大模型“戰火”燒到了教育領域

    作者:劉曠自2023年開年以來,AI大模型這股風是越吹越猛烈了。隨著ChatGPT的出圈爆火,再度掀起了一波AI熱浪,無論是在國內還是國外都有不少企業宣布入局或者跟進AI大模型領域。與
  • 智能人機交互技術的春晚大考

    1月初的一個早晨,京東智能客戶服務產品部緊急開會,進行關于尚未對外公布的“X項目”的初討論。1月5日,這個神秘的X項目對外公布,京東成為央視2022年春晚獨家互動合
  • 2022年中國元宇宙系列報告:底層架構研究:虛擬引擎,擎動未來

    “虛擬引擎是元宇宙平臺搭建的基本工具。在這樣的條件下,虛擬引擎擁有了廣闊的市場空間。也需要虛擬引擎擁有擁有強大的處理能力,能夠高效快速的實現大量交互場
  • 影響元宇宙土地價格的五個因素

    參考來源 | cryptonews編譯 | Ciel@iNFTnews.com元宇宙中的房地產價格主要取決于使用它的人數,以及為所有者創造收益的能力。專注于數字資產的投資公司LedgerPr
  • Terra鏈上TVL躍升至第二

    據DefiLlama數據顯示,當前,Terra鏈上應用鎖倉的加密資產價值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • 本周NFT領域重要資訊回顧

    NFT在蘇富比拍賣是一波三折的嗎?其實不完全如此,但本周在蘇富比拍賣行發生了一系列有趣的事。與此同時,美聯社因其最新的NFT銷售被推到了風口浪尖,而Opensea正面臨
  • NFT領域,我們是否應該遵守版權法

    NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外,圍繞著NFT行業內的版權和知識產權盜竊的問題也同樣重要,因為人們很容易誤解這些事情
  • 又一家數字營銷公司入局元宇宙,國內首個藝術元宇宙社區“Meta彼岸”上線

    作者:董宇佳2月28日,智度股份在北京舉辦產品發布會,宣布其與國光電器聯手打造的國內首個藝術元宇宙社區——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
  • 虛擬人行業研究報告

    最早的虛擬人出現于 20 世紀 80 年代,受限于技術,當時的虛擬人制作以手繪為主。21 世紀初,隨著動捕、渲染等技術的逐步發展,虛擬人相關技術開始在影視領域逐漸普及
Top