當前位置：首頁 > 元宇宙 > AI

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

來源：責編：時間：2024-06-11 17:44:56 170觀看

導(dǎo)讀 6 月 7 日消息，通義千問（Qwen）今天宣布經(jīng)過數(shù)月的努力，Qwen 系列模型從 Qwen1.5 到 Qwen2 的重大升級，并已在 Hugging Face 和 ModelScope 上同步開源。附上 Qwen 2.0 主要內(nèi)容如下：5 個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型

6 月 7 日消息，通義千問（Qwen）今天宣布經(jīng)過數(shù)月的努力，Qwen 系列模型從 Qwen1.5 到 Qwen2 的重大升級，并已在 Hugging Face 和 ModelScope 上同步開源。

附上 Qwen 2.0 主要內(nèi)容如下：

5 個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B

在中文英語的基礎(chǔ)上，訓(xùn)練數(shù)據(jù)中增加了 27 種語言相關(guān)的高質(zhì)量數(shù)據(jù)；

多個評測基準上的領(lǐng)先表現(xiàn)；

代碼和數(shù)學能力顯著提升；

增大了上下文長度支持，最高達到 128K tokens（Qwen2-72B-Instruct）。

模型基礎(chǔ)信息

Qwen2 系列包含 5 個尺寸的預(yù)訓(xùn)練和指令微調(diào)模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B參數(shù)量0.49B1.54B7.07B57.41B72.71B非 Embedding 參數(shù)量0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTie EmbeddingTrueTrueFalseFalseFalse上下文長度32K32K128K64K128K

在 Qwen1.5 系列中，只有 32B 和 110B 的模型使用了 GQA。這一次，所有尺寸的模型都使用了 GQA，以便讓大家體驗到 GQA 帶來的推理加速和顯存占用降低的優(yōu)勢。

模型評測

相比 Qwen1.5，Qwen2 在大規(guī)模模型實現(xiàn)了非常大幅度的效果提升。我們對 Qwen2-72B 進行了全方位的評測。

在針對預(yù)訓(xùn)練語言模型的評估中，對比當前最優(yōu)的開源模型，Qwen2-72B 在包括自然語言理解、知識、代碼、數(shù)學及多語言等多項能力上均顯著超越當前領(lǐng)先的模型，如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

附上參考地址

你好，Qwen2

本文鏈接：http://www.tebozhan.com/showinfo-45-4549-0.html阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：五糧液濃香酒：勞動節(jié)送禮的精致藝術(shù)

下一篇：號稱效果對標 Sora：快手視頻生成大模型“可靈”開放邀測

標簽：

熱門焦點

新周期，誰在堅守窄門？

來源：錦緞今日的投資者恐怕已經(jīng)忘記了，在OpenAI創(chuàng)造出ChatGPT這一殺器的前夜，生成式AI也曾經(jīng)是一道窄門，窄到連馬斯克都差點失去了信心。在當時的輿論眼中，AGI的道路不夠性感，不夠
林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

上周的元宇宙和明星圈因為一則“林俊杰在推特上宣布持有Decentraland元宇宙虛擬地塊”的新聞而備受關(guān)注，該新聞一方面在娛樂圈引起了吃瓜群眾的好奇，另一方面在
NFT 技術(shù)將傳世之作帶入博物館

意大利四大博物館已與一個項目合作，該項目將展示和銷售達芬奇、卡拉瓦喬、拉斐爾和莫迪利亞尼等人的杰作的 NFT復(fù)制品。該計劃采用了科技公司Cincello的國際專
NFT藝術(shù)家Hayley Rincon 專訪：我的迷幻數(shù)字藝術(shù)之路

Hayley Rincon是一位令人印象深刻才華橫溢的創(chuàng)作者，她的作品呈現(xiàn)出迷幻的氣息。今天就來聊聊她的藝術(shù)作品，和她自己的數(shù)字藝術(shù)之路。Hayley是加利福尼亞灣區(qū)的有
Snoop Dogg 計劃推出致力于數(shù)字媒體NFT的專業(yè)公司

雅痞哥不知道這人是誰還上新聞，問了助理，解釋，相當于美版劉歡的地位吧。Snoop Dogg 在 NFT 領(lǐng)域已經(jīng)有一段時間了，尤其是在最近有消息稱人們在元宇宙中購買房地產(chǎn)
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發(fā)，以保護用戶
為什么元宇宙將永遠改變體育和你的生活？

自從Facebook更名為Meta以來，Metaverse這個詞已經(jīng)被大家所熟知。但是當Metaverse仍然被許多人視為一個虛擬的平行世界時，一些項目已經(jīng)顯示出Metaverse將如何永遠
Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

Facebook 的母公司 Meta呼吁，建立必要的全球合作的基礎(chǔ)設(shè)施，以支持其蓬勃發(fā)展的元宇宙野心。“元宇宙”成為 2021 年的主要流行語之一，這在很大程度上是由 Facebo
HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商

今日熱點：HTC Vive正式推出元宇宙平臺Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商北京蜂巢科技；面部追蹤和眼動追蹤是Quest下一版本的“重點”；索尼PSVR 2將推遲至2023

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

阿里云通義千問系列 AI 開源模型升至 Qwen2：5 個尺寸、上下文長度最高支持 128K tokens

新周期，誰在堅守窄門？

林俊杰、余文樂等明星相繼入局，元宇宙虛擬土地究竟有何魔力？

NFT 技術(shù)將傳世之作帶入博物館

NFT藝術(shù)家Hayley Rincon 專訪：我的迷幻數(shù)字藝術(shù)之路

Snoop Dogg 計劃推出致力于數(shù)字媒體NFT的專業(yè)公司

元宇宙需要的5個重要安全功能

為什么元宇宙將永遠改變體育和你的生活？

Meta 呼吁行業(yè)合作建立元宇宙網(wǎng)絡(luò)基礎(chǔ)設(shè)施

HTC Vive推出元宇宙平臺Viverse；騰訊投資小米生態(tài)鏈AR眼鏡廠商

最新推薦

“任何國產(chǎn)元宇宙都是假元宇宙”

中文在線的“元宇宙”故事，資本聽膩了？

“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

萬字專訪Vitalik Buterin：以太坊將成為主流和最安全的基礎(chǔ)層

NFT自動售貨機來啦！

我們?yōu)槭裁葱枰猈eb3，距離Web3的實現(xiàn)還有多遠？

猜你喜歡

熱門推薦

相關(guān)資訊