6 月 28 日消息,Hugging Face 聯(lián)合創(chuàng)始人兼首席執(zhí)行 Clem Delangue 于 6 月 26 日在 X 平臺發(fā)布推文,表示阿里云開源的通義千問(Qwen)指令微調(diào)模型 Qwen2-72B 在開源模型排行榜上榮登榜首。
Hugging Face 公布了全新的開源大語言模型排行榜,通過 300 片英偉達(dá) H100 GPU,重新運(yùn)行 MMLU-pro 等標(biāo)準(zhǔn)評估目前主流的大語言模型,并在其要點介紹中稱 Qwen2-72B 為“王者”,并表示中國的諸多開源模型在榜單上有一席之位。
他表示,為了提供全新的開源大模型排行榜,使用了 300 塊 H100 對目前全球 100 多個主流開源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基準(zhǔn)測試集上進(jìn)行了全新評估。
阿里巴巴開源的 Qwen-2 72B 模型在激烈競爭中脫穎而出,不僅超越了科技巨頭 Meta 的 Llama-3,還超越了法國知名大模型平臺 Mistralai 的 Mixtral,成為了新的行業(yè)領(lǐng)軍者。援引官方博文附上榜單排行如下:
排名新的榜單排名?Qwen/Qwen2-72B-Instruct2meta-llama/Meta-Llama-3-70B-Instruct3microsoft/Phi-3-medium-4k-instruct401-ai/Yi-1.5-34B-Chat5CohereForAI/c4ai-command-r-plus6abacusai/Smaug-72B-v0.17Qwen/Qwen1.5-110B8Qwen/Qwen1.5-110B-Chat9microsoft/Phi-3-small-128k-instruct1001-ai/Yi-1.5-9B-Chat本文鏈接:http://www.tebozhan.com/showinfo-45-4878-0.html開源 AI 大模型“洗牌”:阿里通義千問 Qwen2-72B 成“王者”,傲視 Meta Llama-3、微軟 Phi-3 等群雄
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI 與《時代》達(dá)成合作協(xié)議:可用其雜志內(nèi)容訓(xùn)練 ChatGPT
下一篇: 專給 ChatGPT“找茬”,OpenAI 訓(xùn)練 CriticGPT 模型以檢索輸出內(nèi)容錯誤