AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

阿里巴巴開源Qwen1.5-110B:1100億參數挑戰Meta Llama3-70B性能

來源: 責編: 時間:2024-04-28 08:53:42 88觀看
導讀4月28日消息,阿里巴巴最近公開宣布,他們已成功開源了Qwen1.5系列中的首個千億參數模型——Qwen1.5-110B。據稱,在基礎能力的評估測試中,該模型的表現足以媲美meta旗下的Llama3-70B模型,并且在Chat評估中也大放異彩,這包括了

4月28日消息,阿里巴巴最近公開宣布,他們已成功開源了Qwen1.5系列中的首個千億參數模型——Qwen1.5-110B。據稱,在基礎能力的評估測試中,該模型的表現足以媲美meta旗下的Llama3-70B模型,并且在Chat評估中也大放異彩,這包括了MT-Bench和Alpacaeval2.0兩項基準測試。Qxm28資訊網——每日最新資訊28at.com

這款Qwen1.5-110B模型沿用了Qwen1.5系列一貫的Transformer解碼器架構,并引入了分組查詢注意力(GQA)機制,使得模型在推理時更為高效。這款模型支持長達32Ktokens的上下文長度,同時兼容多種語言,包括但不限于英語、中文、法語、西班牙語、德語、俄語、日語、韓語、越南語以及阿拉伯語。Qxm28資訊網——每日最新資訊28at.com

Qxm28資訊網——每日最新資訊28at.com

阿里巴巴將Qwen1.5-110B與當前頂尖的語言模型meta-Llama3-70B和Mixtral-8x22B進行了詳盡的對比測試。測試結果顯示,新的110B模型在基礎能力上至少達到了Llama-3-70B模型的水平。阿里巴巴團隊指出,他們在這一模型中并未對預訓練方法進行大幅調整,因此性能的提升主要歸功于模型規模的擴大。Qxm28資訊網——每日最新資訊28at.com

Qxm28資訊網——每日最新資訊28at.com

此外,阿里巴巴還在MT-Bench和Alpacaeval2.0上對其進行了Chat評估。結果顯示,與之前發布的72B模型相比,110B模型在這兩個Chat模型基準評估中的表現顯著更佳。這一持續改善的評估結果表明,即便沒有大幅改變訓練方法,更強大、規模更大的基礎語言模型也能催生出更優秀的Chat模型。Qxm28資訊網——每日最新資訊28at.com

據ITBEAR科技資訊了解,Qwen1.5-110B不僅是Qwen1.5系列中規模最大的模型,更是該系列首個參數超過1000億的模型。與最近發布的頂尖模型Llama-3-70B相比,其性能表現同樣出色,并且明顯優于先前的72B模型。這一突破性的進展無疑將為自然語言處理領域帶來新的可能性。Qxm28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-5313-0.html阿里巴巴開源Qwen1.5-110B:1100億參數挑戰Meta Llama3-70B性能

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 盒馬會員服務重啟,黃金/鉆石會員年費維持不變

下一篇: 比克電池連續四屆亮相CIBF大會,以創“芯”賦能綠色生活

標簽:
  • 熱門焦點
  • 歐盟人工智能法案:四種AI系統風險類型的劃分及監管措施

    作者:趙志東 蔡佳雯來源:區塊鏈日報該法案采用風險分級的規制路徑,將人工智能系統的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型,并針對不同類型施加了不同
  • 雷克薩斯高管,“受賄”5000萬?

    來源:毒舌科技作者:潘磊雷克薩斯的高管,好像出事了。五六家日本小媒體,突然曝出了一個與中國市場有關的大新聞——雷克薩斯中國區一個高管受賄10億日元(約合人民幣5000
  • 比特幣的價格越高,使用價值越大

    隔夜比特幣還是在精準地橫盤在42k上方。空頭昨日試圖發起一波小的攻勢,但是晚上就被多頭掰了回來。以太坊的鏈上gas price降到了60 gwei以下,彰顯著市場活躍度的
  • 萬字專訪Vitalik Buterin:以太坊將成為主流和最安全的基礎層

    Vitalik Buterin 在 19 歲時撰寫了以太坊白皮書。他的目標簡單而全面,即創建一個“世界計算機”,旨在成為所有在線應用程序的靈活基礎層,無需任何第三方。自 2015
  • 虛擬數字人:元宇宙的主角破圈而來

    虛擬數字人市場逐步進入成熟期,商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • 權限風波過后 X2Y2如何挑戰OpenSea?

    繼LooksRare之后,又一個OpenSea挑戰者X2Y2來了。上周,X2Y2宣布向超過86萬個OpenSea交易用戶發放X2Y2通證空投,并啟動了「掛單挖礦」的獎勵機制。這場早期激勵活動
  • Terra鏈上TVL躍升至第二

    據DefiLlama數據顯示,當前,Terra鏈上應用鎖倉的加密資產價值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • 暴漲100倍的NFT worlds 會是未來元宇宙的雛形嗎?

    NFT Worlds 系列產品于 2021 年 10 月 5 日免費鑄造,該NFT系列是將傳統的中心化電子游戲minecraft 與去中心化資產相結合。傳統游戲Minecraft 對用戶定制非常開
  • 元宇宙畫廊體驗報告:有點頭疼。

    2 月 10 日,Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強現實藝術品。“我們現在在虛擬世界中嗎?時間好像變長了” 我問身后排隊的人。我

相關資訊

    SQL Error: select * from ***_ecms_news11 where id in(157,92,,236,115,133) limit 6
Top