AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

Reflection 70B AI 模型“塌房”:第三方基準測試結果不佳,不如 LLaMA-3.1-70B

來源: 責編: 時間:2024-09-13 09:33:00 63觀看
導讀 9 月 11 日消息,科技媒體 The Decoder 昨日(9 月 10 日)報道,對比平臺 Artificial Analysis 相關數據表明,Reflection 70B AI 模型在基準測試中的表現,實際上不及 Meta 的 LLaMA-3.1-70B。針對 AI 模型基準測試結果

9 月 11 日消息,科技媒體 The Decoder 昨日(9 月 10 日)報道,對比平臺 Artificial Analysis 相關數據表明,Reflection 70B AI 模型在基準測試中的表現,實際上不及 Meta 的 LLaMA-3.1-70B。tEy28資訊網——每日最新資訊28at.com

tEy28資訊網——每日最新資訊28at.com

針對 AI 模型基準測試結果不佳,Reflection 公司首席執行官馬特?舒默(Matt Shumer)表示,上傳模型權重至 Hugging Face 時遇到問題,所使用的權重是多個不同模型的混合體,而他們內部托管的模型則顯示出更佳的結果。tEy28資訊網——每日最新資訊28at.com

舒默隨后向部分用戶提供了獨家訪問內部模型的權限,Artificial Analysis 重做了測試,并報告結果優于公開 API,只是他們無法確認所訪問的具體是哪個模型。tEy28資訊網——每日最新資訊28at.com

tEy28資訊網——每日最新資訊28at.com

Reflection 在 Hugging Face 已上傳了新的模型,不過這些模型在測試中的表現明顯遜于之前通過私有 API 提供的模型。tEy28資訊網——每日最新資訊28at.com

查詢公開資料,有用戶還發現了證據,表明 Reflection API 有時會調用 Anthropic Claude 3.5 Sonnet以及OpenAI。tEy28資訊網——每日最新資訊28at.com

tEy28資訊網——每日最新資訊28at.com

舒默旗下公司 OthersideAI 此前已宣布計劃于本周發布一款基于 LLaMA 3.1 450B 的更大、更強大的模型。tEy28資訊網——每日最新資訊28at.com

舒默對這一即將發布的版本做出了大膽聲明,稱其不僅將成為最佳的開源模型,還將是有史以來最優秀的語言模型。tEy28資訊網——每日最新資訊28at.com

官方回應:tEy28資訊網——每日最新資訊28at.com

tEy28資訊網——每日最新資訊28at.com

tEy28資訊網——每日最新資訊28at.com

相關閱讀:tEy28資訊網——每日最新資訊28at.com

《開源大模型新王 Reflection 70B 超越 GPT-4o:新技術可糾正自己幻覺,數學 99.2 分刷爆測試集》tEy28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-7147-0.htmlReflection 70B AI 模型“塌房”:第三方基準測試結果不佳,不如 LLaMA-3.1-70B

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 消息稱字節 AI 硬件團隊首款自研產品為智能耳機,與豆包大模型聯動

下一篇: AI 被連續否定 30 次:ChatGPT 越改越錯,Claude 堅持自我,甚至已讀不回

標簽:
  • 熱門焦點
Top