當前位置：首頁 > 元宇宙 > AI

Meta 新旗艦 AI 模型 Llama 4 Maverick 測試成績遭質疑，被指針對性優化

來源：責編：時間：2025-04-09 07:26:49 73觀看

導讀 4 月 7 日消息，Meta 公司上周發布了一款名為 Maverick 的新旗艦 AI 模型，并在 LM Arena 測試中取得了第二名的成績。然而，這一成績的含金量卻引發了諸多質疑。據多位 AI 研究人員在社交平臺 X 上指出，Meta 在 LM

4 月 7 日消息，Meta 公司上周發布了一款名為 Maverick 的新旗艦 AI 模型，并在 LM Arena 測試中取得了第二名的成績。然而，這一成績的含金量卻引發了諸多質疑。據多位 AI 研究人員在社交平臺 X 上指出，Meta 在 LM Arena 上部署的 Maverick 版本與廣泛提供給開發者的版本并不一致。

Meta 在其公告中明確提到，參與 LM Arena 測試的 Maverick 是一個“實驗性聊天版本”。而根據官方 Llama 網站上公布的信息，Meta 在 LM Arena 的測試中所使用的實際上是“針對對話性優化的 Llama 4 Maverick”。這表明，該版本經過了專門的優化調整，以適應 LM Arena 的測試環境和評分標準。

然而，LM Arena 作為一項測試工具，其可靠性本身就存在一定的爭議。盡管如此，以往 AI 公司通常不會對模型進行專門的定制或微調，以在 LM Arena 上獲得更高的分數，至少沒有公開承認過這種做法。

這種對模型進行針對性優化，然后只發布一個“普通版”的行為，給開發者帶來了諸多困擾。因為這使得開發者難以準確預測該模型在特定場景下的實際表現。此外，這種行為也具有一定的誤導性。理想情況下，盡管現有的基準測試存在諸多不足，但它們至少能夠為人們提供一個關于單一模型在多種任務中優缺點的概覽。

事實上，研究人員在 X 上已經觀察到了公開可下載的 Maverick 版本與 LM Arena 上托管的模型之間存在顯著的行為差異。例如，LM Arena 版本似乎更傾向于使用大量的表情符號，并且給出的答案往往冗長且拖沓。

截至發稿，Meta 公司以及負責維護 LM Arena 的 Chatbot Arena 組織暫未對此做出回應。

本文鏈接：http://www.tebozhan.com/showinfo-45-12056-0.htmlMeta 新旗艦 AI 模型 Llama 4 Maverick 測試成績遭質疑，被指針對性優化

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：全國首個，深圳海關智能查驗機器人引入“滿血版”DeepSeek-R1

下一篇：谷歌Pixel 10系列定價策略大調整，折疊屏手機降價搶市場

標簽：

熱門焦點

數字虛擬人23年最新變化！

作者：小資來源：米塔之家自2021年元宇宙“爆炸”后，作為現實世界連接元宇宙的媒介之一，大批虛擬人跑步入場。到了2022年底，據天眼查數據顯示，我國目前企業名稱或經營范圍
智能人機交互技術的春晚大考

1月初的一個早晨，京東智能客戶服務產品部緊急開會，進行關于尚未對外公布的“X項目”的初討論。1月5日，這個神秘的X項目對外公布，京東成為央視2022年春晚獨家互動合
2021年中國元宇宙行業用戶行為分析熱點報告

元宇宙網絡熱度高漲，中國網民對虛擬生態興趣濃厚。艾媒咨詢數據顯示，超六成的網民對“元宇宙”了解程度較高，在元宇宙較基礎的游戲領域，超九成的人對VR游戲更感興
Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

今日熱點：Meta展示AI系統Builder Bot；招聘信息顯示Meta正在探索具有蜂窩連接功能的VR/AR頭顯；英國VR工作室Coatsink Games正在為PSVR 2開發新游戲；VR節奏射擊游戲
NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

引言：NFT Insider由WHALE社區、BeepCrypto聯合出品，濃縮每周NFT新聞，為大家帶來關于NFT最全面、最新鮮、最有價值的訊息。每期周報將從NFT市場數據，藝術新聞類，游戲
為什么元宇宙將永遠改變體育和你的生活？

自從Facebook更名為Meta以來，Metaverse這個詞已經被大家所熟知。但是當Metaverse仍然被許多人視為一個虛擬的平行世界時，一些項目已經顯示出Metaverse將如何永遠
又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

作者：董宇佳2月28日，智度股份在北京舉辦產品發布會，宣布其與國光電器聯手打造的國內首個藝術元宇宙社區——“Meta彼岸”在VR端和移動端正式公測。從科技巨頭布局
Staking 收益翻倍？

以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計，在 1 月份以太坊網絡合并后，持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

“元宇宙的開拓者”是我們針對元宇宙的發展而設立的專欄，主要面向那些深挖元宇宙產業或者在元宇宙進行“淘金”的從業者，分享這些企業或者創業者們的故事，以獨特

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

Meta 新旗艦 AI 模型 Llama 4 Maverick 測試成績遭質疑，被指針對性優化

數字虛擬人23年最新變化！

智能人機交互技術的春晚大考

2021年中國元宇宙行業用戶行為分析熱點報告

Meta展示AI系統Builder Bot；《Pistol Whip》增加派對模式

NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

為什么元宇宙將永遠改變體育和你的生活？

又一家數字營銷公司入局元宇宙，國內首個藝術元宇宙社區“Meta彼岸”上線

Staking 收益翻倍？

76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

最新推薦

FMIFAwards獎項即將揭曉！

在元宇宙賣酸奶，這波聯動燃爆了！

元宇宙將會如何塑造未來的工作方式？

權限風波過后 X2Y2如何挑戰OpenSea？

費城藝術家使用區塊鏈，在數字藝術中狠狠撈一筆

Staking 收益翻倍？

猜你喜歡

熱門推薦

相關資訊