AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

Meta 新旗艦 AI 模型 Llama 4 Maverick 測試成績遭質疑,被指針對性優化

來源: 責編: 時間:2025-04-09 07:26:49 16觀看
導讀 4 月 7 日消息,Meta 公司上周發布了一款名為 Maverick 的新旗艦 AI 模型,并在 LM Arena 測試中取得了第二名的成績。然而,這一成績的含金量卻引發了諸多質疑。據多位 AI 研究人員在社交平臺 X 上指出,Meta 在 LM

4 月 7 日消息,Meta 公司上周發布了一款名為 Maverick 的新旗艦 AI 模型,并在 LM Arena 測試中取得了第二名的成績。然而,這一成績的含金量卻引發了諸多質疑。據多位 AI 研究人員在社交平臺 X 上指出,Meta 在 LM Arena 上部署的 Maverick 版本與廣泛提供給開發者的版本并不一致。Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

Meta 在其公告中明確提到,參與 LM Arena 測試的 Maverick 是一個“實驗性聊天版本”。而根據官方 Llama 網站上公布的信息,Meta 在 LM Arena 的測試中所使用的實際上是“針對對話性優化的 Llama 4 Maverick”。這表明,該版本經過了專門的優化調整,以適應 LM Arena 的測試環境和評分標準。Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

然而,LM Arena 作為一項測試工具,其可靠性本身就存在一定的爭議。盡管如此,以往 AI 公司通常不會對模型進行專門的定制或微調,以在 LM Arena 上獲得更高的分數,至少沒有公開承認過這種做法。Mpx28資訊網——每日最新資訊28at.com

這種對模型進行針對性優化,然后只發布一個“普通版”的行為,給開發者帶來了諸多困擾。因為這使得開發者難以準確預測該模型在特定場景下的實際表現。此外,這種行為也具有一定的誤導性。理想情況下,盡管現有的基準測試存在諸多不足,但它們至少能夠為人們提供一個關于單一模型在多種任務中優缺點的概覽。Mpx28資訊網——每日最新資訊28at.com

事實上,研究人員在 X 上已經觀察到了公開可下載的 Maverick 版本與 LM Arena 上托管的模型之間存在顯著的行為差異。例如,LM Arena 版本似乎更傾向于使用大量的表情符號,并且給出的答案往往冗長且拖沓。Mpx28資訊網——每日最新資訊28at.com

Mpx28資訊網——每日最新資訊28at.com

截至發稿,Meta 公司以及負責維護 LM Arena 的 Chatbot Arena 組織暫未對此做出回應。Mpx28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-12056-0.htmlMeta 新旗艦 AI 模型 Llama 4 Maverick 測試成績遭質疑,被指針對性優化

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 全國首個,深圳海關智能查驗機器人引入“滿血版”DeepSeek-R1

下一篇: 谷歌Pixel 10系列定價策略大調整,折疊屏手機降價搶市場

標簽:
  • 熱門焦點
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 保時捷推出虛擬超跑,車企元宇宙營銷這么香?

    保時捷又出超跑了,不過這次不是在現實世界,而是在虛擬世界。這款Vision Gran Turismo概念車,由保時捷和日本視頻游戲開發工作室Polyphony Digital聯合打造,將于202
  • 英特爾首款加密芯片將于今年上市|國際動態

    No.1 英特爾首款加密芯片將于今年上市2月13日消息,英特爾首款名為“區塊鏈加速器”的加密芯片將于今年晚些時候上市。目前,已經有兩家公司預訂了這項技術,分別是G
  • 元宇宙社交時代,華麗歸來的超級QQ秀重構虛擬社交場景

    作者:狂人 不知不覺間,QQ已經迎來了第23個生日。作為國內社交平臺的起點,QQ可謂是睥睨全網,不僅有龐大的用戶群體,還將虛擬形象及QQ整合成在線虛擬社區,開啟了時髦
  • 虛擬數字人:元宇宙的主角破圈而來

    虛擬數字人市場逐步進入成熟期,商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破,制
  • 「國產良心」NFT嘲諷了誰?

    2月23日,一個名為「國產良心」的NFT項目被許多活躍的加密用戶注意到。該項目的官網風格尤為「不正經」,它絲毫沒有避諱自己的小作坊出身,還將「中國人不騙中國人
  • 與元宇宙美少女藝術家的對話

    我最近宣布了我自己的NFT項目,這是我已經工作了幾個月的事情。由于我之前只是一個收藏家,擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
  • 利用元宇宙平臺10天收入160萬,風口還是虎口?

    美國Meta平臺有限公司,也就是原來的臉書公司,9日宣布,公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
  • 這場虛擬發布會,當面“造假”!

    英偉達去年4月份那場發布會,你曾看出什么不對勁的地方嗎?你品,你細品——在計算機圖形學頂會SIGGRAPH 2021上,英偉達通過一部紀錄片自曝:那場發布會內藏玄機~你看到
Top