當前位置：首頁 > 元宇宙 > AI

OpenAI 曾秘密測試 GPT-4o，力壓群雄登頂聊天機器人競技場排行榜

來源：責編：時間：2024-05-16 08:56:53 129觀看

導讀 5 月 14 日消息，OpenAI 員工 William Fedus 周一在社交平臺 X 證實，近期在 LMSYS 聊天機器人競技場 (Chatbot Arena) 上表現優異的神秘聊天機器人“gpt-chatbot”，正是他們剛剛發布的全新人工智能模型 GPT-4o。F

5 月 14 日消息，OpenAI 員工 William Fedus 周一在社交平臺 X 證實，近期在 LMSYS 聊天機器人競技場 (Chatbot Arena) 上表現優異的神秘聊天機器人“gpt-chatbot”，正是他們剛剛發布的全新人工智能模型 GPT-4o。Fedus 還透露，GPT-4o 在測試中登頂了競技場排行榜，取得了有史以來的最高分。

“GPT-4o 是我們最先進的尖端模型，”Fedus 在推特上寫道，“我們一直在競技場使用‘im-also-a-good-gpt2-chatbot’的名稱測試該模型的一個版本。”

聊天機器人競技場是一個網站，訪客可以同時與兩個隨機的 AI 語言模型對話，卻不知道哪個是哪個，然后選擇提供更好回復的模型。

從今年 4 月份開始，OpenAI 在競技場測試了多個版本的 GPT-4o，該模型最初以“gpt2-chatbot” 的名稱出現，然后變成了“im-a-good-gpt2-chatbot”，最后是“im-also-a-good-gpt2-chatbot”。

自 GPT-4o 今日發布以來，多方消息人士透露，該模型以巨大優勢登頂了 LMSYS 的內部排行榜，超越了之前排名最高的模型 Claude 3 Opus 和 GPT-4 Turbo。

lmsys.org 的官方賬號分享了一張圖表，并寫道：“‘gpt2-chatbot’系列模型剛剛飆升至榜首，以顯著的優勢（約 50 Elo）超越了所有其他模型，它已經成為競技場中最強大的模型。這是一張內部截圖，公開版本的‘gpt-4o’現已進入競技場，并很快將出現在公開排行榜上！”

截至發稿時，“im-also-a-good-gpt2-chatbot” 的 Elo 分數為 1309，領先于 GPT-4-Turbo-2023-04-09 的 1253 分和 Claude 3 Opus 的 1246 分。在三個“gpt2-chatbot” 出現并攪局之前，Claude 3 和 GPT-4 Turbo 一直在排行榜上爭奪冠軍。

本文鏈接：http://www.tebozhan.com/showinfo-45-4249-0.htmlOpenAI 曾秘密測試 GPT-4o，力壓群雄登頂聊天機器人競技場排行榜

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌 Gemini 家族添 Flash 新成員：平衡規模和能力、支持多模態，單次可分析 3 萬行代碼

下一篇： AI 聊天機器人大戰升溫：谷歌 Gemini 預告片展示驚艷語音視頻交互能力

標簽：

熱門焦點

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內卷”的當下，一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業的虛擬人夏語冰登上央視節目《對話》，湖南
銀保監會：打擊以“元宇宙”為名義的違法行為

今日，銀保監會發布《關于防范以“元宇宙”名義進行非法集資的風險提示》，全文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名目吸收資金，涉
2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

中國智慧城市試點項目主要集中于東南地區以及華中地區，受制于應用場景分散以及行業地域建設差異，目前中國智慧城市存在較多弊端，未來數量有望持續突破。中國智慧
《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

今日熱點：《刀劍神域：Ex-Chronicle Online Edition》VR展開幕；虛擬活動平臺EventX再獲800萬美元B輪融資；VR射擊游戲《Outlier》確認將于3月17日登陸Steam平臺等。
2030年的元宇宙產業將會如何發展？

對互聯網巨頭傳統業務的反壟斷政策倒逼互聯網企業顛覆創新，尋找新的增長點，移動互聯網流量空間見頂之際，元宇宙時代紅利已然開啟。序章：元宇宙應用場景大猜想元宇
重溫 1602 年：DAO 是新的企業范式嗎？

作者：Andrew Singer“ 將你的選票委托給行業有能力的專家，將使所有者在這些公司的管理中擁有更強大、更清晰的話語權。”1602 年，荷蘭東印度公司成立，許多人認為
NFT領域，我們是否應該遵守版權法

NFTs中最有爭議的因素之一是你是否真的 "擁有 "你所購買的藝術品。除此之外，圍繞著NFT行業內的版權和知識產權盜竊的問題也同樣重要，因為人們很容易誤解這些事情
冬奧會數字收藏品升溫，市場再現“一墩難求”

根據公開信息顯示，國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售，總數為500個，每個99美元，每人限購5個。此外，不同的奧運徽章數字藏
虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

六月的第一個周六，一場虛擬偶像七海Nana7mi的個人3D演唱會在萬代南夢宮上海文化中心舉行，相較于洛天依、百大UP主泠鳶yousa等，這位虛擬Up主在B站上的粉絲數43.6萬

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

OpenAI 曾秘密測試 GPT-4o，力壓群雄登頂聊天機器人競技場排行榜

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

銀保監會：打擊以“元宇宙”為名義的違法行為

2021年中國智慧城市行業概覽：AI慧眼獨具，賦能“雙碳”目標

《刀劍神域》VR展開幕；《Puzzling Places》發布第二個付費DLC

2030年的元宇宙產業將會如何發展？

重溫 1602 年：DAO 是新的企業范式嗎？

NFT領域，我們是否應該遵守版權法

冬奧會數字收藏品升溫，市場再現“一墩難求”

虛擬偶像行業的商用價值逐漸凸顯，IP生態圈也逐漸成型

最新推薦

從科幻走進現實，元宇宙概念逐漸清晰

元宇宙風口下，視覺中國如何重估？

區塊鏈產業人才發展報告

韓國建立元宇宙生態系統，智度股份發布元宇宙社區Meta彼岸

本周NFT領域重要資訊回顧

在元宇宙開會是什么樣一種體驗

猜你喜歡

熱門推薦

相關資訊