8 月 6 日消息,科技媒體 webpronews 昨日(8 月 5 日)發(fā)布博文,報(bào)道稱谷歌 DeepMind 于 8 月 5~7 日在 Kaggle 的 Game Arena 平臺上,舉辦“AI 國際象棋”比賽,邀請 OpenAI、Anthropic、谷歌、Kimi、Deepseek 在內(nèi)的頂尖模型一較高下。
DeepMind 表示,本次“AI 國際象棋”比賽的目的,是檢驗(yàn)頂級 AI 模型的推理能力。本次活動將于 8 月 5~7 日舉行,每日舉辦一輪比賽,由國際象棋大師 Hikaru Nakamura 和流媒體播主 Levy Rozman 解說。
在 AI 發(fā)展的重要時刻,這場象棋對決提供了一個嚴(yán)格的測試,以評估 AI 的預(yù)見和策略調(diào)整能力,文本基礎(chǔ)的格式解決了許多大型語言模型在視覺象棋盤表示上的難題,提供了一個更公平的推理能力測試。
附上本次參賽選手如下:
Gemini 2.5 Pro(Google)
Gemini 2.5 Flash(Google)
o3(OpenAI)
o4-mini(OpenAI)
Claude 4 Opus(Anthropic)
Grok 4(xAI)
DeepSeek R1
Kimi k2(Moonshot AI)
根據(jù)首日戰(zhàn)況,OpenAI 的 o4 mini 勝過 Deepseek-R1、OpenAI 的 o3 超過 Kimi K2 Instruct 模型、谷歌的 Gemini 2.5 Pro 勝過 Claude Opus 4、xAI 的 Grok4 模型超過谷歌的 Gemini 2.5 Flash。
本文鏈接:http://www.tebozhan.com/showinfo-45-25917-0.html國際象棋最強(qiáng) AI 鳴鑼開賽:首日戰(zhàn)果公布,OpenAI 的 o3、xAI 的 Grok4 等晉級
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com