7 月 22 日消息,國際數(shù)學(xué)奧林匹克競賽(IMO)是全球最負(fù)盛名的數(shù)學(xué)競賽之一,每年每個(gè)國家由六名高中生代表參賽,他們需在規(guī)定時(shí)間內(nèi)解答六道極具挑戰(zhàn)性的數(shù)學(xué)難題。在這一競賽中,僅有約 8% 的參賽者能夠獲得金牌,這使得 IMO 的金牌成為數(shù)學(xué)領(lǐng)域的至高榮譽(yù)。
在今年的國際數(shù)學(xué)奧林匹克競賽中,OpenAI 和谷歌都使用了它們最新的大語言模型(LLM)參賽。
上周末,OpenAI 宣布其實(shí)驗(yàn)性推理語言模型在 2025 年 IMO 的題目測試中取得了金牌級別的成績。OpenAI 的模型在與學(xué)生相同的規(guī)則下進(jìn)行了測試,需要在兩場時(shí)長各 4.5 小時(shí)的考試時(shí)段內(nèi)完成題目解答,且不能使用任何工具或聯(lián)網(wǎng),最終還需以自然語言形式書寫證明過程。
今日,谷歌也宣布其升級版的 Gemini Deep Think 成功解決了 IMO 六道題目中的五道,同樣達(dá)到了金牌水平的表現(xiàn)。這一升級版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改進(jìn)推理模式,包括并行思維技術(shù),使其能夠同時(shí)探索多種解決方案,而不再局限于逐一嘗試。
注意到,谷歌 DeepMind 團(tuán)隊(duì)在介紹這一升級版的 Gemini Deep Think 時(shí)表示:“為了充分發(fā)揮 Deep Think 的推理能力,我們利用了新穎的強(qiáng)化學(xué)習(xí)技術(shù),進(jìn)一步增強(qiáng)了模型的多步推理、問題解決和定理證明能力。此外,我們還為 Gemini 提供了高質(zhì)量數(shù)學(xué)問題解決方案的精選語料庫,并在其指令中添加了一些關(guān)于如何應(yīng)對 IMO 問題的通用提示詞和技巧。”
谷歌計(jì)劃在未來不久將這一升級版的 Deep Think 模型提供給一組受信任的測試者進(jìn)行試用,并將在后續(xù)向谷歌 AI Ultra 訂閱用戶開放使用權(quán)限。
本文鏈接:http://www.tebozhan.com/showinfo-45-14880-0.html繼 OpenAI 之后,谷歌宣布其 Gemini AI 在國際數(shù)學(xué)奧林匹克競賽測試中獲金牌水平成績
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 給 AI“補(bǔ)補(bǔ)課”:微軟砸資源搶救歐洲小語種
下一篇: 百度新一代數(shù)字人技術(shù) NOVA 預(yù)計(jì) 10 月開放,曾支撐羅永浩數(shù)字人直播間