8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型現已正式上線,現已在 Gemini 應用中向 Google AI Ultra 訂閱用戶開放。這款新模型在多個關鍵基準測試中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。
據外媒 Neowin 報道,今年 5 月,谷歌在 Google I/O 大會上首次介紹了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前綜合多個假設進行推理。本次發布的是該功能的升級版,結合早期內測用戶的反饋和最新研究成果進行了優化。谷歌表示,新版本在性能上相比最初的 I/O 版本有了顯著提升。
谷歌還透露,這一模型是此前模型的一個變體(注:前述模型已在國際數學奧林匹克競賽中獲得金牌)。為適應日常使用場景,谷歌對其進行了加速優化,因此在 2025 年 IMO 基準測試中僅達到銅牌水平。
從基準測試結果可知,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等項目中均表現優異。
目前,Google AI Ultra 用戶每天可以在 Gemini 應用中以限定次數使用 Deep Think。當啟用 Gemini 2.5 Pro 模型時,輸入欄會顯示“Deep Think”選項。谷歌指出,該功能將自動集成代碼執行和谷歌搜索等工具。谷歌還計劃在未來幾周內,通過 Gemini API 向部分開發者提供帶工具與不帶工具的 Deep Think 模型版本。
本文鏈接:http://www.tebozhan.com/showinfo-45-25812-0.html多項力壓 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com