當前位置：首頁 > 元宇宙 > AI

OpenAI開源BrowseComp測試基準，Deep Research模型瀏覽器能力大突破？

來源：責編：時間：2025-04-11 11:37:46 67觀看

導讀在科技界的又一重大進展中，OpenAI于今日凌晨正式推出了BrowseComp，一個專為智能體瀏覽器功能設計的挑戰性測試基準。據悉，該基準測試難度極高，即便是OpenAI自家的GPT-4o與GPT-4.5，在這項測試中的表現也不盡如人意，準確率分

在科技界的又一重大進展中，OpenAI于今日凌晨正式推出了BrowseComp，一個專為智能體瀏覽器功能設計的挑戰性測試基準。據悉，該基準測試難度極高，即便是OpenAI自家的GPT-4o與GPT-4.5，在這項測試中的表現也不盡如人意，準確率分別僅為0.6%與0.9%，幾乎可以忽略不計。即便是加入了瀏覽器功能的GPT-4o，其準確率也僅僅提升至1.9%。

然而，就在眾人對這一測試結果感到驚訝之際，OpenAI最新發布的Agent模型——Deep Research，卻以驚人的51.5%準確率脫穎而出。這一成績不僅遠超其前輩，更在自主搜索、信息整合以及準確性校準等多個方面展現出了卓越的能力。Deep Research的出色表現，無疑為智能體瀏覽器功能的發展樹立了新的標桿。

據業內人士分析，BrowseComp測試基準的推出，不僅是對當前智能體瀏覽器功能的一次全面檢驗，更是對未來智能體發展方向的一次重要指引。Deep Research的成功，無疑為智能體在瀏覽器環境下的應用開辟了新的可能，預示著智能體將更加深入地融入人們的日常生活與工作之中。

對于OpenAI而言，Deep Research的出色表現無疑是對其研發實力的一次有力證明。同時，這也將進一步推動OpenAI在智能體領域的探索與創新，為人工智能技術的未來發展注入新的活力。

隨著人工智能技術的不斷進步，智能體瀏覽器功能的應用前景將更加廣闊。無論是在教育、醫療、金融等傳統行業，還是在智能家居、智能交通等新興領域，智能體都將扮演著越來越重要的角色。而Deep Research的成功，無疑為這些領域的發展提供了更為強大的技術支持。

舉報 0收藏 0打賞 0評論 0

更多>同類資訊

馬云談科技：應讓AI更懂人類，攜手共創善良高科技時代

科技人員的責任，不是讓AI取代人類，而是讓AI更懂人類、更好地服務人類。“科技的意義是要讓人類活得更好，活得更有意義，是讓所有的普通人從中受益。”未來不是讓AI取代人類，而是應該讓AI解放人類，更懂人類，服務…

04-11

商湯發布日日新V6大模型，對標OpenAI，解鎖10分鐘視頻全幀率解析

04-11

聯發科天璣9400+震撼登場：性能再飛躍，藍牙連接破10公里

04-11

中國移動打造全國首“四算合一”算力網，芯片國產化率超九成！

04-11

亞馬遜CEO安迪·賈西：企業投資AI，高額投入換未來高額回報

04-11

蘋果Siri發展之路：內部動蕩不斷，未來能否重獲新生？

04-11

17歲開發者讓iPhone 3GS“重生”，iOS 6老設備也能體驗ChatGPT

04-11

宇樹G1機器人化身“鐵甲拳王”，即將上演格斗直播大戰？

04-10

星塵智能A輪及A+輪融資數億，錦秋基金螞蟻集團等共鑄AI機器人未來

04-10

MIT新研究：AI價值觀飄忽不定，對齊之路挑戰重重

04-10

深勢科技發布全流程AI科研平臺，能否徹底解決學術搜索痛點？

張林峰談道，現在AI4S的發展趨勢是，一方面模型走向成熟，另一方面其發展階段可以對標GPT-3，處于有基本數據積累以及面向下游能夠實現遷移泛化的階段，但在實驗、生產、計算的科學探索領域仍存在較大問題。因此…

04-10

2025年AI原生應用創新案例揭曉，跨領域融合成新趨勢

04-10

亞馬遜CEO展望：AI業務爆發，2024年營收躍升三位數增長

04-10

華為云CloudMatrix 384超節點亮相，硅基流動DeepSeek-R1服務正式上線

04-10

AI重塑情欲世界：人類將陷入“情感繭房”危機？

這也是我所認識的一位985院校青年教師告訴我的，目前她發現自己的學生們身上顯現出新特征：觀念極化，處理關系忍耐度很低，他們或許并非AI之下成長的一代，但他們也是移動互聯網的一代，是信息繭房里的一代，移動互聯…

04-10

點擊查看更多 +

全站最新

上汽之夜：共繪智能出行新藍圖，平權共創引領汽車產業變革

比亞迪e7純電轎車亮相，網約車市場新選擇，續航達520公里

吉利銀河星耀8預售開啟，以豪華科技重塑中大型電混轎車市場

比亞迪純電銷量超特斯拉，全球登頂在即，中國汽車工業新篇章？

比亞迪漢L唐L新上市，高壓平臺大馬力提升，是否真的物有所值？

倍耐力P Zero超高性能輪胎首戰告捷，Tyre Reviews測試奪冠！

熱門內容

某大廠大模型高管涉婚變，公司賬號停用引熱議
華為Pura X震撼發布：獨特“闊折疊”形態，售價7499元起引領新潮流！
立陶宛高校：學生不當使用AI，學術不端遭開除
夸克全新升級：AI超級框，你的全能助手來了！
阿里新夸克AI超級框上線，能否撼動騰訊元寶的AI入口地位？
英偉達推出DGX Spark與Station個人AI超算，Spark版售3000美元起
百度文心大模型4.5及X1正式發布，全面免費開放，性能對標國際前沿
315曝光信息黑洞后，遼寧云企智能科技經營異常被列入名錄
比爾·蓋茨展望：AI將深度改造行業，人類生來不為工作？
谷歌開源Gemma-3多模態大模型，性能強勁媲美業界頂尖
阿里新夸克：AI超級框能否引領移動互聯網新入口？
微信生態AI賦能，視頻號、搜一搜、小店共鑄增長新篇章
劉強東低調現身香港科大，探訪人工智能領域新進展？
魅族愚人節“玩笑”？官宣跨世代AI硅基人戰神Note 16號僅售1999元
豆包大模型負責人飛書停用，內部風波起？真相待解

本欄最新

商湯發布日日新V6大模型，對標OpenAI，解鎖10分鐘視頻全幀率解析

聯發科天璣9400+震撼登場：性能再飛躍，藍牙連接破10公里

中國移動打造全國首“四算合一”算力網，芯片國產化率超九成！

蘋果Siri發展之路：內部動蕩不斷，未來能否重獲新生？

17歲開發者讓iPhone 3GS“重生”，iOS 6老設備也能體驗ChatGPT

宇樹G1機器人化身“鐵甲拳王”，即將上演格斗直播大戰？

本文鏈接：http://www.tebozhan.com/showinfo-45-12162-0.htmlOpenAI開源BrowseComp測試基準，Deep Research模型瀏覽器能力大突破？

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：聯發科天璣9400+發布：旗艦AI芯片，端側推理能力超越云端

下一篇：馬云：高科技絕不僅是征服星辰大海，更應該呵護人間煙火

標簽：

熱門焦點

元宇宙終究沒火過兩年

來源：傳播體操在ChatGPT快速破圈的同時，元宇宙的熱度卻一瀉千里。雖然互聯網大廠們都沒有否認元宇宙的長期想象力，但在行動上卻都紛紛表示了對元宇宙短期前景的悲觀。號稱改變
AI界地震！美國對OpenAI展開調查！監管風暴來襲！

來源：清元宇宙還記得5月OpenAI在國會山聽證會上的自信、坦誠、游刃有余的問答嗎？那時的Sam Altman可謂意氣風發，在耐心、友好的國會議員面前，就AI立法、大模型安全性問題侃侃而
藍標虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

日前，天下秀數字科技集團正式公布了2022年報及2023年一季報。報告顯示，2022年天下秀實現營收41.29億元，同比下滑8.48%；歸母凈利潤1.8億元，同比下滑49.2%，幾乎出現了盈利腰斬的態勢
元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內，從字節“派對島&
有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

你還不知道元宇宙？沒關系。看看微軟、Meta、英偉達的雄心壯志，便可領略元宇宙的遼闊。1月18日，微軟宣布將以687億美元收購動視暴雪，這是有史以來互聯網領域最大的
“元宇宙第一股”Roblox緣何被資本市場看“低”？

近期，冬奧會的召開受到廣泛關注，而吉祥物冰墩墩也成為新晉“頂流”，“一墩難求”成為普遍心聲，為了滿足大眾需求，nWayPlay平臺曾在2月12日發售了一款由國際奧委會官
摩根大通：元宇宙市場預計每年收入超1萬億美元

今日《元宇宙新鮮事》有：香港首屆元宇宙藝博會將于5月舉辦；NH-Amundi Asset Management上市其第二支元宇宙ETF；Meta虛擬現實平臺Horizon Worlds月活躍用戶在三個
與元宇宙美少女藝術家的對話

我最近宣布了我自己的NFT項目，這是我已經工作了幾個月的事情。由于我之前只是一個收藏家，擁有自己的項目真的給了我一個新的視角來看待這個領域。我一直歡迎人們
我們離元宇宙的實現只差一副眼鏡？

近日的蘋果春季新品發布會，想必許多人都守在了屏幕前，就為等待傳說中的首款AR Glass。在發布會之前，蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

OpenAI開源BrowseComp測試基準，Deep Research模型瀏覽器能力大突破？

元宇宙終究沒火過兩年

AI界地震！美國對OpenAI展開調查！監管風暴來襲！

藍標虧錢、Meta裁員：天下秀還值得砸錢元宇宙嗎？

元宇宙步入暗夜

有人狂賺千倍，資金盤游戲日進上億，元宇宙泡沫還能吹多久？

“元宇宙第一股”Roblox緣何被資本市場看“低”？

摩根大通：元宇宙市場預計每年收入超1萬億美元

與元宇宙美少女藝術家的對話

我們離元宇宙的實現只差一副眼鏡？

最新推薦

錯過了BRC20還有eths,eth銘文協議

在元宇宙賣酸奶，這波聯動燃爆了！

比特幣的價格越高，使用價值越大

Meta、谷歌、微軟競相涌入元宇宙，小型企業該如何伺機而動？

頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

冬奧會數字收藏品升溫，市場再現“一墩難求”

猜你喜歡

熱門推薦

相關資訊