當前位置：首頁 > 元宇宙 > AI

初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

來源：責編：時間：2025-04-18 06:48:58 94觀看

導讀 4 月 16 日消息，科技媒體 bleepingcomputer 昨日（4 月 15 日）發布博文，報道稱 OpenAI 最新發布的 GPT-4.1 系列模型，其性能相比 GPT-4o 雖然實現重大飛躍，但多項跑分未能超越谷歌的 Gemini 系列。昨日報道，OpenAI 公

4 月 16 日消息，科技媒體 bleepingcomputer 昨日（4 月 15 日）發布博文，報道稱 OpenAI 最新發布的 GPT-4.1 系列模型，其性能相比 GPT-4o 雖然實現重大飛躍，但多項跑分未能超越谷歌的 Gemini 系列。

昨日報道，OpenAI 公司發布 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，官方公布的跑分數據來看，這些模型在編程方面的能力，遠超 GPT-4o 及 GPT-4o mini。

例如在 SWE-bench Verified 跑分中，GPT-4o 的得分為 21.4%，GPT-4.5 的得分為 26.6%，而 GPT-4.1 的得分為 54.6%。

盡管性能有較大提升，不過根據多位專家測試，相比較谷歌的 Gemini 系列，GPT-4.1 對比中卻顯露劣勢。

根據 Stagehand（一款生產級瀏覽器自動化框架）發布的基準數據，Gemini 2.0 Flash 的錯誤率僅為 6.67%，精確匹配率高達 90%，且價格低廉、速度更快。相比之下，GPT-4.1 的錯誤率高達 16.67%，成本更是 Gemini 2.0 Flash 的 10 倍以上。

此外，哈佛大學 RNA 科學家 Pierre Bongrand 提供的數據也指出，GPT-4.1 的性價比不及 Gemini 2.0 Flash、Gemini 2.5 Pro 及 DeepSeek 等競品。

在編碼專項測試中，GPT-4.1 同樣未能占據上風。Aider Polyglot 的測試結果顯示，GPT-4.1 的編碼得分僅為 52%，而 Gemini 2.5 則以 73% 的成績遙遙領先。

值得注意的是，GPT-4.1 被歸類為非推理模型（non-reasoning model），但其編碼能力仍屬行業頂尖。

本文鏈接：http://www.tebozhan.com/showinfo-45-12352-0.html初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： OpenAI 的 GPT - 4.1 無安全報告，AI 安全透明度再遭質疑

下一篇：消息稱蘋果 watchOS 12 將引入 Apple Intelligence 功能，依賴 iPhone 運行模型

標簽：

熱門焦點

AI網紅能年賺百萬，普通人的新機會來了？

來源｜運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年，數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡，還是 AI 數字
一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

當數字人成為一種生意，我們更關心的是，他們如何賺到錢，以及這意味著什么？01#“柳夜熙”爆火之后不知道大家還記不記得，去年10月31日萬圣節，有一位虛擬美妝
元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

元宇宙的余熱依然沒有過去，甚至大有星星之火開啟燎原之勢，元宇宙本身也從殿堂走向了民間，我們可以看到一些企業開始了元宇宙的探索，諸如中國電信全資控股子公司天
上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

區塊鏈日報17日訊今日《元宇宙新鮮事》有：上海虹口將成立總額約10億元的元宇宙產業基金；香港市場首只元宇宙主題ETF擬于2月21日上市；元宇宙平臺Roblox出現違禁游
2022年6款最佳的NFT稀有度查詢工具

NFT正在風靡全球，但擁有一個你自認為看起來很酷的 NFT 是不夠的，因為它還應該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
借VR產業東風，江西搶灘布局“元宇宙”

自2016年起就在VR上傾注了大量精力的江西省，迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口，使人們可以在數字空間和物理空間自由穿梭。自2016年起
元宇宙風歸何處？

元宇宙持續大火，在過去一段時間內，其屢次登上熱點，吸引了一波又一波投資者。近期，在“2022中國·金魚嘴元宇宙生態賦能大會”上，南京建鄴區金魚嘴基金街區宣布計劃
Staking 收益翻倍？

以太坊質押可能很快就會有兩倍的利潤。Coinbase 估計，在 1 月份以太坊網絡合并后，持有 ETH 的回報將翻倍。增長預期假設來自加密貨幣交易所 Coinbase 的估計是準
淺聊DAO圖景和未來

DAO是什么？DAO (Decentralized Autonomous Organizations),去中心化自治組織，是基于區塊鏈技術，由社區通過透明的決策過程運行和管理的組織形態。DAO使得社區成為

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

初探 OpenAI GPT-4.1 性能：AI 編程能力大增，但谷歌 Gemini 依然稱王

AI網紅能年賺百萬，普通人的新機會來了？

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

元宇宙火熱的當下，我們該如何“身臨其境”的體驗元宇宙？

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

2022年6款最佳的NFT稀有度查詢工具

借VR產業東風，江西搶灘布局“元宇宙”

元宇宙風歸何處？

Staking 收益翻倍？

淺聊DAO圖景和未來

最新推薦

文心一言排名墊底，卻成為百度業績增長杠桿

星展銀行(DBS)計劃推出零售數字資產交易服務

中國區塊鏈產業生態地圖報告（2021）

Web3 去中心化身份管理系統的歷史、現狀與展望

元宇宙存在的意義和價值

百度虛擬人——AI手語主播首次亮相冬奧會！

猜你喜歡

熱門推薦

相關資訊