當前位置：首頁 > 元宇宙 > AI

七家主流大模型挑戰 2025 高考數學：僅 DeepSeek、訊飛星火得分超 140

來源：責編：時間：2025-06-11 09:58:37 53觀看

導讀 2025 年高考還在進行中，昨天已經考完了語文和數學，相信大家也在網上看到了很多關于這兩門學科試卷難度的討論，比如昨天數學考完后，關于“數學難不難”的話題瞬間爆上了熱搜。當然，試卷的難度對于不同的同學來說可

2025 年高考還在進行中，昨天已經考完了語文和數學，相信大家也在網上看到了很多關于這兩門學科試卷難度的討論，比如昨天數學考完后，關于“數學難不難”的話題瞬間爆上了熱搜。

當然，試卷的難度對于不同的同學來說可能會有不同的感受，不過作為科技編輯，小編比較感興趣的是，今年的數學試卷對于目前很火的 AI 來說難不難呢？

想到這，今天我們不妨就這次高考的數學卷來一次大模型之間的比拼，讓各家的大模型化身“高考學子”，完整地做一套高考數學卷，看看它們各自能拿多少分。

在模擬過程中，小編選擇了以下幾名具有代表性的大模型“考生”，分別是：

?DeepSeek R1 0528

?通義千問 Qwen3-235B-A22B

?訊飛星火 X1-0420

?豆包 Seed-Thingking-v1.5

?文心 X1 Turbo

?騰訊混元 Hunyuan T1 latest

?GPT o3

另外需要說明的是，由于目前網絡流出的試題存在多個版本（回憶題），不完全一致，存在題目不完整的情況，通過多版本交叉驗證 + 老師解題驗證的方式進行評測，總分是 150 分。

同時還邀請了一位專業的評分老師來輔助我們對大模型的答案進行評分：

汪鵬：十年高中數學一線教研專家，主導省級數學教學創新課題，精研命題策略與高分突破路徑。

此外，因 DeepSeek 網頁版 OCR 轉寫不穩定，還有騰訊混元在高考時間段不能用拍圖識別的功能，針對類似情況，我們采用 OCR 轉寫后輸入答題。

由于考題較多，我們無法把所有題目的大模型答題流程和答案都一一呈現，所以這里我們僅挑選一些題目來說明。

話不多說，我們先來看題吧。

1、第 1 題

首先是比較簡單的選擇題第 1 題：

這道題比較容易，DeepSeek R1 的回答如下：

然后是通義千問：

訊飛星火作答：

豆包也給出了正確答案：

文心一言的答案如下：

騰訊混元的回答：

GPT o3 的答案：

對于選擇題第 1 題，各家大模型都給出了正確的答案，仔細看具體的解題流程可能不同，但不影響答案的正確性。

2、第 5 題

下面稍微上點難度，選擇題第 5 題是一道函數題：

各家大模型的答案和截圖過程如下：

DeepSeek ：

通義千問：

訊飛星火：

豆包：

文心一言：

騰訊混元：

GPT o3：

這一道選擇題的正確答案是 A，全部答對。

3、第 8 題

接下來我們看更難一點的題，選擇題第 8 題，這也是一道涉及到對數的函數題：

面對這道題，各家大模型給出的答案如下：

DeepSeek R1：

通義千問：

訊飛星火：

豆包大模型：

文心一言：

騰訊混元：

GPT o3：

這道題目的正確答案是 B，豆包大模型和 DeepSeek 答錯了，其他的大模型均給出了正確的答案。

4、第 16 題

接下來我們來看解答題，解答題的評分不只看結果，還要看解題的過程，過程不對也會被扣分。這里我們以解答題的第 16 題來作為例子，這道題已經是解答題中偏中等難度的題目，涉及數列和函數相關的知識點。

我們先看 DeepSeek R1，給出的結果沒有扣分項，可以得到滿分（15 分）：

通義千問的解答和最終答案也是正確的：

訊飛星火的回答，解題過程清晰明了，答案正確：

然后是豆包大模型的回答，同樣步驟和結果都沒什么問題：

文心一言第二個小題答案錯了，只能得到 6 分：

騰訊混元兩個小題的回答都存在問題，因此這道題只能得 0 分：

GPT o3 的兩個回答解題過程都沒有問題，但是第二個小問的最后結果呈現表達上有點小瑕疵，得 14 分：

5、第 18 題

最后是難度更高，挑戰比較大的第 18 題，

面對這道題，訊飛星火 X1、豆包大模型、DeepSeek R1、通義千問、騰訊元寶以及 GPT o3 的解題過程和答案都沒什么問題，拿到了 17 分滿分，而文心 X1 模型的答案存在錯誤，得分為 10 分。

Deepseek：

通義千問：

訊飛星火:

?豆包大模型:

文心一言:

騰訊混元：

GPT o3：

以上是這次七家大模型挑戰 2025 高考數學全國 1 卷的部分題目作答情況的舉例，下面我們再來看這次“考試”各位大模型“考生”的總體得分情況：

可以看到，在這次“考試”中，DeepSeek、訊飛星火兩家表現突出，是唯二突破 140 分的大模型，穩居國內大模型數學能力的第一梯隊，在考生中也達到了“尖子生”標準。其中，DeepSeek 以 143 分的成績位列榜首，訊飛星火以 141 分緊隨其后，位居第二，GPT o3 則以 138 分獲得第三名。

本次排名第一的 DeepSeek R1 模型，是在 5 月 28 日升級了最新版本，也是本次評測的模型里最“新”的一位考生，升級后的版本在思考推理、數學能力、響應速度等方面有了大幅提升，但其在實際應用中也暴露出了一些明顯短板。首先在實測中，我們發現 DeepSeek 在 OCR 識別效果不理想，出現不少題目識別錯誤，為確保準確性，我們只能用其他 AI 將試卷圖片轉化為文本問題，再給到 DeepSeek 作答；其次，DeepSeek 模型版本較大，導致推理速度慢、資源消耗高，在實際的教學場景中可能面臨響應效率問題。

此外，在這次考試中僅以 2 分之差緊隨其后的訊飛星火，是在 4 月 20 日升級，版本較早，但在模型量級更小（70b）的情況下，其依然取得了 141 分的高分，并顯著超越了豆包等其他參與測評的國內大模型。尤其值得一提的是，訊飛星火 X1 是基于全國產算力平臺訓練出來的，可見他們背后的自主技術研發實力值得肯定，訊飛在教育領域長達 20 多年的資源積累，也體現在了訊飛星火在數學能力上的高效準確。

作為國產大模型的代表，豆包、通義千問等大模型分數緊跟 GPT o3，基本上和國際頂尖的模型水平打了個平手。

此次國內外大模型參考“2025 高考數學”，也是深度推理模型的一場大考，和去年相比，AI 的數學能力有了非常明顯的提升。2025 年將是 AI 應用落地的爆發期，如何讓 AI 更好的成為我們的幫手，拓展 AI 在教育領域深度應用的更多可能性，將推理模型的優勢與教學實際深度結合等等，或許就是我們用 AI 來作答高考試卷背后的用意和價值所在。

本文鏈接：http://www.tebozhan.com/showinfo-45-13600-0.html七家主流大模型挑戰 2025 高考數學：僅 DeepSeek、訊飛星火得分超 140

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： AI發展至AJI階段，谷歌CEO皮查伊：通用AI還需至少二十年

下一篇：視頻生成平臺 Runway 舉辦年度 AI 電影節，6000 部參賽作品決出十強

標簽：

熱門焦點

字節跳動，剛剛投了一位虛擬女生

今年第一筆虛擬人融資出爐了。投資界獲悉，杭州李未可科技有限公司顯示發生股東變更，新增字節跳動關聯公司北京量子躍動科技有限公司。今天公司方面正式確認，本輪
“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

在打工人“反內卷”的當下，一眾虛擬人卻“內卷”了起來。從北京春晚虛擬人蘇小妹與劉宇演繹歌舞《星河入夢》，央美畢業的虛擬人夏語冰登上央視節目《對話》，湖南
2022年6款最佳的NFT稀有度查詢工具

NFT正在風靡全球，但擁有一個你自認為看起來很酷的 NFT 是不夠的，因為它還應該是稀有的，稀有度會影響每個 NFT 的價值。因此，如果您打算投資 NFT，則需要使用 NFT 稀
銀保監會：打擊以“元宇宙”為名義的違法行為

今日，銀保監會發布《關于防范以“元宇宙”名義進行非法集資的風險提示》，全文如下：近期，一些不法分子蹭熱點，以“元宇宙投資項目”“元宇宙鏈游”等名目吸收資金，涉
Interface正大光明的“跑路”，社區成員贊格局大

今日凌晨，一個廣泛受社區期待的潛力藍籌項目Interfaces突然發文宣布項目停止運營，后續也不會有鑄造NFT系列的活動。這對社區來說就是一重磅炸彈，大多數人完全不明
獨立故事片“Calladita”將使用 NFT 籌集資金

導演 Miguel Faus 正在轉向加密來資助他的處女作，由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”（導演 Miguel Faus）。圖片：米格爾·福斯在過去的一年
元宇宙需要的5個重要安全功能

元宇宙的可能用途使其成為一個令人難以置信的概念，但是，就像科技界的任何事物一樣，需要做一些事情來控制其使用。元宇宙的安全功能需要仔細考慮和開發，以保護用戶
盤點9個主流元宇宙平臺，你都知道哪些？

隨著NFT的持續升溫，它也加入了現在的元宇宙浪潮。本文介紹元宇宙的基本概念以及九個最流行的元宇宙NFT平臺，如Decentraland、sandbox等。用熟悉的語言學習以太
元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

近日，畢馬威正式發布其《初探元宇宙》報告，這也是畢馬威在元宇宙領域發布的首份報告。報告指出，元宇宙在以下十個領域的應用場景尤其值得期待，包括娛樂、社交、零

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

七家主流大模型挑戰 2025 高考數學：僅 DeepSeek、訊飛星火得分超 140

字節跳動，剛剛投了一位虛擬女生

“虛擬人”角斗場，基于“硬實力”下的人性平衡法則？

2022年6款最佳的NFT稀有度查詢工具

銀保監會：打擊以“元宇宙”為名義的違法行為

Interface正大光明的“跑路”，社區成員贊格局大

獨立故事片“Calladita”將使用 NFT 籌集資金

元宇宙需要的5個重要安全功能

盤點9個主流元宇宙平臺，你都知道哪些？

元宇宙的應用行業研究：娛樂可能是元宇宙落地最快的場景之一

最新推薦

文心一言排名墊底，卻成為百度業績增長杠桿

從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

2022年去中心化交易所會崛起嗎？

用戶可以把自己的醫療健康數據做成NFT出售給醫藥公司掙錢

這個好萊塢影視制作公司涉足NFT，讓持有者在制作中發揮作用

元宇宙專題二：GameFi 深度解析，元宇宙內容雛形顯現

猜你喜歡

熱門推薦

相關資訊