當前位置：首頁 > 科技 > 網絡

李飛飛實驗室2025 AI報告出爐：中美AI模型差距近乎持平

來源：責編：時間：2025-04-09 07:26:58 81觀看

導讀中美AI模型差距正在縮小。由李飛飛聯合領導，斯坦福大學以人為本人工智能研究所（HAI）新發布了2025 AI Index，用整整456頁追蹤了2024年全球AI行業的發展趨勢，并得出了這樣的結論。至今，HAI已發布了8份（含本次）AI年度

中美AI模型差距正在縮小。

由李飛飛聯合領導，斯坦福大學以人為本人工智能研究所（HAI）新發布了2025 AI Index，用整整456頁追蹤了2024年全球AI行業的發展趨勢，并得出了這樣的結論。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

至今，HAI已發布了8份（含本次）AI年度報告，不過今年的這份卻尤為特殊。

這是我們迄今為止全面的版本，人工智能對社會的影響從未如此明顯。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

雖然報告信息量爆炸，但手快的網友已經提前為大家劃了重點：

AI推理成本降低了280倍開源模型正在迎頭趕上AI基準測試成績飆升……

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

話不多說，下面我們詳細展開報告中提到的一些重要結論。

中美AI模型差距正在縮小

從官網消息來看，鑒于報告內容較多，HAI直接為大家挑出了其中重要的12個結論。

我們先來看與國內相關的部分。

中美AI模型差距正在縮小

首先就是AI模型方面，中國模型雖然數量不及美國，但質量方面已迅速縮小差距。

報告顯示，2024年美國機構一共開發了40個值得關注的AI模型，遠高于中國開發的15個和歐洲的3個。

不過，中美模型之間的性能差異正在快速縮小。具體表現為，在MMLU和HumanEval等主要基準測試上，二者的性能差異由2023年的兩位數縮小到2024年的接近相等。

同時，從中美模型過去一年在大模型競技場中的表現也能看出這一追趕趨勢：

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

當然，這一性能差距正在縮小的趨勢也不局限于中美之間。

報告提到，排名第一和第十的模型之間的得分差距在一年內從11.9%降至5.4%，排名前兩位的差距現在僅為 0.7%。

也就是說，頂尖模型之間的競爭越來越激烈。

順帶一提，國內在發表AI論文和推出AI專利方面繼續保持領先地位。

中國是對AI樂觀的國家

其次是在對AI的態度方面，中國始終是全球主要國家和地區中樂觀的。

報告顯示，2024年中國有83%的人認為AI產品和服務利大于弊，排在后面的是印度尼西亞（80%）和泰國（77%）。

相比之下，美國（39%）、加拿大（40%）等的樂觀情緒遠低于國內。

不過從整體趨勢來看，自2022年以來，幾個之前對AI持懷疑態度的國家樂觀情緒增長顯著，比如美國（+4%）、加拿大（+8%）、法國（+10%）等等。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

除了以上兩點，還有一些AI整體趨勢變化也值得關注。

AI基準測試成績飆升，表現逐漸接近人類

一個比較符合大家日常感受的結論是：AI模型在各大基準測試上的得分越來越高了。

報告顯示，研究人員在2023年引入了一些如今大家已耳熟能詳的基準——MMMU、GPQA和SWE-bench，以此測試更高級AI模型的能力極限。

然而僅僅一年之后，從測試得分來看，其性能呈現大幅提升趨勢，分別在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3個百分點。

從整體趨勢來看，AI各大能力表現逐漸接近人類，甚至在某些場景下，智能體能在限時編程任務中超越人類。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

推理成本下降了280倍，開源模型正在迎頭趕上

另一個符合大家印象的趨勢是：AI正變得更加高效、經濟實惠和易于獲取。

過去兩年間，追求更具性價比的小模型逐漸成為一股潮流。

比如報告中提到的，在MMLU中得分超過60%的小模型：

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

數據顯示，由越來越強大的小模型驅動，對于性能達到GPT-3.5水平的系統的推理成本，在2022年11月到2024年10月間下降了280倍。

遺憾的是，復雜推理仍然面臨挑戰。

截至目前，AI模型在國際數學奧林匹克競賽問題等任務中表現出色，但仍無法很好應對PlanBench等復雜推理基準測試。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

不過與此同時，開源模型也在縮小與閉源模型的差距。

報告中特意提到，在某些基準測試中，它們一年內的性能差異就從8%減少到僅1.7%。

另外在硬件層面，成本每年下降30%，而能效每年提高40%。

以上趨勢共同降低了人們獲取高級AI的門檻。

AI正在融入日常生活，企業投資增長強勁

正是由于AI獲取門檻降低，我們的日常生活也逐漸被AI改寫。

報告顯示，從醫療保健到交通運輸，AI正迅速從實驗室走向日常生活。

比如2023年，美國FDA批準了223種AI醫療設備，而2015年僅為6種。

另外在自動駕駛方面，美國大的運營商之一Waymo每周提供超過15萬次自動駕駛出行，而百度的經濟型“蘿卜快跑” （Apollo Go）自動駕駛出租車車隊現在已在中國多個城市提供服務。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

整體而言，AI的應用落地正在加速。

2024年，有78%的組織報告自己正在使用AI，這比前一年增長了55%。

李飛飛實驗室2025 AI報告出爐：AI推理成本降低至1/280

當然，以上服務也離不開企業對AI的大力投資。

報告顯示，2024年美國對AI的投資為1091億美元，這幾乎是中國（93億美元）的12倍和英國（45億美元）的24倍。

其中生成式AI尤其強勁，吸引了全球私營投資339億美元，這一數字比2023年增長了18.7%。

BTW，除了上述主要結論，報告還提到了：

各國政府正在加強對AI的監管和投資；負責任的AI生態系統正在不斷發展，但不均衡；目前有2/3的國家提供或計劃提供K-12計算機科學教育（數量是2019年的兩倍），其中非洲和拉丁美洲的進步大；2024年近90%的知名AI模型來自工業界，高于前一年的60%。

文章出處：量子位

本文鏈接：http://www.tebozhan.com/showinfo-17-142322-0.html李飛飛實驗室2025 AI報告出爐：中美AI模型差距近乎持平

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：背誦18萬字的黃帝內經有機會得145萬元超千人報名參賽

下一篇：蘋果上演關稅大逃亡：5架飛機滿載iPhone急赴美國

標簽：

熱門焦點

5月iOS設備好評榜：iPhone 14僅排第43？

來到新的一月，安兔兔的各個榜單又重新匯總了數據，像安卓陣營的榜單都有著比較大的變動，不過iOS由于設備的更新換代并沒有那么快，所以相對來說變化并不大，特別是iOS好評榜，老款設
印度登月最關鍵一步！月船三號今晚進入環月軌道

8月5日消息，據印度官方消息，月船三號將于北京時間今晚21時30分左右開始近月制動進入環月軌道。這是該探測器能夠成功的最關鍵步驟之一，如果成功將開始圍
三分鐘白話RocketMQ系列—— 如何發送消息

我們知道RocketMQ主要分為消息生產、存儲（消息堆積）、消費三大塊領域。那接下來，我們白話一下，RocketMQ是如何發送消息的，揭秘消息生產全過程。注意，如果白話中不小心提到相關代
東方甄選單飛：有些鳥注定是關不住的

文/彭寬鴻編輯/羅卿東方甄選創始人俞敏洪帶隊的“7天甘肅行”直播活動已在近日順利收官。成立后一年多時間里，東方甄選要脫離抖音自立門戶的傳聞不絕于耳，“7
阿里瓴羊One推出背后，零售企業迎數字化新解

作者:劉曠近年來隨著數字經濟的高速發展，各式各樣的SaaS應用服務更是層出不窮，但本質上SaaS大多局限于單一業務流層面，對用戶核心關切的增長問題等則沒有提供更好的解法。在Saa
重估百度丨大模型，能撐起百度的“今天”嗎?

自象限原創作者｜程心羅輯2023年之前，對于自己的“今天”，百度也很迷茫。“新業務到 2022 年底還是 0，希望 2023 年出來一個 1。”這是2022年底，李彥宏
自研Exynos回歸！三星Galaxy S24系列將提供Exynos和驍龍雙版本

年初，全新的三星Galaxy S23系列發布，包含Galaxy S23、Galaxy S23+和Galaxy S23 Ultra三個版本，全系搭載超頻版驍龍8 Gen 2，雖同樣采用臺積電4nm工藝制
iQOO 11S屏幕細節公布：首發三星2K E6全感屏安卓最好的直屏手機

日前iQOO手機官方宣布，新一代電競旗艦iQOO 11S將會在7月4日19:00正式與大家見面。隨著發布時間的日益臨近，官方關于該機的預熱也更加密集，截至目前已
OPPO K11評測：旗艦級IMX890加持 2000元檔最強影像手機

【Techweb評測】中端機型用戶群體巨大，占了中國目前手機市場的大頭，一直以來都是各手機品牌的“必爭之地”，其中OPPO K系列機型一直以來都以高品質、

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

李飛飛實驗室2025 AI報告出爐：中美AI模型差距近乎持平

5月iOS設備好評榜：iPhone 14僅排第43？

印度登月最關鍵一步！月船三號今晚進入環月軌道

三分鐘白話RocketMQ系列—— 如何發送消息

東方甄選單飛：有些鳥注定是關不住的

阿里瓴羊One推出背后，零售企業迎數字化新解

重估百度丨大模型，能撐起百度的“今天”嗎?

自研Exynos回歸！三星Galaxy S24系列將提供Exynos和驍龍雙版本

iQOO 11S屏幕細節公布：首發三星2K E6全感屏安卓最好的直屏手機

OPPO K11評測：旗艦級IMX890加持 2000元檔最強影像手機

最新推薦

猜你喜歡

熱門推薦

相關資訊