當前位置：首頁 > 元宇宙 > AI

微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

來源：責編：時間：2025-05-03 07:28:48 61觀看

導讀 5 月 1 日消息，微軟昨日（4 月 30 日）發布 Phi-4-reasoning 系列推理模型，通過監督微調 Phi-4，并利用 o3-mini 生成的高質量“可教導”提示數據集訓練，專為復雜推理任務設計。援引博文介紹，微軟本次共推出 Phi-4-reas

5 月 1 日消息，微軟昨日（4 月 30 日）發布 Phi-4-reasoning 系列推理模型，通過監督微調 Phi-4，并利用 o3-mini 生成的高質量“可教導”提示數據集訓練，專為復雜推理任務設計。

援引博文介紹，微軟本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型，官方稱該系列模型不僅延續了小型模型的高效特性，還在推理能力上實現重大突破。

該系列模型通過推理時間擴展（inference-time scaling）技術，擅長處理需要多步驟分解和內部反思的復雜任務，尤其在數學推理和代理型應用中表現突出，具備媲美大型前沿模型的潛力。

Phi-4-reasoning 是一款擁有 140 億參數的開源推理模型，通過監督微調（Supervised Fine-Tuning，SFT）Phi-4，結合 OpenAI o3-mini 的高質量推理演示數據，并充分利用額外計算資源，生成詳細的推理鏈條。

Phi-4-reasoning-plus 增強版通過強化學習（Reinforcement Learning，RL）進一步提升性能，tokens 用量比標準版多 1.5 倍，支持更高精度。

兩款模型在數學推理和博士級科學問題測試中，均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B，甚至在 AIME 2025（美國數學奧林匹克資格賽）中擊敗 6710 億參數的 DeepSeek-R1滿血模型。

Phi-4-mini-reasoning 專為計算資源有限的環境設計，是一款基于 Transformer 的緊湊型語言模型，優化用于數學推理。

該模型通過 DeepSeek-R1 生成的合成數據微調，能在低延遲場景下提供高質量的逐步問題解決方案。這款模型覆蓋從中學到博士級的百萬級多樣化數學問題，非常適合教育應用、嵌入式輔導和邊緣設備部署。

在多項數學基準測試中，其 3.8 億參數的表現超越 OpenThinker-7B 和 Llama-3.2-3B-instruct 等更大模型，甚至在部分測試中接近 OpenAI o1-mini 的水平。

本文鏈接：http://www.tebozhan.com/showinfo-45-12692-0.html微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 2600 tokens s：Meta 發布 Llama API，攜手 Cerebras 打造最快 AI 推理解決方案

下一篇：網頁版 Claude AI 醞釀升級：將支持 MCP 定制鏈接，擴展第三方服務集成

標簽：

熱門焦點

VR/AR迷失元宇宙“硝煙”

不溫不火的VR/AR可穿戴設備因元宇宙崛起火了一陣，又隨著元宇宙回歸平靜。1月份，微軟在 Surface 設備、HoloLens 混合現實硬件和 Xbox 等部門裁員，其中負責混合現實硬件（MR）的Holo
元宇宙帶來沉浸式智能登錄？你學會了嗎？

備受資本市場寵愛的元宇宙概念，正掀起一番番波瀾。元宇宙作為虛實相融的互聯網應用和社會形態，與沉浸式體驗緊密相關。多重路徑，打造無感知沉浸式智能登錄《設計
百度元宇宙希壤是什么？（附下載）

百度元宇宙希壤是什么，最近很多人關注。還有很多人問希壤怎么下載、百度希壤怎么進入？今天小編帶你來全面了解一下。“希壤”是百度于2021年12月27日于百度AI開
多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

2月21日，2022中國·金魚嘴元宇宙生態賦能大會在南京建鄴區金魚嘴基金街區舉辦，南京建鄴區金魚嘴基金街區宣布計劃出資1億元，支持元宇宙行業發展。同時，會上發布了
索尼公布PSVR 2頭顯渲染圖；社區開發者發布Quest版《我的世界》

近日熱點：索尼正式公布PSVR 2頭顯及控制器官方渲染圖；入局元宇宙，鴻海科技與XRSPACE簽訂合作備忘錄；研究人員表示面部追蹤可增強VR操控體驗；社區開發者QuestCraft發
以太坊面臨來自Fantom的巨大挑戰

眾所周知，區塊鏈和加密貨幣項目經常因其對環境的影響而受到批評。但是有一個非營利性的加密貨幣和區塊鏈項目說它比其他的更環保。今天老雅痞就給大家聊一聊加
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
多位全國政協委員提交元宇宙提案，國金證券稱元宇宙仍處初期投資階段

財聯社|區塊鏈日報2日訊今日《元宇宙新鮮事》有：全國政協委員劉偉建議出臺“元宇宙中國”的頂層設計方案；國金證券稱元宇宙仍處初期投資龐大獲利不易階段；阿聯酋
虛擬人的3大紀律和6種品牌孵化模式

作者：陳格雷（老小格）及團隊虛擬人很熱，我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點，整理出6種最主要的品牌虛擬人模式，后面一一介紹。

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

微軟發布 Phi-4 系列小語言 AI 推理模型，AIME 2025 跑分超滿血版 Deepseek R1

VR/AR迷失元宇宙“硝煙”

元宇宙帶來沉浸式智能登錄？你學會了嗎？

百度元宇宙希壤是什么？（附下載）

多地釋放積極信號，元宇宙正成為地方爭先競逐的主戰場？

索尼公布PSVR 2頭顯渲染圖；社區開發者發布Quest版《我的世界》

以太坊面臨來自Fantom的巨大挑戰

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

多位全國政協委員提交元宇宙提案，國金證券稱元宇宙仍處初期投資階段

虛擬人的3大紀律和6種品牌孵化模式

最新推薦

AI網紅能年賺百萬，普通人的新機會來了？

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

一個視頻漲粉百萬，柳夜熙們能成為元宇宙的“船票”嗎？

Meta公布AI概念“Builder Bot”；銀保監發布元宇宙相關風險提示

從4個方面解析2022年加密行業趨勢

76億美金估值、2022年最具創新力公司，Dapper Labs如何做到？

猜你喜歡

熱門推薦

相關資訊