當前位置：首頁 > 元宇宙 > AI

微軟 Phi-4 多模態及迷你模型上線，語音視覺文本全能

來源：責編：時間：2025-03-01 07:56:50 46觀看

導讀 2 月 27 日消息，微軟于 2024 年 12 月發布了 Phi-4，這是一款在同類產品中表現卓越的小型語言模型（SLM）。今日，微軟進一步擴展 Phi-4 家族，推出了兩款全新模型：Phi-4 多模態（Phi-4-multimodal）和 Phi-4 迷你（Phi-4-mini）

2 月 27 日消息，微軟于 2024 年 12 月發布了 Phi-4，這是一款在同類產品中表現卓越的小型語言模型（SLM）。今日，微軟進一步擴展 Phi-4 家族，推出了兩款全新模型：Phi-4 多模態（Phi-4-multimodal）和 Phi-4 迷你（Phi-4-mini）。

Phi-4 多模態模型是微軟首款集成語音、視覺和文本處理的統一架構多模態語言模型，參數量達 56 億。在多項基準測試中，Phi-4 多模態的表現優于其他現有的先進全模態模型，例如谷歌的 Gemini 2.0 Flash 和 Gemini 2.0 Flash Lite。

在語音相關任務中，Phi-4 多模態在自動語音識別（ASR）和語音翻譯（ST）方面超越了 WhisperV3 和 SeamlessM4T-v2-Large 等專業語音模型。微軟表示，該模型在 Hugging Face OpenASR 排行榜上以 6.14% 的詞錯誤率位居榜首。

在視覺相關任務中，Phi-4 多模態在數學和科學推理方面表現出色。在文檔理解、圖表理解、光學字符識別（OCR）和視覺科學推理等常見多模態能力方面，該模型與 Gemini-2-Flash-lite-preview 和 Claude-3.5-Sonnet 等流行模型相媲美甚至超越。

注意到，Phi-4 迷你模型則專注于文本任務，參數量為 38 億。其在文本推理、數學計算、編程、指令遵循和函數調用等任務中表現優異，超越了多款流行的大型語言模型。

為確保新模型的安全性和可靠性，微軟邀請了內部和外部安全專家進行測試，并采用了微軟人工智能紅隊（AIRT）制定的策略。經過進一步優化后，Phi-4 迷你和 Phi-4 多模態模型均可通過 ONNX Runtime 部署到設備端，實現跨平臺使用，適用于低成本和低延遲場景。

目前，Phi-4 多模態和 Phi-4 迷你模型已在 Azure AI Foundry、Hugging Face 和 NVIDIA API 目錄中上線，供開發者使用。

Phi-4 系列新模型的推出，標志著高效 AI 技術的重大進步，為各類人工智能應用帶來了強大的多模態和文本處理能力。

本文鏈接：http://www.tebozhan.com/showinfo-45-11226-0.html微軟 Phi-4 多模態及迷你模型上線，語音視覺文本全能

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：谷歌重組人力與云部門，裁員進行時，成本削減成重點

下一篇：職業棋手比賽私藏手機用 AI 作弊被抓現行，被中國圍棋協會撤銷段位、禁賽 8 年

標簽：

熱門焦點

《從營銷AIGC化到AIGC營銷化》報告發布

來源：清元宇宙7月2日上午，清華大學元宇宙文化實驗室舉辦元宇宙在線沙龍“AIGC熱潮與應用”。會議中，清華大學新聞與傳播學院教授、元宇宙文化實驗室主任、新媒體研究
虛擬人再升級，企業可以解放雙手了？

來源：伯虎財經今天想跟大家來嘮嘮AI，其實聊到這個話題很多人都不陌生了。在ChatGPT和AIGC大熱背后，還有一位低調的“大佬”——虛擬人。比如咱們熟知的虛
元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

來源：首席品牌官從被稱為“元宇宙元年”的2021年開始，幾乎所有品牌都在迫不及待地“入駐”元宇宙。而一提及品牌們的元宇宙玩法，相信多數人腦海里首先浮現
冰墩墩還能火多久？

作者：田巧云題圖源自北京2022年冬奧會官方微博如果要問2022年的開年明星是誰，冰墩墩當仁不讓。幾乎所有人都被那個抖雪的動作實力圈粉。在社交媒體的助推，以及日
2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

傳感器是由敏感元件和轉換元件構成，能夠感受規定的檢測量(物理量、化學量、生物量等)，并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置，進而滿足信息的
虛擬數字人：元宇宙的主角破圈而來

虛擬數字人市場逐步進入成熟期，商業化進程加速。1982年世界第一位虛擬歌姬林明美誕生，虛擬數字人行業經歷了萌芽、探索、初級和成長四個階段。隨技術逐年突破，制
NFT世界的藝術家名單

我們匯編了以下藝術家的名單，它包括每個藝術家的簡短概述。當然，這份名單肯定不全面，還有很多很多藝術家、哲學家和商業領袖為世界貢獻了不可估量的價值。而他們
GameFi 深度解析，元宇宙內容雛形顯現

GameFi=Game（游戲）+Defi（去中心化金融），核心特點為“Play to Earn”。通過技術與去中心化價值觀賦能，GameFi 游戲資產化身為NFT 和代幣上鏈，具備了可驗證性和流通性；開
虛擬人的3大紀律和6種品牌孵化模式

作者：陳格雷（老小格）及團隊虛擬人很熱，我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點，整理出6種最主要的品牌虛擬人模式，后面一一介紹。

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

微軟 Phi-4 多模態及迷你模型上線，語音視覺文本全能

《從營銷AIGC化到AIGC營銷化》報告發布

虛擬人再升級，企業可以解放雙手了？

元宇宙里掀起回憶殺？這波虛擬懷舊營銷主打一個極限反差

冰墩墩還能火多久？

2022年中國元宇宙產業系列研究報告-基礎設施篇（5）

虛擬數字人：元宇宙的主角破圈而來

NFT世界的藝術家名單

GameFi 深度解析，元宇宙內容雛形顯現

虛擬人的3大紀律和6種品牌孵化模式

最新推薦

《蜘蛛俠》火了，超級英雄就該這么演

2022年元宇宙系列報告：UGC當道，XR帶來新交互體驗

本周NFT領域重要資訊回顧

元宇宙畫廊體驗報告：有點頭疼。

元宇宙需要的5個重要安全功能

我們離元宇宙的實現只差一副眼鏡？

猜你喜歡

熱門推薦

相關資訊