<dl id="uosgg"><tr id="uosgg"></tr></dl><li id="uosgg"></li>

當前位置：首頁 > 科技 > 軟件

參數量 42 億，微軟公布 SLM 小語言 AI 模型最新成員 Phi-3-vision

來源：責編：時間：2024-05-27 08:52:24 155觀看

導讀 5 月 26 日消息，微軟近日公布了旗下小語言 AI 模型家族（SLM）最新成員“Phi-3-vision”，這款模型主打“視覺能力”，能夠理解圖文內容，同時據稱可以在移動平臺上流暢高效運行。據介紹，Phi-3-vision 是微軟 Phi-3 家族

5 月 26 日消息，微軟近日公布了旗下小語言 AI 模型家族（SLM）最新成員“Phi-3-vision”，這款模型主打“視覺能力”，能夠理解圖文內容，同時據稱可以在移動平臺上流暢高效運行。

據介紹，Phi-3-vision 是微軟 Phi-3 家族首款多模態模型，該模型的文字理解能力基于 Phi-3-mini，同時也具備 Phi-3-mini 的輕量特點，能夠在移動平臺 / 嵌入終端中運行；該模型參數量為 42 億，大于 Phi-3-mini（3.8B），但小于 Phi-3-small（7B），上下文長度為 128k token，訓練期間為 2024 年 2 月至 4 月。

IT酷哥注意到，Phi-3-vision 模型的最大特色正如其名，主要支持“圖文識別能力”，號稱能夠理解現實世界的圖片含義，還能快速識別提取圖片中的文字。

微軟表示，Phi-3-vision 特別適合辦公場合，開發人員特別優化了該模型在識別圖表和方塊圖 (Block diagram) 方面的理解能力，據稱可以利用用戶輸入的信息進行推論，同時還能做出一系列結論，為企業提供戰略建議，號稱“效果比肩大模型”。

在模型訓練方面，微軟聲稱 Phi-3-vision 是由“多種類型圖片及文字數據訓練而成”，包括一系列“經過嚴選的公開內容”，例如“教科書等級”教育材料、代碼、圖文標注數據、現實世界知識、圖表圖片、聊天格式等內容，從而確保模型輸入內容的多樣性。為了確保隱私，微軟聲稱他們所使用的訓練數據“可追溯”不包含任何個人信息。

性能方面，微軟提供了 Phi-3-vision 相較于字節跳動 Llama3-Llava-Next（8B）、微軟研究院和威斯康星大學、哥倫比亞大學合作的 LlaVA-1.6（7B）、阿里巴巴通義千問 QWEN-VL-Chat 模型等競品模型的比較圖表，其中顯示 Phi-3-vision 模型在多個項目上表現優異。

目前微軟已經將該模型上傳至 Hugging Face，感興趣的小伙伴們可以訪問項目地址：點此進入

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

參數量 42 億，微軟公布 SLM 小語言 AI 模型最新成員 Phi-3-vision

三言兩語說透柯里化和反柯里化

重估百度丨“晚熟”的百度云，能等到春天嗎？

品牌洞察丨服務本地，美團直播成效幾何？

攜眾多高端產品亮相ChinaJoy，小米帶來一場科技與人文的視聽盛宴

OPPO、vivo、小米等國內廠商Q2在印度智能手機市場份額依舊高達55%

iQOO 11S屏幕細節公布：首發三星2K E6全感屏安卓最好的直屏手機

iQOO Neo8 Pro即將開售：到手價3099元起安卓性能最強旗艦

引領旗艦級影像能力向中端機普及 OPPO K11 系列發布 1799 元起

Windows 11發布，微軟一改往常對老機型開放的態度

最新推薦

猜你喜歡

熱門推薦

相關資訊