當前位置：首頁 > 元宇宙 > AI

蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

來源：責編：時間：2025-05-15 09:50:57 64觀看

導讀 5 月 13 日消息，蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM，提供 0.5B、1.5B、7B 三個版本。據介紹，該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練，專為 Apple Sili

5 月 13 日消息，蘋果機器學習團隊上周在 GitHub 發布并開源了一款視覺語言模型 ——FastVLM，提供 0.5B、1.5B、7B 三個版本。

據介紹，該模型基于蘋果自研 MLX 框架開發并借助LLaVA 代碼庫進行訓練，專為 Apple Silicon 設備的端側 AI 運算進行優化。

技術文檔顯示，FastVLM 在保持精度的前提下，實現了高分辨率圖像處理的近實時響應，同時所需的計算量比同類模型要少得多。

其核心是一個名為 FastViTHD 的混合視覺編碼器。蘋果團隊表示，該編碼器“專為在高分辨率圖像上實現高效的 VLM 性能而設計”，其處理速度較同類模型提升 3.2 倍，體積卻僅有 3.6 分之一。

亮點

FastViTHD 新型混合視覺編碼器：專為高分辨率圖像優化設計，可減少令牌輸出量并顯著縮短編碼時間

最小模型版本性能對比：較 LLaVA-OneVision-0.5B 模型實現首詞元（Token）響應速度提升 85 倍，視覺編碼器體積縮小 3.4 倍

搭配 Qwen2-7B 大語言模型版本：使用單一圖像編碼器即超越 Cambrian-1-8B 等近期研究成果，首詞元響應速度提升 7.9 倍

配套 iOS 演示應用：實機展示移動端模型性能表現

蘋果技術團隊指出：“基于對圖像分辨率、視覺延遲、詞元數量與LLM 大小的綜合效率分析，我們開發出 FastVLM—— 該模型在延遲、模型大小和準確性之間實現了最優權衡。”

該技術的應用場景指向蘋果正在研發的智能眼鏡類穿戴設備。多方信息顯示，蘋果計劃于 2027 年推出對標 Meta Ray-Bans 的 AI 眼鏡，同期或將發布搭載攝像頭的 AirPods 設備。

FastVLM 的本地化處理能力可有效支持此類設備脫離云端實現實時視覺交互。查詢獲悉，MLX 框架允許開發者在 Apple 設備本地訓練和運行模型，同時兼容主流 AI 開發語言。FastVLM 的推出證實蘋果正構建完整的端側 AI 技術生態。

參考資料：

https://github.com/apple/ml-fastvlm?tab=readme-ov-file

[2412.13303] FastVLM: Efficient Vision Encoding for Vision Language Models

本文鏈接：http://www.tebozhan.com/showinfo-45-12845-0.html蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： SDS 技術首次用于音頻：英偉達攜手 MIT 推 Audio-SDS，參數化控制 AI 音效生成

下一篇： OpenAI 高管：AI 未來可自主生成知識，商業與科研迎來革命

標簽：

熱門焦點

AI網紅能年賺百萬，普通人的新機會來了？

來源｜運營研究社作者 | 張知白編輯 | 楊佩汶設計 | 晏談夢潔2023 年，數字人成為了當紅的“流量話題”和“商業機會"。不管是 AI 孫燕姿走紅網絡，還是 AI 數字
“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現嗎？

作者| 赤木瓶子如何終結“曇花一現”的命運，是潮流社交產品的長期命題，如今，在元宇宙浪潮的洗禮下，這一命題正在迎來新的可能性。近段時間，一款名為“啫喱”的社交A
音樂NFT平臺里的下一匹黑馬是誰？

NFT 銷售額在 2021 年開始暴漲，從 2018 年的僅 4069 萬美元的交易量，到 2021 年，NFT 交易量飆升至 442 億美元以上，并不斷刷新記錄并達到新的高度。預測到2025 年N
元宇宙畫廊體驗報告：有點頭疼。

2 月 10 日，Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強現實藝術品。“我們現在在虛擬世界中嗎？時間好像變長了” 我問身后排隊的人。我
韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

韓國流行音樂巨頭 SM Entertainment 與加密貨幣交易所 Binance（幣安）達成“Play2Create”NFT 合作伙伴關系。SM 娛樂一直在投資打造元宇宙該公司于 2020 年 10
FTX 加密貨幣交易所開始向游戲公司提供加密服務

據媒體報道，業內領先的加密貨幣交易所FTX宣布將涉足游戲領域。該公司表示，計劃推出自己的游戲部門作為中介，專注于為傳統游戲公司提供加密相關服務。此舉將有助于
MR——元宇宙平臺的下一代入口

作為“元宇宙”的領頭羊，Meta的一舉一動都受到業內的高度關注。華爾街見聞提及，2月17日周四，Facebook母公司Meta在透露，其混合現實技術（MR）將在幾年后實現，讓人們對元
從概念到落地 Web3.0初具雛形

加密資產熱潮催生出的鏈上應用中，除了DeFi、NFT、鏈游GameFi等場景外，還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年，由以太坊聯合創始人及波卡創建者
你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

前有騰訊、阿里申請商標注冊，后有Facebook宣布改名，若論當前互聯網最火最熱的概念，當屬“元宇宙”。“阿里元宇宙”“淘寶元宇宙”“釘釘元宇宙”“QQ元宇宙”“

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

蘋果發布 FastVLM 視覺語言模型，為新型智能眼鏡等穿戴設備鋪路

AI網紅能年賺百萬，普通人的新機會來了？

“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現嗎？

音樂NFT平臺里的下一匹黑馬是誰？

元宇宙畫廊體驗報告：有點頭疼。

韓國流行音樂巨頭SM與Binance達成NFT合作伙伴關系

FTX 加密貨幣交易所開始向游戲公司提供加密服務

MR——元宇宙平臺的下一代入口

從概念到落地 Web3.0初具雛形

你連元宇宙都不知道嗎？快來看看這四本元宇宙書籍吧

最新推薦

新周期，誰在堅守窄門？

“元宇宙”里過大年，《迷你世界》在做一場怎樣的實驗？

Layer1的新以太坊，更好的以太坊？

吸金31億美元，誰在催火2021年的鏈游？

NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

以太坊倫敦升級后，隨之生效的以太坊EIP-1559是什么？

猜你喜歡

熱門推薦

相關資訊