AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

蘋果介紹 Ferret-UI 多模態大語言模型:更充分理解手機屏幕內容

來源: 責編: 時間:2024-04-11 17:24:58 182觀看
導讀 4 月 10 日消息,蘋果公司近日發布研究論文,展示了 Ferret-UI AI 系統,可以理解應用程序屏幕上的內容。以 ChatGPT 為代表的 AI 大語言模型(LLMs),其訓練材料通常是文本內容。為了能夠讓 AI 模型能夠理解圖像、視頻

4 月 10 日消息,蘋果公司近日發布研究論文,展示了 Ferret-UI AI 系統,可以理解應用程序屏幕上的內容。vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

以 ChatGPT 為代表的 AI 大語言模型(LLMs),其訓練材料通常是文本內容。為了能夠讓 AI 模型能夠理解圖像、視頻和音頻等非文本內容,多模態大語言模型(MLLMs)因此孕育而生。vv828資訊網——每日最新資訊28at.com

只是現階段 MLLMs 還無法有效理解移動應用程序,這主要有以下幾個原因:vv828資訊網——每日最新資訊28at.com

1. 手機屏幕的寬高比,和大多數訓練圖像使用的屏幕寬高比不同。vv828資訊網——每日最新資訊28at.com

2. MLLMs 需要識別出圖標和按鈕,但它們相對來說都比較小。vv828資訊網——每日最新資訊28at.com

因此蘋果構想了名為 Ferret-UI 的 MLLM 系統解決了這些問題:vv828資訊網——每日最新資訊28at.com

與自然圖像相比,用戶界面屏幕的長寬比通常更長,包含的關注對象(如圖標、文本)也更小,因此我們在 Ferret 的基礎上加入了 "任意分辨率",以放大細節并利用增強的視覺功能。vv828資訊網——每日最新資訊28at.com

我們精心收集了大量初級用戶界面任務的訓練樣本,如圖標識別、查找文本和小部件列表。這些樣本的格式都是按照帶有區域注釋的指令來設計的,以便于精確引用和接地。vv828資訊網——每日最新資訊28at.com

為了增強模型的推理能力,我們進一步編制了高級任務數據集,包括詳細描述、感知 / 交互對話和功能推理。vv828資訊網——每日最新資訊28at.com

蘋果在論文中表示相比較現有的 GPT-4V,以及其它 MLLMs 模型,Ferret-UI AI 模型更為優秀。vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

vv828資訊網——每日最新資訊28at.com

附上參考地址vv828資訊網——每日最新資訊28at.com

Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMsvv828資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3949-0.html蘋果介紹 Ferret-UI 多模態大語言模型:更充分理解手機屏幕內容

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: OpenAI推出視覺增強版GPT-4 Turbo模型,簡化開發流程

下一篇: 融合視覺能力,OpenAI 向開發人員提供 GPT-4 Turbo with Vision

標簽:
  • 熱門焦點
  • 新周期,誰在堅守窄門?

    來源:錦緞今日的投資者恐怕已經忘記了,在OpenAI創造出ChatGPT這一殺器的前夜,生成式AI也曾經是一道窄門,窄到連馬斯克都差點失去了信心。在當時的輿論眼中,AGI的道路不夠性感,不夠
  • 人間誠實周鴻祎:360 All in 大模型的六個解讀

    主筆 / 村口有牛文章架構師 / 毛自聰出品 / 巨頭財經5月至今,人間躁動,各路大模型你方唱罷我登場,VC圈互聯網圈媒體圈已近癲狂。誰也沒想到,今日,360再度刷屏,老牌互聯網巨頭展現
  • B端難做:留給魔琺科技的時間不多了

    來源:零態LT元宇宙泡沫正在碎裂,進入2023年后這一賽道熱度一直在遞減。今年2月,微軟解散了成立僅四個月的工業元宇宙部門;今年3月,該公司2017年收購的虛擬現實社交平臺AltspaceVR
  • 城市數字孿生標準化白皮書(2022版)

    當前,城市數字孿生已經發展成為支撐智慧城市的重要技術手段。城市數字孿生通過在數字空間對城市物理空間和社會空間進行全要素表達、全過程呈現、全周期可溯,實
  • AI特效、虛擬人、數字盲盒,來看看元宇宙如何融合冬奧會!

    今天是冬奧會比賽的第12天,截至目前所累計的成績,中國代表團已經取得了冬奧歷史最佳戰績。全世界的人都在關注著這場盛事,為奧運健兒吶喊助威。谷愛凌、徐夢桃、
  • NFT自動售貨機來啦!

    “紐約市有一臺售賣 Solana NFT 的自動售貨機,用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT,無需使用加密貨幣。由于基于 Solana 鏈的 N
  • MR——元宇宙平臺的下一代入口

    作為“元宇宙”的領頭羊,Meta的一舉一動都受到業內的高度關注。華爾街見聞提及,2月17日周四,Facebook母公司Meta在透露,其混合現實技術(MR)將在幾年后實現,讓人們對元
  • 從NFT數字收藏,洞察數字音樂版權市場發展趨勢

    去年8月9日,騰訊音樂布局NFT數字收藏,在騰訊應用寶發布幻核app,騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
  • PayPal CEO 的加密語錄:加密貨幣將重新定義金融世界

    PayPal 近年來一直是加密行業的倡導者。這個本身擁有超過 3.5 億名活躍用戶的支付巨頭,已經允許美國和英國的用戶交易或持有比特幣(BTC)、以太坊(ETH)、比特現金(BCH
Top