4 月 10 日消息,OpenAI 宣布,具有視覺能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 現(xiàn)已通過 OpenAI API 向開發(fā)人員普遍提供。
據(jù)了解,該模型延續(xù)了 GPT-4 Turbo 系列 128,000 個(gè) token 的窗口大小以及截止至 2023 年 12 月的知識(shí)庫,最大的革新之處在于其新增的視覺理解能力。在過去,開發(fā)者需要調(diào)用不同的模型來處理文本和圖像信息,而 GPT-4 Turbo with Vision 則將兩者合二為一,極大簡化了開發(fā)流程,并帶來了廣泛的應(yīng)用前景。
OpenAI 也分享了一些開發(fā)者正在使用該模型的有趣案例。例如,AI 軟件工程助手 Devin 利用 GPT-4 Turbo with Vision 輔助編程;健康健身應(yīng)用程序 Healthify 使用該模型掃描用戶飲食照片,通過圖像識(shí)別提供營養(yǎng)分析;創(chuàng)意平臺(tái) Make Real 則利用該模型將用戶的草圖轉(zhuǎn)化為可運(yùn)行的網(wǎng)站。
目前,GPT-4 Turbo with Vision 尚未應(yīng)用于 ChatGPT 或開放給大眾使用,不過 OpenAI 暗示該功能即將登陸 ChatGPT。
本文鏈接:http://www.tebozhan.com/showinfo-45-3950-0.html融合視覺能力,OpenAI 向開發(fā)人員提供 GPT-4 Turbo with Vision
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com