AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

OpenAI 直播狙擊谷歌:奧爾特曼 AGI 梗圖現(xiàn)場直出,GPT-4o 超強原生生圖來襲

來源: 責編: 時間:2025-03-31 11:07:20 65觀看
導讀 剛剛,OpenAI 深夜直播,GPT-4o 的原生圖像生成大升級!奧爾特曼親自上陣組隊,演示了自拍變梗圖、相對論漫畫等功能,不過相對隔壁谷歌發(fā)布的新模型,OpenAI 的這波動作著實有點不夠看。就在谷歌剛剛?cè)映龅乇碜顝娔P?Ge

剛剛,OpenAI 深夜直播,GPT-4o 的原生圖像生成大升級!奧爾特曼親自上陣組隊,演示了自拍變梗圖、相對論漫畫等功能,不過相對隔壁谷歌發(fā)布的新模型,OpenAI 的這波動作著實有點不夠看。q6428資訊網(wǎng)——每日最新資訊28at.com

就在谷歌剛剛?cè)映龅乇碜顝娔P?Gemini 2.5 Pro 不久,OpenAI 也有動作了。q6428資訊網(wǎng)——每日最新資訊28at.com

奧爾特曼親自帶隊,展示了 GPT-4o 圖像生成技術(shù)的各種大升級,比如制作梗圖、文本渲染、多輪交互生成和指令遵循等。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

整個直播中最亮的演示,莫過于這張官方玩梗的表情包了。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

目前,這項功能已經(jīng)在 ChatGPT 和 Sora 中,向所有 Plus、Pro、Team 和免費用戶推出。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

當然,新版 Sora 生圖的時間,也比以往更長了。但 OpenAI 看來,生圖的質(zhì)量和其具備的世界知識,讓用戶值得等待那多出的幾秒。q6428資訊網(wǎng)——每日最新資訊28at.com

GPT-4o 原生圖像生成來了!

在直播中,奧爾特曼介紹道,從今天起,ChatGPT 中的原生圖像生成功能正式推出!q6428資訊網(wǎng)——每日最新資訊28at.com

GPT-4o 的全模態(tài)能力,從此也融合進了 Sora 中。q6428資訊網(wǎng)——每日最新資訊28at.com

OpenAI 多模態(tài)研究的負責人 Gabe 介紹說,兩年前剛開始這個項目時,他對于 GPT-4 這個強大的模型會怎樣原生支持圖像模型非常好奇。q6428資訊網(wǎng)——每日最新資訊28at.com

一年后,當模型完成訓練時,他看到了令人興奮的跡象。從 GPT-2 以來,他已經(jīng)很久沒有這種感覺 —— 這是一個瘋狂時刻。q6428資訊網(wǎng)——每日最新資訊28at.com

給出以下 prompt,GPT-4o 就生成了符合要求的圖像,完全還原了要求。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

接下來,三個人用手機來了張自拍,GPT-4o 立刻把三人自拍轉(zhuǎn)換成了動漫風格的版本。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

甚至他們開始官方玩梗,讓模型添加一段「Feel The AGI」在圖片上,一張表情包就此誕生。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

這個過程,就體現(xiàn)了 4o 作為全能模型的強大能力。q6428資訊網(wǎng)——每日最新資訊28at.com

因為它不僅僅是一個語言模型,還包括圖像、音頻,所有輸入和輸出的模態(tài)。它可以理解、生成這些模態(tài),并且無縫地在它們之間工作。q6428資訊網(wǎng)——每日最新資訊28at.com

用 OpenAI 的話說,「我們終于邁向了這種真正集成的多模態(tài)模型」。q6428資訊網(wǎng)——每日最新資訊28at.com

接下來,他們讓模型畫出一幅描述相對論的漫畫,要求通俗易懂,還要加入一些幽默元素。q6428資訊網(wǎng)——每日最新資訊28at.com

這個提示詞非常模糊,因此看看模型會生成什么樣的圖,就格外令人期待了。果然,生成效果令人驚喜。q6428資訊網(wǎng)——每日最新資訊28at.com

注意,這個過程中,模型很可能利用了自己的世界知識,對提示詞進行了擴展。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

然后,他們給了模型一張卡片,希望生成同樣風格的圖像,但要求主角不再是卡片中的巨貓國王,而是某位研究者的狗狗。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

另外,卡片上還需要出現(xiàn)一些細節(jié),比如模型的名字和年份,以及狗狗的體重和身高。q6428資訊網(wǎng)——每日最新資訊28at.com

可以看到,生成圖像在文本渲染方面非常驚艷,所有數(shù)據(jù)都準確無誤。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

最后一個演示,是基于此前幾人生成的內(nèi)容,制作一個紀念幣。q6428資訊網(wǎng)——每日最新資訊28at.com

而且,還要求圖使用了一個特殊的十六進制代碼,且加上生成圖像的文本和日期。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

可以看到,生成結(jié)果非常驚艷!此前曾出現(xiàn)的藝術(shù)熊、收音機、愛因斯坦漫畫、研究者的狗狗以及模型名稱和日期,全部都出現(xiàn)在了紀念幣上。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

模型之所以精準完成這樣復雜的要求,是因為它是用非自回歸的方式訓練的,因此它能夠理解上下文中的文本和多張圖片,以非常和諧的方式在紀念幣上呈現(xiàn)出來。q6428資訊網(wǎng)——每日最新資訊28at.com

和 GPT-4o 聊天,定制各種圖像

總之,現(xiàn)在使用這個功能,我們可以創(chuàng)建各種圖像,或?qū)⑵滢D(zhuǎn)換為各種風格。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

從此,用 GPT-4o 創(chuàng)建和定制圖像,就像聊天一樣簡單。q6428資訊網(wǎng)——每日最新資訊28at.com

只需描述所需,就能得到想要的任何細節(jié),比如縱橫比、使用十六進制代碼的精確顏色或透明背景。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

我們可以讓它設計一個信息圖,解釋牛頓的棱鏡寬高比,背景為深藍色。q6428資訊網(wǎng)——每日最新資訊28at.com

一張畫質(zhì)高級的教學級圖片,立馬生成。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

這個圖像生成功能的特點就是,能遵循非常復雜的提示,極其注重細節(jié)。q6428資訊網(wǎng)——每日最新資訊28at.com

15 個非常細化的要求,它都在一張圖里完美實現(xiàn)了。q6428資訊網(wǎng)——每日最新資訊28at.com

要知道,大多數(shù)生圖模型被要求渲染多個項目時,往往就會混淆顏色和形狀,但新模型卻能正確綁定 15 到 20 個對象的屬性,還能成功理解各自的復雜需求。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

在你和它的聊天上下文中,GPT-4o 就能為你構(gòu)建圖像和文本,還能確保一致性。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

主打一個實用

從最早的洞穴壁畫到現(xiàn)代信息圖表,人類一直使用視覺圖像來交流、說服和分析。q6428資訊網(wǎng)——每日最新資訊28at.com

如今的生成式 AI 模型可以創(chuàng)造出超現(xiàn)實的場景,但在處理人們用于分享和創(chuàng)建信息的實用圖像方面仍然存在困難。q6428資訊網(wǎng)——每日最新資訊28at.com

GPT?4o 的圖像生成功能擅長準確渲染文本,精確遵循提示詞,并利用 GPT-4o 固有的知識庫和聊天上下文 —— 包括轉(zhuǎn)換上傳的圖像或?qū)⑵溆米饕曈X靈感。q6428資訊網(wǎng)——每日最新資訊28at.com

這些能力讓用戶可以更加容易地創(chuàng)建想象中的畫面,幫助通過視覺更有效地溝通,并將圖像生成發(fā)展成為一種具有精確性和強大功能的實用工具。q6428資訊網(wǎng)——每日最新資訊28at.com

畢竟,只有當圖像配上指代共享語言和經(jīng)驗的符號時,才能傳達精確的含義。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

能力大幅增強

通過線上圖像和文本的聯(lián)合分布訓練,模型不僅能學會圖像如何與語言相關(guān)聯(lián),還能知道它們之間的相互關(guān)系。q6428資訊網(wǎng)——每日最新資訊28at.com

結(jié)合積極的后訓練優(yōu)化,最終的模型展現(xiàn)出驚人的視覺表現(xiàn)力,能夠生成實用、一致且具有上下文感知能力的圖像。q6428資訊網(wǎng)——每日最新資訊28at.com

文本渲染

一張圖片勝過千言萬語,但有時在正確的位置添加幾個詞能夠大大提升圖像的含義。q6428資訊網(wǎng)——每日最新資訊28at.com

GPT-4o 將精確的符號與圖像融合的能力使圖像生成成為視覺交流的有力工具。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

多輪交互生成

由于圖像生成現(xiàn)在是 GPT?4o 的原生功能,用戶可以通過自然對話來完善圖像。q6428資訊網(wǎng)——每日最新資訊28at.com

GPT?4o 能夠基于聊天上下文中的圖像和文本進行構(gòu)建,確保始終保持一致性。q6428資訊網(wǎng)——每日最新資訊28at.com

比如,一個正在設計中的游戲角色,它的外觀就能在多次迭代和調(diào)整中保持連貫一致。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

指令遵循

GPT?4o 的圖像生成功能不僅可以遵循詳細的提示詞,而且還十分注重細節(jié)。q6428資訊網(wǎng)——每日最新資訊28at.com

相比起其他只能處理 5-8 個物體的模型,GPT?4o 可以輕松搞定多達 10-20 個不同的物體。q6428資訊網(wǎng)——每日最新資訊28at.com

并且,物體與其特征和關(guān)系的更緊密綁定使得控制更加精準。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

上下文內(nèi)學習

GPT?4o 能夠分析并學習用戶上傳的圖像,將圖像細節(jié)無縫整合到上下文中,用于輔助圖像生成。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

世界知識

內(nèi)置的圖像生成功能使 GPT?4o 能夠連接文本和圖像之間的知識,使模型表現(xiàn)得更智能、更高效。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

真實照片風格

通過對反映多種多樣圖像風格的圖像進行訓練,模型能夠以令人信服的方式創(chuàng)建或轉(zhuǎn)換圖像。q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

q6428資訊網(wǎng)——每日最新資訊28at.com

參考資料:q6428資訊網(wǎng)——每日最新資訊28at.com

https://openai.com/index/introducing-4o-image-generation/q6428資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-11767-0.htmlOpenAI 直播狙擊谷歌:奧爾特曼 AGI 梗圖現(xiàn)場直出,GPT-4o 超強原生生圖來襲

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 谷歌最強模型 Gemini 2.5 Pro 發(fā)布即屠榜,創(chuàng)下史上最大分數(shù)飛躍紀錄

下一篇: DeepSeek 官方詳解 V3 模型小版本升級:各項能力全面進階

標簽:
  • 熱門焦點
  • 錯過了BRC20還有eths,eth銘文協(xié)議

    來源:三頭鳥NFT大家好,我是鳥哥,了解鳥哥的人都知道鳥哥擅擼空投,說實話擼毛雖然回報大但周期還是有點長的,所以除了擼毛我們自己也在研究早期項目,打新,比如BRC20協(xié)議ordi當時就有
  • 在元宇宙賣酸奶,這波聯(lián)動燃爆了!

    來源:品牌頭版 或許,每個人心中都住著一個小饞孩。可能是童年時百吃不厭,覺得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;還有可能,是某種不知為什么,就是很愛吃的
  • 25萬虛擬er在“元宇宙”追星

    “默嘰默嘰,我是默默醬,我是在真元宇宙也有頭有臉的人。”12月11日晚20:00,虛擬偶像@默默醬的首場個人元宇宙演唱會《以夢為馬,抵達繁星》在大有空間APP
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯(lián)網(wǎng)巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產(chǎn)業(yè)規(guī)劃,大有在2022年
  • 企業(yè)熱、用戶冷,元宇宙第一站將是“營銷場”?

    如果說2021年底什么最火熱,那元宇宙當之無愧。“萬物皆可元宇宙”似乎成為新的流行語,在廣告中也常常聽到“社交元宇宙”“購物元宇宙”等等。就在近日,有消息傳
  • 虛擬數(shù)字人:元宇宙的主角破圈而來

    虛擬數(shù)字人市場逐步進入成熟期,商業(yè)化進程加速。1982年世界第一位虛擬歌姬林明美誕生,虛擬數(shù)字人行業(yè)經(jīng)歷了萌芽、探索、初級和成長四個階段。隨技術(shù)逐年突破,制
  • Terra鏈上TVL躍升至第二

    據(jù)DefiLlama數(shù)據(jù)顯示,當前,Terra鏈上應用鎖倉的加密資產(chǎn)價值(TVL)為172.1億美元,在公鏈板塊中已躍升至第二,超越了幣安智能鏈TVL的118億美元,TVL排名居首的仍為以太
  • NFT世界的藝術(shù)家名單

    我們匯編了以下藝術(shù)家的名單,它包括每個藝術(shù)家的簡短概述。當然,這份名單肯定不全面,還有很多很多藝術(shù)家、哲學家和商業(yè)領(lǐng)袖為世界貢獻了不可估量的價值。而他們
  • Snoop Dogg 計劃推出致力于數(shù)字媒體NFT的專業(yè)公司

    雅痞哥不知道這人是誰還上新聞,問了助理,解釋,相當于美版劉歡的地位吧。Snoop Dogg 在 NFT 領(lǐng)域已經(jīng)有一段時間了,尤其是在最近有消息稱人們在元宇宙中購買房地產(chǎn)
Top