5 月 14 日消息,人工智能聊天機(jī)器人領(lǐng)域烽煙再起,谷歌和 OpenAI 之間激烈的競(jìng)爭(zhēng)態(tài)勢(shì)愈演愈烈。就在谷歌一年一度的 I / O 開發(fā)者大會(huì)召開前夕,這家科技巨頭發(fā)布了一段視頻,展示了疑似經(jīng)過(guò)升級(jí)的 Gemini 聊天機(jī)器人。視頻中,Gemini 可以同時(shí)實(shí)時(shí)處理來(lái)自視頻和語(yǔ)音的輸入。
這段視頻貌似是在 I / O 大會(huì)搭建現(xiàn)場(chǎng)拍攝的,視頻展示了 Gemini 在一臺(tái) Pixel 手機(jī)上流暢地處理實(shí)時(shí)視頻和語(yǔ)音提問(wèn),并準(zhǔn)確地提供信息。當(dāng)被問(wèn)到正在進(jìn)行的布置工作時(shí),Gemini 正確識(shí)別出這是為一個(gè)重要活動(dòng)做的準(zhǔn)備。
整個(gè)對(duì)話過(guò)程自然流暢,Gemini 還會(huì)詢問(wèn)用戶注意到的細(xì)節(jié),成功識(shí)別出了該活動(dòng)為谷歌 I / O 開發(fā)者大會(huì),并進(jìn)行了簡(jiǎn)要介紹。
谷歌發(fā)布該預(yù)告片的時(shí)機(jī)非常巧妙,恰好在 OpenAI 有關(guān) ChatGPT 的發(fā)布會(huì)前幾個(gè)小時(shí),OpenAI 在此發(fā)布會(huì)上推出了全新的ChatGPT-4o 大模型,其理解和對(duì)話的流暢性以及連貫性方面都達(dá)到了無(wú)與倫比的水平。
雖然過(guò)去的一些演示視頻讓外界對(duì)這類內(nèi)容持有一定的懷疑態(tài)度,但今天展示的案例無(wú)疑證實(shí)了人工智能聊天機(jī)器人可以無(wú)縫集成語(yǔ)音和視頻輸入。這種多模態(tài)能力,加上非常自然的對(duì)話流,讓我們仿佛看到了未來(lái)人工智能交互的一瞥。
谷歌 I / O 大會(huì)主題演講將于明天凌晨 1 點(diǎn)舉行,屆時(shí)將第一時(shí)間帶來(lái)相關(guān)報(bào)道。
本文鏈接:http://www.tebozhan.com/showinfo-45-4250-0.htmlAI 聊天機(jī)器人大戰(zhàn)升溫:谷歌 Gemini 預(yù)告片展示驚艷語(yǔ)音視頻交互能力
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI 曾秘密測(cè)試 GPT-4o,力壓群雄登頂聊天機(jī)器人競(jìng)技場(chǎng)排行榜