AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁(yè) > 科技  > 芯片

AI系統(tǒng)通過(guò)圖靈測(cè)試:GPT-4.5勝率高達(dá)73%

來(lái)源:icspec 責(zé)編: 時(shí)間:2025-04-03 07:41:49 123觀看
導(dǎo)讀美國(guó)加州大學(xué)圣地亞哥分校近日發(fā)布了一項(xiàng)研究成果,首次提供了“人工智能系統(tǒng)能夠通過(guò)標(biāo)準(zhǔn)三方圖靈測(cè)試的實(shí)證證據(jù)”。圖靈測(cè)試由英國(guó)數(shù)學(xué)家阿蘭?圖靈于1950年提出,被稱為“模仿游戲”。測(cè)試中,提問(wèn)者需通過(guò)文本交流區(qū)分
美國(guó)加州大學(xué)圣地亞哥分校近日發(fā)布了一項(xiàng)研究成果,首次提供了“人工智能系統(tǒng)能夠通過(guò)標(biāo)準(zhǔn)三方圖靈測(cè)試的實(shí)證證據(jù)”。
圖靈測(cè)試由英國(guó)數(shù)學(xué)家阿蘭?圖靈于1950年提出,被稱為“模仿游戲”。測(cè)試中,提問(wèn)者需通過(guò)文本交流區(qū)分對(duì)方是機(jī)器還是人類。如果提問(wèn)者無(wú)法準(zhǔn)確辨別,那么該機(jī)器可能被認(rèn)為具備類似人類的智能。在三方圖靈測(cè)試中,提問(wèn)者需與一名人類和一臺(tái)機(jī)器對(duì)話,并判斷哪一方是人類。
研究測(cè)試了三款A(yù)I模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。實(shí)驗(yàn)中,人類參與者通過(guò)分屏界面與一名人類和一臺(tái)AI系統(tǒng)進(jìn)行五分鐘的對(duì)話,結(jié)束后需判斷哪一方是人類。
研究人員在兩種模式下評(píng)估了這些AI模型的表現(xiàn):基礎(chǔ)指令(NO-PERSONA)模式和增強(qiáng)型PERSONA模式。后者引導(dǎo)AI模擬特定的人類行為特征。結(jié)果顯示,在PERSONA模式下,GPT-4.5的勝率高達(dá)73%,表明提問(wèn)者常將其誤認(rèn)為是人類;Llama 3.1-405B的勝率約為56%;而在NO-PERSONA模式下,GPT-4o的勝率僅為21%。
對(duì)話內(nèi)容主要圍繞日常閑聊展開,其中61%的互動(dòng)涉及日常生活和個(gè)人細(xì)節(jié),50%的互動(dòng)則探討社會(huì)和情感層面,如觀點(diǎn)、情感、幽默感和個(gè)人經(jīng)歷。
研究報(bào)告指出:“如果提問(wèn)者無(wú)法可靠地區(qū)分人類與機(jī)器,那么該機(jī)器即被認(rèn)為通過(guò)了圖靈測(cè)試。”基于這一標(biāo)準(zhǔn),GPT-4.5和Llama 3.1-405B在啟用PERSONA模式時(shí)均通過(guò)了測(cè)試。
研究人員認(rèn)為,這些AI系統(tǒng)在依賴簡(jiǎn)短對(duì)話的經(jīng)濟(jì)角色中,有望補(bǔ)充甚至取代人類勞動(dòng)力。此外,這些系統(tǒng)可能成為難以區(qū)分的替代品,適用于從在線陌生人對(duì)話到與朋友、同事乃至浪漫伴侶的交流等場(chǎng)景。

本文鏈接:http://www.tebozhan.com/showinfo-27-140906-0.htmlAI系統(tǒng)通過(guò)圖靈測(cè)試:GPT-4.5勝率高達(dá)73%

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 法拉第未來(lái)發(fā)布FX系列前臉設(shè)計(jì),計(jì)劃2025年底前投產(chǎn)

下一篇: 印度科技初創(chuàng)公司IPO熱潮將至,未來(lái)兩年或迎30家企業(yè)上市

標(biāo)簽:
  • 熱門焦點(diǎn)
Top