美國加州大學圣地亞哥分校近日發布了一項研究成果,首次提供了“人工智能系統能夠通過標準三方圖靈測試的實證證據”。
圖靈測試由英國數學家阿蘭?圖靈于1950年提出,被稱為“模仿游戲”。測試中,提問者需通過文本交流區分對方是機器還是人類。如果提問者無法準確辨別,那么該機器可能被認為具備類似人類的智能。在三方圖靈測試中,提問者需與一名人類和一臺機器對話,并判斷哪一方是人類。
研究測試了三款AI模型,包括OpenAI的GPT-4.5、Meta的Llama 3.1 405B,以及OpenAI的GPT-4o。實驗中,人類參與者通過分屏界面與一名人類和一臺AI系統進行五分鐘的對話,結束后需判斷哪一方是人類。
研究人員在兩種模式下評估了這些AI模型的表現:基礎指令(NO-PERSONA)模式和增強型PERSONA模式。后者引導AI模擬特定的人類行為特征。結果顯示,在PERSONA模式下,GPT-4.5的勝率高達73%,表明提問者常將其誤認為是人類;Llama 3.1-405B的勝率約為56%;而在NO-PERSONA模式下,GPT-4o的勝率僅為21%。
對話內容主要圍繞日常閑聊展開,其中61%的互動涉及日常生活和個人細節,50%的互動則探討社會和情感層面,如觀點、情感、幽默感和個人經歷。
研究報告指出:“如果提問者無法可靠地區分人類與機器,那么該機器即被認為通過了圖靈測試。”基于這一標準,GPT-4.5和Llama 3.1-405B在啟用PERSONA模式時均通過了測試。
研究人員認為,這些AI系統在依賴簡短對話的經濟角色中,有望補充甚至取代人類勞動力。此外,這些系統可能成為難以區分的替代品,適用于從在線陌生人對話到與朋友、同事乃至浪漫伴侶的交流等場景。
本文鏈接:http://www.tebozhan.com/showinfo-27-140906-0.htmlAI系統通過圖靈測試:GPT-4.5勝率高達73%
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 法拉第未來發布FX系列前臉設計,計劃2025年底前投產
下一篇: 印度科技初創公司IPO熱潮將至,未來兩年或迎30家企業上市
標簽: