7 月 5 日消息,據(jù)外媒 iXBT 4 日?qǐng)?bào)道,德國 Helmholtz AI 研究計(jì)劃、谷歌 DeepMind、普林斯頓大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)近日聯(lián)合發(fā)布了一項(xiàng)重要成果:一款名為 Centaur 的通用型 AI 模型,首次實(shí)現(xiàn)了在大規(guī)模認(rèn)知任務(wù)中預(yù)測(cè)人類行為的能力。
Centaur 基于 700 億參數(shù)的 Llama 3.1 語言模型,并通過名為 Psych-101 的數(shù)據(jù)集進(jìn)行了專門訓(xùn)練。該數(shù)據(jù)集匯集了來自 6 萬名參與者、覆蓋 160 個(gè)實(shí)驗(yàn)的超過 1000 萬個(gè)決策,涵蓋了感知、記憶、邏輯推理、道德判斷及不確定性決策等領(lǐng)域。研究人員將每個(gè)實(shí)驗(yàn)轉(zhuǎn)化為自然語言的文本形式,使模型可以像閱讀說明書一樣理解任務(wù)。憑借這一訓(xùn)練方式,Centaur 能夠在未接觸過的新情境下做出精準(zhǔn)預(yù)測(cè)。
即使面對(duì)完全陌生的測(cè)試任務(wù),Centaur 也能精準(zhǔn)預(yù)測(cè)行為。例如在一項(xiàng)類似老虎機(jī)的實(shí)驗(yàn)中,參與者需在中獎(jiǎng)概率不同的兩臺(tái)機(jī)器間做出選擇,模型的預(yù)測(cè)結(jié)果高度貼近真實(shí)決策。在邏輯推理和道德難題等更復(fù)雜的認(rèn)知場(chǎng)景中,Centaur 的表現(xiàn)也超過了現(xiàn)有的主流模型。
研究人員特別關(guān)注 Centaur 與人腦運(yùn)作的相似性。他們將模型的“內(nèi)部表征”與功能性磁共振成像(fMRI)結(jié)果對(duì)比,發(fā)現(xiàn) Centaur 在處理任務(wù)時(shí)的激活模式,與人類大腦的神經(jīng)活動(dòng)更為接近,甚至超過了 GPT-4 和 PaLM-2。
Centaur 還能推動(dòng)認(rèn)知科學(xué)理論的發(fā)展。在一項(xiàng)測(cè)試中,模型識(shí)別出一種新型決策策略:人類在做選擇時(shí)不僅考慮概率,還會(huì)預(yù)估未來回報(bào)。這一模式此前從未在心理學(xué)研究中被系統(tǒng)描述,但經(jīng)過模型的提示,研究人員再次實(shí)驗(yàn)并確認(rèn)了其存在。
目前,Psych-101 數(shù)據(jù)集和 Centaur 模型已全部開放,未來還計(jì)劃拓展應(yīng)用至兒童心理學(xué)、精神病學(xué)等更多領(lǐng)域。
附該成果在《自然》雜志上的論文:https://www.nature.com/articles/s41586-025-09215-4?utm_source=ixbtcom
本文鏈接:http://www.tebozhan.com/showinfo-45-14429-0.html谷歌 DeepMind、普林斯頓大學(xué)推出新 AI 模型,可精準(zhǔn)預(yù)測(cè)人類行為
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: OpenAI 招聘主管點(diǎn)名批評(píng) Meta:挖角手段讓人聞到一股“絕望的味道”
下一篇: 日農(nóng)機(jī)廠商久保田推出農(nóng)戶專用生成式 AI 服務(wù),可解答農(nóng)作物種植有關(guān)問題