AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁 > 元宇宙 > AI

哥倫比亞大學(xué)研究:AI 搜索工具平均準(zhǔn)確率僅六成,且自信滿滿“不認(rèn)錯(cuò)”

來源: 責(zé)編: 時(shí)間:2025-03-15 14:50:04 85觀看
導(dǎo)讀 3 月 13 日消息,據(jù)外媒 Techspot 周二報(bào)道,哥倫比亞大學(xué)數(shù)字新聞研究中心(Tow Center for Digital Journalism)近期對(duì)八款 AI 搜索引擎展開研究,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSe

3 月 13 日消息,據(jù)外媒 Techspot 周二報(bào)道,哥倫比亞大學(xué)數(shù)字新聞研究中心(Tow Center for Digital Journalism)近期對(duì)八款 AI 搜索引擎展開研究,包括 ChatGPT Search、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search 和 Copilot。研究人員測(cè)試了每款引擎的準(zhǔn)確性,并記錄了它們拒絕回答問題的頻率。0j528資訊網(wǎng)——每日最新資訊28at.com

0j528資訊網(wǎng)——每日最新資訊28at.com

研究人員從 20 家新聞機(jī)構(gòu)中隨機(jī)挑選了 200 篇報(bào)道(每家 10 篇),確保它們?cè)诠雀杷阉鲿r(shí)能排在前三位,然后用相同的查詢方式測(cè)試各 AI 搜索工具,并評(píng)估它們是否正確引用了文章內(nèi)容、新聞機(jī)構(gòu)名稱和原始鏈接。0j528資訊網(wǎng)——每日最新資訊28at.com

測(cè)試結(jié)果顯示,除 Perplexity 及其付費(fèi)版外,其余 AI 搜索引擎的表現(xiàn)都不盡如人意。整體來看,AI 搜索引擎提供的答案有 60% 是不準(zhǔn)確的,而且 AI 對(duì)錯(cuò)誤答案的“自信”反而加劇了問題。0j528資訊網(wǎng)——每日最新資訊28at.com

這項(xiàng)研究的重要性在于,它用數(shù)據(jù)印證了外界多年來的擔(dān)憂 —— 大語言模型僅會(huì)出錯(cuò),還擅長一本正經(jīng)地胡說八道。它們往往以絕對(duì)肯定的語氣陳述錯(cuò)誤信息,甚至在被質(zhì)疑時(shí)仍然試圖自圓其說。0j528資訊網(wǎng)——每日最新資訊28at.com

即使承認(rèn)了錯(cuò)誤,ChatGPT 仍可能在后續(xù)回答中繼續(xù)編造內(nèi)容。在大語言模型的設(shè)定中,幾乎是“無論如何都要給出答案”。研究數(shù)據(jù)支持了這一觀點(diǎn):ChatGPT Search 是唯一回答了所有 200 個(gè)新聞查詢的 AI 工具,但其“完全正確”率僅 28%,而“完全錯(cuò)誤”率高達(dá) 57%。0j528資訊網(wǎng)——每日最新資訊28at.com

ChatGPT 并非表現(xiàn)最糟的。X 旗下的 Grok AI 表現(xiàn)尤為不堪,其中 Grok-3 Search 的錯(cuò)誤率高達(dá) 94%。微軟 Copilot 也問題重重 —— 在 200 次查詢中,有 104 次拒絕作答,剩下的 96 次中,僅 16 次“完全正確”,14 次“部分正確”,66 次“完全錯(cuò)誤”,總體錯(cuò)誤率接近 70%。0j528資訊網(wǎng)——每日最新資訊28at.com

這些 AI 工具的開發(fā)公司并未公開承認(rèn)這些問題,卻仍向用戶收取每月 20 至 200 美元(備注:當(dāng)前約 145 至 1449 元人民幣)的訂閱費(fèi)。此外,付費(fèi)版 Perplexity Pro(20 美元 / 月)和 Grok-3 Search(40 美元 / 月)比免費(fèi)版回答得更多,但錯(cuò)誤率也更高。0j528資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-11482-0.html哥倫比亞大學(xué)研究:AI 搜索工具平均準(zhǔn)確率僅六成,且自信滿滿“不認(rèn)錯(cuò)”

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 中關(guān)村科金引領(lǐng)垂類大模型時(shí)代,得助平臺(tái)與智能客服全新升級(jí)亮相

下一篇: 北京市中小學(xué)將打造首批 11 個(gè) AI 應(yīng)用場(chǎng)景

標(biāo)簽:
  • 熱門焦點(diǎn)
  • ChatGPT訪問量增速下滑,AI真的是一場(chǎng)泡沫嗎?

    來源:首席商業(yè)評(píng)論2023年,最火的莫過于ChatGPT,席卷全球的同時(shí)也引發(fā)了生成式AI(人工智能)的投資熱潮。在美股,ChatGPT相關(guān)概念股飆漲,以AI算力龍頭英偉達(dá)為例,其股價(jià)年內(nèi)一度累計(jì)上
  • 元宇宙的文旅賽道,還能如何發(fā)力?

    來源:X增強(qiáng)現(xiàn)實(shí)蘋果推出Vision Pro,為XR行業(yè)注入一劑強(qiáng)心針。而在蘋果開發(fā)者大會(huì)上迪士尼CEO鮑勃·艾格在宣布迪士尼與蘋果達(dá)成合作,其Disney+流媒體服務(wù)將于Vision Pro
  • 新周期,誰在堅(jiān)守窄門?

    來源:錦緞今日的投資者恐怕已經(jīng)忘記了,在OpenAI創(chuàng)造出ChatGPT這一殺器的前夜,生成式AI也曾經(jīng)是一道窄門,窄到連馬斯克都差點(diǎn)失去了信心。在當(dāng)時(shí)的輿論眼中,AGI的道路不夠性感,不夠
  • 上、中、下游加深融合,搭建元宇宙產(chǎn)業(yè)全景

    元宇宙產(chǎn)業(yè)鏈涉及多種技術(shù)和多個(gè)領(lǐng)域。在上游,聚集著大量的技術(shù)廠商,提供元宇宙相關(guān)的硬件和軟件支持;在中游,內(nèi)容運(yùn)營與分發(fā)領(lǐng)域也吸引著越來越多的企業(yè)以VR內(nèi)容
  • Meta公布AI概念“Builder Bot”;銀保監(jiān)發(fā)布元宇宙相關(guān)風(fēng)險(xiǎn)提示

    概述自從Meta在2月初公布財(cái)報(bào)后,其負(fù)責(zé)元宇宙的核心部門Reality Labs表現(xiàn)不佳,凈虧損超100億美元,隨后股價(jià)斷崖式下跌。如今,Meta開始繼續(xù)發(fā)力元宇宙,想要挽回頹勢(shì),
  • 權(quán)限風(fēng)波過后 X2Y2如何挑戰(zhàn)OpenSea?

    繼LooksRare之后,又一個(gè)OpenSea挑戰(zhàn)者X2Y2來了。上周,X2Y2宣布向超過86萬個(gè)OpenSea交易用戶發(fā)放X2Y2通證空投,并啟動(dòng)了「掛單挖礦」的獎(jiǎng)勵(lì)機(jī)制。這場(chǎng)早期激勵(lì)活動(dòng)
  • NFT藝術(shù)家Hayley Rincon 專訪:我的迷幻數(shù)字藝術(shù)之路

    Hayley Rincon是一位令人印象深刻才華橫溢的創(chuàng)作者,她的作品呈現(xiàn)出迷幻的氣息。今天就來聊聊她的藝術(shù)作品,和她自己的數(shù)字藝術(shù)之路。Hayley是加利福尼亞灣區(qū)的有
  • 元宇宙的應(yīng)用行業(yè)研究:娛樂可能是元宇宙落地最快的場(chǎng)景之一

    近日,畢馬威正式發(fā)布其《初探元宇宙》報(bào)告,這也是畢馬威在元宇宙領(lǐng)域發(fā)布的首份報(bào)告。報(bào)告指出,元宇宙在以下十個(gè)領(lǐng)域的應(yīng)用場(chǎng)景尤其值得期待,包括娛樂、社交、零
  • 全球十大元宇宙概念游戲

    A股市場(chǎng)中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發(fā)布一款元宇宙概念的模擬經(jīng)營類游戲,盡管游戲尚在研發(fā)中,這一消息已經(jīng)讓中青寶的股價(jià)在51個(gè)交易

相關(guān)資訊

    SQL Error: select * from ***_ecms_news11 where id in(40,,48,85,154,188) limit 6
Top