當前位置：首頁 > 元宇宙 > AI

研究發現：AI 越聰明就越有可能“胡編亂造”

來源：責編：時間：2024-10-01 17:06:44 91觀看

導讀 9 月 29 日消息，一項新研究發現，隨著大型語言模型（LLM）變得越來越強大，它們似乎也越來越容易編造事實，而不是避免或拒絕回答它們無法回答的問題。這表明，這些更聰明的 AI 聊天機器人實際上變得不太可靠。圖源 Pexels

9 月 29 日消息，一項新研究發現，隨著大型語言模型（LLM）變得越來越強大，它們似乎也越來越容易編造事實，而不是避免或拒絕回答它們無法回答的問題。這表明，這些更聰明的 AI 聊天機器人實際上變得不太可靠。

圖源 Pexels

注意到，該研究發表在《自然》雜志上，研究人員研究了一些業界領先的商業 LLM：OpenAI 的 GPT 和 Meta 的 LLaMA，以及由研究小組 BigScience 創建的開源模型 BLOOM。

研究發現，雖然這些 LLM 的回答在許多情況下變得更加準確，但總體上可靠性更差，給出錯誤答案的比例比舊模型更高。

瓦倫西亞人工智能研究所在西班牙的研究員 José Hernández-Orallo 對《自然》雜志表示：“如今，它們幾乎可以回答一切。這意味著更多正確的答案，但也意味著更多錯誤的答案。”

格拉斯哥大學的科學和技術哲學家 Mike Hicks 對此進行了更嚴厲的評價，Hicks（未參與該研究）告訴《自然》雜志：“在我看來，這就像我們所說的胡說八道，它越來越擅長假裝知識淵博。”

測試中，這些模型被問及了從數學到地理等各種主題，并被要求執行諸如按指定順序列出信息等任務。總體而言，更大、更強大的模型給出了最準確的答案，但在更難的問題上表現不佳，其準確率較低。

研究人員稱，一些最大的“撒謊者”是 OpenAI 的 GPT-4 和 o1，但所有被研究的 LLM 似乎都呈這種趨勢，對于 LLaMA 系列模型，沒有一個能夠達到 60% 的準確率，即使是最簡單的問題。

而當被要求判斷聊天機器人的回答是準確還是不準確時，一小部分參與者有 10% 到 40% 的概率判斷錯誤。

總之研究表明，AI 模型越大（就參數、訓練數據和其他因素而言），它們給出錯誤答案的比例就越高。

研究人員稱，解決這些問題最簡單的方法是讓 LLM 不那么急于回答一切。Hernández-Orallo 稱：“可以設置一個閾值，當問題具有挑戰性時，讓聊天機器人說‘不，我不知道’。”但如果聊天機器人被限制為只回答它們知道的東西，可能會暴露技術的局限性。

本文鏈接：http://www.tebozhan.com/showinfo-45-8015-0.html研究發現：AI 越聰明就越有可能“胡編亂造”

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：字節跳動發布豆包視頻生成模型，這效果讓我分不清 AI 與現實

下一篇：國際機器人聯合會：2023 年我國新安裝工業機器人 27.63 萬臺，超全球半數

標簽：

熱門焦點

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

作者：趙志東蔡佳雯來源：區塊鏈日報該法案采用風險分級的規制路徑，將人工智能系統的風險劃分成不可接受的風險、高風險、有限風險和輕微風險四種類型，并針對不同類型施加了不同
中文在線的“元宇宙”故事，資本聽膩了？

被譽為“元宇宙”龍頭之一的中文在線，這下尷尬了。2022年1月11日，中國移動通信聯合會元宇宙產業委員會揭牌，接納涉足“元宇宙”的8家上市公司，包括中青寶、天下秀
元宇宙風口下，視覺中國如何重估？

要說橫跨2021年和2022年，到目前仍然很火的概念，元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局，上市公司們趨之若鶩，還被不少地方政府寫入了產業規劃，大有在2022年
米哈游推出元宇宙品牌；VR/AR老牌企業當紅齊天完成B輪+融資

今日熱點：蘋果AR/VR頭顯的FaceTime或基于Memojis和SharePlay構建而成；VR/AR老牌企業當紅齊天完成B輪+融資；米哈游推出元宇宙品牌HoYoverse；國產VR射擊游戲《Contra
頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

一場被國際奧委會主席評價堪稱獨具匠心、非凡卓越的2022年北京冬季奧運會，在這個“雙奧之城”經歷了16個令人難忘的精彩日夜，最終圓滿閉幕。讓我們印象深刻的不
權限風波過后 X2Y2如何挑戰OpenSea？

繼LooksRare之后，又一個OpenSea挑戰者X2Y2來了。上周，X2Y2宣布向超過86萬個OpenSea交易用戶發放X2Y2通證空投，并啟動了「掛單挖礦」的獎勵機制。這場早期激勵活動
傳統互聯網與區塊鏈場景下數據權利法律分析

數據權益的復雜性在于數據涉及多環節多主體、內容不同質且與不同場景緊密聯系、對軟硬件技術環節緊密相關等方面的復雜性。在傳統互聯網與區塊鏈模式下，數據處
元宇宙畫廊體驗報告：有點頭疼。

2 月 10 日，Hrishi Rajasekar 在舊金山鑄幣廠的沉浸式 NFT 展覽 Verse 觀看增強現實藝術品。“我們現在在虛擬世界中嗎？時間好像變長了” 我問身后排隊的人。我
超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

在2021年《福布斯》區塊鏈50強榜單中，29家企業使用Hyperledger超級賬本技術，占比近60%。同年，研究機構Blockdata發布了的調查報告顯示，訪問Top100上市公司中，有 81

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

研究發現：AI 越聰明就越有可能“胡編亂造”

歐盟人工智能法案：四種AI系統風險類型的劃分及監管措施

中文在線的“元宇宙”故事，資本聽膩了？

元宇宙風口下，視覺中國如何重估？

米哈游推出元宇宙品牌；VR/AR老牌企業當紅齊天完成B輪+融資

頂流IP“冰墩墩”帶著中國元素NFT進入全球視野

權限風波過后 X2Y2如何挑戰OpenSea？

傳統互聯網與區塊鏈場景下數據權利法律分析

元宇宙畫廊體驗報告：有點頭疼。

超級賬本Julian Gordon：聯盟鏈與公鏈的競爭不是非此即彼

最新推薦

上、中、下游加深融合，搭建元宇宙產業全景

刷完一場元宇宙世界杯音樂盛典，我爽了

元宇宙時代NFT的價值衡量

元宇宙社交時代，華麗歸來的超級QQ秀重構虛擬社交場景

元宇宙需要的5個重要安全功能

為什么元宇宙將永遠改變體育和你的生活？

猜你喜歡

熱門推薦

相關資訊