當前位置：首頁 > 元宇宙 > AI

AI智慧背后的隱憂：越聰明，越愛“編造”真相？

來源：責編：時間：2024-09-29 16:14:56 113觀看

導讀**大型語言模型越強大越愛“撒謊”？新研究揭示AI準確性困境**隨著大型語言模型（LLM）能力的不斷增強，一項新研究卻發現了令人擔憂的趨勢：這些智能聊天機器人在回答問題時，似乎越來越傾向于編造答案，而非謹慎地避免或拒絕回答

**大型語言模型越強大越愛“撒謊”？新研究揭示AI準確性困境**

隨著大型語言模型（LLM）能力的不斷增強，一項新研究卻發現了令人擔憂的趨勢：這些智能聊天機器人在回答問題時，似乎越來越傾向于編造答案，而非謹慎地避免或拒絕回答它們不確定的問題。這種行為模式表明，盡管AI變得更加“聰明”，但其可靠性卻在實際應用中受到了質疑。

該研究由多個知名研究機構聯合進行，成果已發表在《自然》雜志上。研究團隊對市面上領先的商業LLM進行了深入分析，包括OpenAI的GPT系列、meta的LLaMA，以及開源模型BLOOM。在對比了這些模型在不同主題和問題類型上的表現后，研究人員發現，盡管新一代LLM在某些情況下的確給出了更準確的回答，但從整體來看，它們提供錯誤答案的頻率卻比舊模型更高。

瓦倫西亞人工智能研究所的研究員José Hernández-Orallo指出：“現在的LLM幾乎能回答任何問題，這既是進步也是隱患。雖然正確回答的數量增加了，但錯誤回答的數量也同樣在上升。”

在測試中，這些LLM被要求處理從數學到地理等多個領域的問題，并執行一些特定的信息排序任務。結果顯示，規模更大、能力更強的模型在簡單問題上表現最佳，但在面對更復雜的問題時，其準確率卻顯著下降。

值得注意的是，OpenAI的GPT-4和o1模型在測試中成為了最大的“撒謊者”，但這一趨勢并非孤例，其他被研究的LLM也呈現出了類似的傾向。特別是在LLaMA系列模型中，即便是最簡單的問題，也沒有任何一個模型能夠達到60%的準確率。

當被要求評估聊天機器人答案的準確性時，參與測試的人類受試者也表現出了相當程度的不確定性，他們在10%到40%的情況下做出了錯誤的判斷。

這項研究揭示了一個重要的問題：隨著AI模型的規模和能力的不斷提升，如何確保它們提供的答案是準確且可靠的？研究人員建議，一個可能的解決方案是讓LLM在面對不確定的問題時學會保持沉默，而不是盲目地給出答案。Hernández-Orallo表示：“我們可以設定一個閾值，讓聊天機器人在遇到具有挑戰性的問題時能夠說‘不，我不知道’。”然而，這種做法也可能會暴露當前技術的局限性，從而影響用戶對AI的信任和接受度。

本文鏈接：http://www.tebozhan.com/showinfo-45-7915-0.htmlAI智慧背后的隱憂：越聰明，越愛“編造”真相？

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：科大訊飛進軍云南，新成立信息科技公司，布局西南市場？

下一篇：字節跳動新推豆包視頻生成模型：AI與現實界限模糊，你能分清嗎？

標簽：

熱門焦點

【東方證券】虛擬世界照進現實，元宇宙中有什么？ | 元宇宙Meta洞見

元宇宙的表現形式大多以游戲為起點，并逐漸整合互聯網、數字化娛樂、社交網絡等功能，長期來看甚至可以整合社會經濟與商業活動。元宇宙的發展最關鍵的部分在于元
星展銀行(DBS)計劃推出零售數字資產交易服務

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數字資產交易服務。據悉，DBS于2021年初開設了機構數字資產交易平臺，全
Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

今日熱點：迪士尼任命新高管負責元宇宙業務；iFixit成為Valve Index VR頭顯和Steam Deck首家零件銷售商；Niantic與索尼達成合作，將為AR游戲《Ingress》帶來音頻體驗；V
摩根大通：元宇宙市場預計每年收入超1萬億美元

今日《元宇宙新鮮事》有：香港首屆元宇宙藝博會將于5月舉辦；NH-Amundi Asset Management上市其第二支元宇宙ETF；Meta虛擬現實平臺Horizon Worlds月活躍用戶在三個
小眾有趣NFT藝術作品欣賞（1）

隨著NFT發展火熱，越來越多領域與NFT融合，NFT藝術在加密領域中占據了很大一部分。NFT藝術與傳統藝術有相似之處，也有完全不同的地方。NFT藝術與傳統藝術一樣，表現了
NFT教育要從娃娃抓起！這些青少年藝術家已經賺取了幾千萬美金

一些藝術家通過將他們的創作作為NFT出售而獲得了巨大收益。令人驚訝的是，許多賺取了數百萬美元的藝術家們仍在讀高中。這可能有點讓人難以置信。然而，請記住，在短
Web 3如何改變傳統HR

互聯網自誕生以來，經歷了三次迭代。Web1是第一階段，包括ISP服務器上的個人網頁或免費的虛擬主機服務。然后Web2出現了，它引入了動態的用戶生成內容、互操作性、增
百度虛擬人——AI手語主播首次亮相冬奧會！

除了火遍全國的冰墩墩，虛擬人也成為這屆冬奧會的一大亮點元素。以體育明星谷愛凌為原型的數智人Meet Gu最先亮相。在2月5日谷愛凌首秀、2月7日谷愛凌首金的兩天
這場虛擬發布會，當面“造假”！

英偉達去年4月份那場發布會，你曾看出什么不對勁的地方嗎？你品，你細品——在計算機圖形學頂會SIGGRAPH 2021上，英偉達通過一部紀錄片自曝：那場發布會內藏玄機~你看到

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI智慧背后的隱憂：越聰明，越愛“編造”真相？

【東方證券】虛擬世界照進現實，元宇宙中有什么？ | 元宇宙Meta洞見

星展銀行(DBS)計劃推出零售數字資產交易服務

Niantic與索尼在音頻AR領域達成合作；?蘋果為Apple Park申請形象化商標

摩根大通：元宇宙市場預計每年收入超1萬億美元

小眾有趣NFT藝術作品欣賞（1）

NFT教育要從娃娃抓起！這些青少年藝術家已經賺取了幾千萬美金

Web 3如何改變傳統HR

百度虛擬人——AI手語主播首次亮相冬奧會！

這場虛擬發布會，當面“造假”！

最新推薦

這一超級富豪“逆襲”，身價大增4330億

大廠元宇宙，又菜又愛玩

a16z：元宇宙辦公會取代實體辦公室嗎？

NFT教育要從娃娃抓起！這些青少年藝術家已經賺取了幾千萬美金

NFT世界的藝術家名單

技術賦能，國內首家寵物元宇宙平臺“Pet Meta”開啟虛擬養寵新方式

猜你喜歡

熱門推薦

相關資訊