當前位置：首頁 > 元宇宙 > AI

AI 醫療建議可靠性存疑：MIT 研究揭示用戶提問方式影響 AI 判斷

來源：責編：時間：2025-07-12 14:39:58 38觀看

導讀 7 月 10 日消息，隨著生成式人工智能（AI）技術不斷演進，其應用場景已從早期的簡單問答擴展到更復雜的任務。然而，對于缺乏技術背景的用戶而言，如何高效、準確地使用這些 AI 工具，正變得越來越具有挑戰性。一份獨立報告

7 月 10 日消息，隨著生成式人工智能（AI）技術不斷演進，其應用場景已從早期的簡單問答擴展到更復雜的任務。然而，對于缺乏技術背景的用戶而言，如何高效、準確地使用這些 AI 工具，正變得越來越具有挑戰性。

一份獨立報告顯示，微軟 AI 部門收到的用戶投訴中，最常見的一條是“Copilot 不如 ChatGPT 好用”。對此，微軟迅速回應，將問題歸咎于用戶“提示詞工程能力不佳”。為改善用戶體驗，微軟還推出了“Copilot 學院”，幫助用戶提升 AI 使用技能。

注意到，麻省理工學院（MIT）的一項最新研究（via Futurism）表明，微軟將問題歸咎于用戶提示詞能力的做法或許并非全無道理。

該研究指出，過度依賴 AI 工具獲取醫療建議可能帶來危險。更令人擔憂的是，如果用戶在提問時出現拼寫錯誤（如單詞拼錯或多余空格），AI 可能會因此建議用戶無需就醫。此外，使用花哨語言或俚語也可能導致 AI 判斷失誤。

研究還發現，女性用戶比男性更容易受到此類錯誤建議的影響，盡管這一結論仍需進一步驗證。

此次研究涵蓋了多個 AI 工具，包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B，以及一款名為 Palmyra-Med 的醫療專用 AI。研究人員模擬了數千個健康案例，數據來源包括真實患者投訴、Reddit 上的健康相關帖子，以及 AI 生成的病例。

為測試 AI 的穩定性，研究人員在數據中加入了“擾動因素”，如句子首字母大小寫不一致、感嘆號、情緒化語言，以及“可能”“大概”等不確定表達。結果顯示，這些擾動使 AI 建議用戶“無需就醫”的概率上升了 7% 至 9%。

研究負責人、MIT 研究員阿比尼塔?古拉巴蒂娜（Abinitha Gourabathina）指出：“這些模型通常是在醫學考試題目上訓練和測試的，但實際應用場景卻相差甚遠，比如評估臨床病例的嚴重程度。我們對大語言模型的理解仍然非常有限。”

這一研究結果引發了對 AI 在醫療領域應用的廣泛擔憂。值得注意的是，就在不久前，微軟剛剛宣布其新推出的 AI 醫療工具“準確率是人類醫生的 4 倍，成本卻低 20%”。微軟 AI 首席執行官甚至稱其為“邁向醫療超級智能的真正一步”。

然而，這項研究再次提醒我們，生成式 AI 在醫療等高度復雜的領域仍遠未達到完全可靠的水平。盡管技術發展迅速，但在真正投入使用前，仍需更多驗證與審慎評估。

本文鏈接：http://www.tebozhan.com/showinfo-45-14483-0.htmlAI 醫療建議可靠性存疑：MIT 研究揭示用戶提問方式影響 AI 判斷

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：迪拜“AI 主廚”餐廳即將開業：大模型設計菜譜，打造獨特大膽味覺體驗

下一篇： ChatGPT 又遇“奶奶漏洞”，網友成功讓 GPT-4o 主動生成“Win7 密鑰”

標簽：

熱門焦點

從科幻走進現實，元宇宙概念逐漸清晰

2021年，元宇宙概念如同一顆炸彈投進互聯網行業，掀起了一場數字海嘯，眾多企業紛紛入局，在此新領域展開新探索。那么，加速狂奔的元宇宙究竟是什么？概念翻紅，元宇宙走進資本圈2021年3
大廠元宇宙，又菜又愛玩

撰文 | 吳先之編輯 | 王潘當下所有大廠推出的元宇宙產品，所能帶來的沉浸式體驗并不多，好在國內外科技巨頭在bug方面都處在同一水平線。以Meta為例，由于VR頭顯設
韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

韓國投資公司(KIC)CEO Seoungho Jin預計，該公司在舊金山的辦事處今年將擴招人手，探索在硅谷投資科技、健康和綠色項目。規模高達2000億美元的韓國主權財富基金—
“元宇宙第一股”Roblox緣何被資本市場看“低”？

近期，冬奧會的召開受到廣泛關注，而吉祥物冰墩墩也成為新晉“頂流”，“一墩難求”成為普遍心聲，為了滿足大眾需求，nWayPlay平臺曾在2月12日發售了一款由國際奧委會官
NFT自動售貨機來啦！

“紐約市有一臺售賣 Solana NFT 的自動售貨機，用信用卡就能買”Solana NFT 市場 Neon 可讓您使用信用卡親自購買 NFT，無需使用加密貨幣。由于基于 Solana 鏈的 N
獨立故事片“Calladita”將使用 NFT 籌集資金

導演 Miguel Faus 正在轉向加密來資助他的處女作，由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”（導演 Miguel Faus）。圖片：米格爾·福斯在過去的一年
虛擬人的3大紀律和6種品牌孵化模式

作者：陳格雷（老小格）及團隊虛擬人很熱，我們最近廣泛收集和研究了、各種消費品牌企業在虛擬人開發上的一些主要特點，整理出6種最主要的品牌虛擬人模式，后面一一介紹。
這場虛擬發布會，當面“造假”！

英偉達去年4月份那場發布會，你曾看出什么不對勁的地方嗎？你品，你細品——在計算機圖形學頂會SIGGRAPH 2021上，英偉達通過一部紀錄片自曝：那場發布會內藏玄機~你看到
爆發在即的Layer2賽道百花齊放，誰將是領跑者？

還記得幾年前最早我們提起ETH擴容，首先想到就是Layer2，而Layer2里，首先想到的是閃電網絡，狀態通道，Plasma…然后折騰了幾年，發現并沒有什么用，許多項目方和資本也等不

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

AI 醫療建議可靠性存疑：MIT 研究揭示用戶提問方式影響 AI 判斷

從科幻走進現實，元宇宙概念逐漸清晰

大廠元宇宙，又菜又愛玩

韓國主權基金增加對硅谷初創公司投資押注元宇宙和人工智能

“元宇宙第一股”Roblox緣何被資本市場看“低”？

NFT自動售貨機來啦！

獨立故事片“Calladita”將使用 NFT 籌集資金

虛擬人的3大紀律和6種品牌孵化模式

這場虛擬發布會，當面“造假”！

爆發在即的Layer2賽道百花齊放，誰將是領跑者？

最新推薦

從科幻走進現實，元宇宙概念逐漸清晰

元宇宙社交啫喱、希壤爆款迭出，騰訊慌了嗎？

“元宇宙第一股”Roblox緣何被資本市場看“低”？

從NFT頂級公鏈到Web3.0基礎設施：帶你了解不一樣的Flow

“我沒搞懂元宇宙，但一天能賺9w塊”

NFT盜竊案：為什么NFT市場被盜竊和黑客所困擾？

猜你喜歡

熱門推薦

相關資訊