當前位置：首頁 > 元宇宙 > AI

MIT 研究揭示 AI 并無穩(wěn)定價值觀，“對齊”挑戰(zhàn)遠超預(yù)期

來源：責編：時間：2025-04-11 07:48:47 67觀看

導(dǎo)讀 4 月 10 日消息，幾個月前，一項研究暗示隨著人工智能（AI）越來越復(fù)雜，其會發(fā)展出“價值體系”，例如優(yōu)先考慮自身福祉而非人類福祉。然而，麻省理工學院（MIT）最近發(fā)表的一篇論文卻給這種夸張的觀點潑了冷水，得出結(jié)論認為 AI

4 月 10 日消息，幾個月前，一項研究暗示隨著人工智能（AI）越來越復(fù)雜，其會發(fā)展出“價值體系”，例如優(yōu)先考慮自身福祉而非人類福祉。然而，麻省理工學院（MIT）最近發(fā)表的一篇論文卻給這種夸張的觀點潑了冷水，得出結(jié)論認為 AI 實際上并沒有任何連貫的價值觀。

MIT 研究的共同作者表示，他們的研究結(jié)果表明，使 AI 系統(tǒng)“對齊”，即確保模型以人們期望的、可靠的方式行事，可能比通常認為的更具挑戰(zhàn)性。他們強調(diào)，我們?nèi)缃袼?AI 會產(chǎn)生“幻覺”并進行模仿，這使得其在許多方面難以預(yù)測。

“我們可以確定的一點是，模型并不遵循許多穩(wěn)定性、可外推性和可操控性的假設(shè)。”MIT 博士生、該研究的共同作者斯蒂芬?卡斯珀（Stephen Casper）在接受 TechCrunch 采訪時表示。

據(jù)了解，卡斯珀和他的同事們研究了來自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多個近期模型，以了解這些模型在多大程度上表現(xiàn)出強烈的“觀點”和價值觀（例如個人主義與集體主義）。他們還調(diào)查了這些觀點是否可以被“引導(dǎo)”，即被修改，以及模型在各種情境下對這些觀點的堅持程度。

據(jù)共同作者稱，沒有任何一個模型在其偏好上是一致的。根據(jù)提示的措辭和框架不同，它們會表現(xiàn)出截然不同的觀點。

卡斯珀認為，這是有力的證據(jù)，表明模型高度“不一致且不穩(wěn)定”，甚至可能根本無法內(nèi)化類似人類的偏好。

“對我來說，通過所有這些研究，我最大的收獲是現(xiàn)在明白模型并不是真正具有某種穩(wěn)定、連貫的信念和偏好的系統(tǒng)。”卡斯珀說，“相反，它們本質(zhì)上是模仿者，會進行各種捏造，并說出各種輕率的話。”

本文鏈接：http://www.tebozhan.com/showinfo-45-12138-0.htmlMIT 研究揭示 AI 并無穩(wěn)定價值觀，“對齊”挑戰(zhàn)遠超預(yù)期

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識，若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： 2025年一季度全球VC交易大跌，亞洲AI融資占比不足一成？

下一篇： OpenAI 啟動先鋒計劃，旨在重塑 AI 模型評分體系

標簽：

熱門焦點

一份全面清單：Web3行業(yè)高薪酬的13種工作

來源：區(qū)塊鏈騎士這可能會讓許多人感到震驚，但除了成為開發(fā)人員之外，Web3還有其他高薪工作。Web3可能是現(xiàn)代就業(yè)市場中跨學科最多的領(lǐng)域，換句話說，它由許多個在不同領(lǐng)域中具有不同
人間誠實周鴻祎：360 All in 大模型的六個解讀

主筆 / 村口有牛文章架構(gòu)師 / 毛自聰出品 / 巨頭財經(jīng)5月至今，人間躁動，各路大模型你方唱罷我登場，VC圈互聯(lián)網(wǎng)圈媒體圈已近癲狂。誰也沒想到，今日，360再度刷屏，老牌互聯(lián)網(wǎng)巨頭展現(xiàn)
不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

作者：中科基大數(shù)據(jù)元宇宙是一個去中心化的開放平臺，而為了維護這樣的平臺，需要建立一個公平的游戲規(guī)則，確保每個元宇宙的參與者通過這個規(guī)則都可以掙到錢，他們的利益都可以得到保
元宇宙步入暗夜

撰文 | 文燁豪元宇宙的故事，似乎講不通了。當下，刮起元宇宙熱潮的Roblox股價已跌去大半，帶頭大哥Meta也正因元宇宙虧損深陷泥潭。再看國內(nèi)，從字節(jié)“派對島&
搶先推出“元宇宙”飲料，可口可樂贏麻了

試圖傍上元宇宙的品牌千千萬，但像可口可樂玩得這么花的，屬實不多。01 可口可樂盯上元宇宙1886年，可口可樂誕生于美國喬治亞州亞特蘭大市，至今已擁有136年的悠久歷
現(xiàn)在的元宇宙：一款低配版的科幻游戲

在2021年的歲末之際，不禁感嘆元宇宙元年之熱鬧，從元宇宙NFT頭像，到元宇宙數(shù)字地產(chǎn)，再到元宇宙旅游景區(qū)等等，仿佛科幻感十足的元宇宙眨眼間就從人們的概念認知中完全
2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價值？

在剛剛結(jié)束不久的2021年江蘇衛(wèi)視跨年演唱會上，虛擬鄧麗君與歌手周深同臺聯(lián)唱，實現(xiàn)了跨時代合作，而這還不只是“鄧麗君”，嗶哩嗶哩、東方衛(wèi)視等多家跨年晚會都出現(xiàn)
星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

2月14日消息，新加坡星展銀行CEO Piyush Gupta在財報會議上表示，計劃于2022年年底前推出零售數(shù)字資產(chǎn)交易服務(wù)。據(jù)悉，DBS于2021年初開設(shè)了機構(gòu)數(shù)字資產(chǎn)交易平臺，全
Shiba Inu布局元宇宙走出Meme局限

以「狗狗幣殺手」成名的Shiba Inu（SHIB）在人們的印象中始終有著濃厚的Meme（模因惡搞）烙印，但它似乎一直在嘗試突破這種局限。建立起一個龐大的粉絲社區(qū)后，Shiba Inu

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區(qū)塊鏈

虛擬人

AR/VR

AI

元宇宙百科

MIT 研究揭示 AI 并無穩(wěn)定價值觀，“對齊”挑戰(zhàn)遠超預(yù)期

一份全面清單：Web3行業(yè)高薪酬的13種工作

人間誠實周鴻祎：360 All in 大模型的六個解讀

不同于傳統(tǒng)數(shù)字經(jīng)濟，元宇宙賦予商業(yè)生態(tài)更多數(shù)字資產(chǎn)價值！

元宇宙步入暗夜

搶先推出“元宇宙”飲料，可口可樂贏麻了

現(xiàn)在的元宇宙：一款低配版的科幻游戲

2022開年最熱投資賽道竟是虛擬人，背后隱藏了什么商業(yè)價值？

星展銀行(DBS)計劃推出零售數(shù)字資產(chǎn)交易服務(wù)

Shiba Inu布局元宇宙走出Meme局限

最新推薦

數(shù)字人的新革命，BAT的“沖高”戰(zhàn)場

挖來Meta AR高管，難道蘋果也要進軍元宇宙？

“啫喱”超越微信登頂：首款“元宇宙社交App”會曇花一現(xiàn)嗎？

NFT自動售貨機來啦！

為什么元宇宙將永遠改變體育和你的生活？

TX加入的NFT數(shù)字收藏品，元宇宙的破圈之路?

猜你喜歡

熱門推薦

相關(guān)資訊