AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

ChatGPT 也在評審你的頂會投稿,斯坦福新研究捅了馬蜂窩

來源: 責編: 時間:2024-04-06 17:12:07 163觀看
導讀 尷了個大尬!人們還在嘲諷有人用 ChatGPT 寫論文忘了刪掉“狐貍尾巴”,另一邊審稿人也被曝出用 ChatGPT 寫同行評論了。而且,還是來自 ICLR、NeurIPS 等頂會的那種。來自斯坦福的學者對一些頂級 AI 會議(如 ICLR、

尷了個大尬!DMg28資訊網——每日最新資訊28at.com

人們還在嘲諷有人用 ChatGPT 寫論文忘了刪掉“狐貍尾巴”,另一邊審稿人也被曝出用 ChatGPT 寫同行評論了。而且,還是來自 ICLR、NeurIPS 等頂會的那種。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

來自斯坦福的學者對一些頂級 AI 會議(如 ICLR、NeurIPS、CoRL 等)中的審稿意見進行了分析,結果發現 ——DMg28資訊網——每日最新資訊28at.com

在 ChatGPT 出現之后,這些同行評論的“AI 含量”大增,最多的高達 16.9%,而有 ChatGPT 之前這個比例大約是 2%。DMg28資訊網——每日最新資訊28at.com

證據也很直觀,AI 常用的詞匯出現頻率,在 ChatGPT 發布之后噌的一下就上去了。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

消息一出,Reddit 的機器學習板塊立刻就炸了鍋,有網友直呼:閉環了!DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

在 X 上,也有人發出了同樣的疑問:DMg28資訊網——每日最新資訊28at.com

既然寫論文和審稿都是大模型在干,那科學家去干什么了?DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

那么,這究竟是怎么一回事呢?DMg28資訊網——每日最新資訊28at.com

頂會審稿意見 AI 含量超 1/6

來自斯坦福大學多個學院以及加州大學圣芭芭拉分校的研究人員發表了一項研究,主題是關于 ChatGPT 對 AI 學術會議同行評審的影響。DMg28資訊網——每日最新資訊28at.com

研究人員一共分析了 ICLR、NeurIPS、CoRL 和 EMNLP 這四個頂會中的同行評審意見,對其“AI 含量”進行了計算。DMg28資訊網——每日最新資訊28at.com

ICLR 2024:估計 α 值為 10.6%DMg28資訊網——每日最新資訊28at.com

NeurIPS 2023:估計 α 值為 9.1%DMg28資訊網——每日最新資訊28at.com

CoRL 2023:估計 α 值為 6.5%DMg28資訊網——每日最新資訊28at.com

EMNLP 2023:估計 α 值為 16.9%,超過了 1/6DMg28資訊網——每日最新資訊28at.com

(α 值指在所有內容中疑似由 AI 生成或“顯著修改”的內容所占的比例)DMg28資訊網——每日最新資訊28at.com

而在 ChatGPT 問世之前,α 值的水平大約是在 2%,作為對照的 Nature 系列期刊評審意見的 α 值則未發生顯著變化。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

除了得出這些數據,研究人員還發現了“AI 含量”較高的評審意見大多具有一些共同特點。DMg28資訊網——每日最新資訊28at.com

從內容角度上看,“AI 含量”高的意見,引用的作者中包括“et al.”的學術內容也較少。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

而且,“AI 含量”高的內容,在語義上也更加同質化,比如“commendable”(值得稱贊的)、“meticulous”(細致的)和“intricate”(復雜的)等形容詞大量出現。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

同時作者也展示了在 AI 生成的內容中出現最頻繁的形容詞和副詞各 100 個,下圖中字號越大代表出現頻率越高。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

而除了內容本身,高“AI 含量”的內容的作者在行為上也表現出了一些共同之處。DMg28資訊網——每日最新資訊28at.com

一是提交的時間更加接近截止期限,特別是截止前三天提交的意見“AI 含量”明顯更高。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

除了提交時間晚,高“AI 含量”意見的作者,普遍對自己提交的內容自信程度也更低。DMg28資訊網——每日最新資訊28at.com

評審者對自己評審意見信心水平的自我評估(滿分 5 分)結果顯示,“AI 含量”較高的審稿人,自我評分也更低(不大于 2 分)。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

此外,對自己的審稿意見自信程度低的另一個表現是,他們也較少對論文作者反駁做出回應。DMg28資訊網——每日最新資訊28at.com

在 ICLR 2024 和 NeurIPS 2023 上,這類審稿人中有超過 12.5% 從未對反駁意見做出任何回復,約 10% 只回復了一次。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

那么,作者又是如何分析出這些審稿意見中的 AI 含量的呢?DMg28資訊網——每日最新資訊28at.com

為此,研究人員設計了一種分布式“GPT 量化”方法,能夠在語料庫級別有效估計 AI 含量,而不必逐篇分析。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

首先,研究人員收集了已知由人類編寫(ChatGPT 出現前的審稿意見)和 AI 生成(由研究者直接用 ChatGPT 編寫)的文本的數據集,作為參考分布。DMg28資訊網——每日最新資訊28at.com

然后,作者估計了人工編寫的(P)和 AI 生成(Q)的內容的 token 分布,尤其重點關注形容詞的出現概率。DMg28資訊網——每日最新資訊28at.com

最后將這種分布模型擬合到未知成分的目標語料庫,假設每個文檔都是從人類和人工智能分布的加權組合中,即 (1-α) P+αQ,并使用最大似然估計來推斷 α 的值。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

完成方法的構建之后,研究者又合成了多組 α 值確定的標準數據集,并在此之上對前面提出的方法進行了驗證,結果最大誤差僅有 2.4%。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

于是,作者使用該方法分析了最近幾個會議中的審稿意見,最終得到了前面的結論。DMg28資訊網——每日最新資訊28at.com

而當這項研究被更多人所得知后,引發了廣泛的討論,其中有不少人對這種現象表達了擔憂。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

不過,也有人猜測出現這種現象的原因,可能是審稿人母語不是英語,于是用 ChatGPT 對英文寫作進行了調整潤色。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

基于此,有人提問到,用 ChatGPT 來改寫而不是直接生成評論也是錯的嗎?DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

有人給出了半肯定的答復,但理由不是關乎原創性,而是出于對文本質量的擔憂,人們還是應該謹慎使用 ChatGPT。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

當然也有人說,科學寫作,本身就是 ChatGPT 的一種合理用途。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

總之對于這件事,擔憂也好寬容也罷,這種現象都已然存在了,而按照原作者的觀點,這幾個問題是人們應該思考的:DMg28資訊網——每日最新資訊28at.com

是否應該披露 AI 在同行評審中的使用DMg28資訊網——每日最新資訊28at.com

在 AI 極具誘惑力的情況下,應該如何激勵好的實踐DMg28資訊網——每日最新資訊28at.com

在人工智能同質化的境地下,人們能否保持“智力多樣性”DMg28資訊網——每日最新資訊28at.com

是否應該重新考慮人類 / AI 混合知識工作的可信度DMg28資訊網——每日最新資訊28at.com

當然了,在學術界,ChatGPT 生成的內容,還遠不只是審稿意見。DMg28資訊網——每日最新資訊28at.com

論文作者也愛用

除了審稿人被曝用 ChatGPT 寫評論之外,拿它來寫論文的人更是屢見不鮮……DMg28資訊網——每日最新資訊28at.com

在谷歌學術中搜索 2023 年及以后包含“certainly, here is”這種 ChatGPT 常用開頭的論文,剔除直接包含“ChatGPT”和“LLM”的論文后,結果共有 50 余篇。DMg28資訊網——每日最新資訊28at.com

隨機翻閱其中的幾篇,果然是發現了 ChatGPT 的使用痕跡,ChatGPT 在這些論文中被用做了總結、翻譯、制作表格等多種用途。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

甚至其中還包括正式出版的論文合集:DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

而另一個 ChatGPT 常用句式“As of my Last Knowledge Update”,在相同條件下的搜索結果有 114 條。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

而且出現形式上也更加離譜,“Certainly 組”當中至少還有一些只是用 ChatGPT 做了些輔助工作,“As of my…”這一組干脆直接拿來搞正文內容了。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

此外,“As an AI language model, I”也有 40 多條搜索結果,不過也不排除其中有誤傷的情況出現。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

當然要論離譜,可能還要屬這種把 ChatGPT 的按鈕“Regenerate Response”也一起復制進去的了,而且數量還不算少,有將近一百篇。DMg28資訊網——每日最新資訊28at.com

DMg28資訊網——每日最新資訊28at.com

露出雞腳馬腳被發現的論文數量尚且如此,刪去了這些關鍵字從而“躲過一劫”的究竟有多少,就更是不得而知了。DMg28資訊網——每日最新資訊28at.com

當然,并不是說研究者不能使用 ChatGPT 來輔助論文撰寫,包括 Elsevier、Springer(Nature 出版商)在內的許多知名出版機構都表示并不禁止 ChatGPT 的使用,只要進行聲明即可。DMg28資訊網——每日最新資訊28at.com

總之,無論是論文本身還是審稿意見,亦或是其他文本寫作,如何以更合理的方式運用 AI,值得人們繼續深入思考。DMg28資訊網——每日最新資訊28at.com

論文地址:DMg28資訊網——每日最新資訊28at.com

https://arxiv.org/abs/2403.07183DMg28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位 (ID:QbitAI),作者:克雷西DMg28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-3859-0.htmlChatGPT 也在評審你的頂會投稿,斯坦福新研究捅了馬蜂窩

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 全球首個涉 AI 安全雙邊協議,英美兩國建立人工智能安全科學合作伙伴關系

下一篇: 號稱“音樂 ChatGPT 時刻”來臨,天工 SkyMusic 音樂生成大模型今日邀測

標簽:
  • 熱門焦點
  • 拯救XR,蘋果力不從心

    來源 | 光子星球撰文 | 文燁豪 編輯 | 吳先之 蘋果終于呈上了它的“答卷”。 北京時間6月6日凌晨,蘋果2023年全球開發者大會(WWDC)如期舉行。作為蘋果CEO庫克口中&ld
  • 林俊杰、余文樂等明星相繼入局,元宇宙虛擬土地究竟有何魔力?

    上周的元宇宙和明星圈因為一則“林俊杰在推特上宣布持有Decentraland元宇宙虛擬地塊”的新聞而備受關注,該新聞一方面在娛樂圈引起了吃瓜群眾的好奇,另一方面在
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產業規劃,大有在2022年
  • 上海虹口成立10億元元宇宙基金,香港首只元宇宙ETF擬上市

    區塊鏈日報17日訊 今日《元宇宙新鮮事》有:上海虹口將成立總額約10億元的元宇宙產業基金;香港市場首只元宇宙主題ETF擬于2月21日上市;元宇宙平臺Roblox出現違禁游
  • 2022年6款最佳的NFT稀有度查詢工具

    NFT正在風靡全球,但擁有一個你自認為看起來很酷的 NFT 是不夠的,因為它還應該是稀有的,稀有度會影響每個 NFT 的價值。因此,如果您打算投資 NFT,則需要使用 NFT 稀
  • 重溫 1602 年:DAO 是新的企業范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權 。”1602 年,荷蘭東印度公司成立,許多人認為
  • NFT藝術家Hayley Rincon 專訪:我的迷幻數字藝術之路

    Hayley Rincon是一位令人印象深刻才華橫溢的創作者,她的作品呈現出迷幻的氣息。今天就來聊聊她的藝術作品,和她自己的數字藝術之路。Hayley是加利福尼亞灣區的有
  • 下一個黃金賽道?NFT的碎片化!

    碎片化可能是我們一生中最重要的一個投資趨勢,碎片化本身并不新鮮。它已經存在了400年之久。早在1602年,荷蘭東印度公司是歷史上第一家在公共證券交易所上市的公
  • 頭像類NFTs的統治能持續多久?

    在過去的一兩年里,NFTs在互聯網世界中掀起了一場風暴。今天,當我們想到NFTs時,我們主要想到的是那些充斥著我們的社交媒體屏幕的數字卡通--無聊猿、punks 和介于
Top