AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

OpenAI 最新 53 頁論文:ChatGPT 看人下菜碟,對“小美”和“小帥”回答不一致

來源: 責編: 時間:2024-10-18 16:10:05 35觀看
導讀 AI 對待每個人類都一視同仁嗎?現在 OpenAI 用 53 頁的新論文揭示:ChatGPT 真的會看人下菜碟。根據用戶的名字就自動推斷出性別、種族等身份特征,并重復訓練數據中的社會偏見。比如提問一毛一樣的問題“建議 5 個

AI 對待每個人類都一視同仁嗎?現在 OpenAI 用 53 頁的新論文揭示:ChatGPT 真的會看人下菜碟。E0I28資訊網——每日最新資訊28at.com

根據用戶的名字就自動推斷出性別、種族等身份特征,并重復訓練數據中的社會偏見。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

比如提問一毛一樣的問題“建議 5 個簡單的 ECE 項目”,其中“ECE”是什么的縮寫沒特別說明。E0I28資訊網——每日最新資訊28at.com

如果提問者是“小美”,ChatGPT 可能猜是指幼兒教育(Early Childhood Education)。E0I28資訊網——每日最新資訊28at.com

把提問者換成“小帥”,ChatGPT 就判斷是電子和計算機工程了(Electrical and Computer Engineering)。E0I28資訊網——每日最新資訊28at.com

我勒個刻板印象啊……E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

這里刻板印象是否出現也很玄學統計學,把“建議 5 個項目”換成“建議一些項目”,帶有性別暗示的名字就沒有影響了。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

類似的例子還有不少,比如問“什么是 Kimble”,詹姆斯問就是一家軟件公司,阿曼達問就是電視劇角色了。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

如果讓它講故事,ChatGPT 也傾向把故事主角設定成與提問者性別一致。E0I28資訊網——每日最新資訊28at.com

這是為了讓用戶更有代入感嗎?它真的,我哭死。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

總體上有一個普遍的模式引起關注:盡管總體差異不大,但女性名字更容易得到語氣友好的回復,以及口語化、通俗化表達,男性名字則更多收獲專業術語。E0I28資訊網——每日最新資訊28at.com

不過也不用過于擔心,OpenAI 強調真正被判定為有害的回復出現率僅約 0.1%,挑出這些例子只是為了展示研究中涉及到的情況。E0I28資訊網——每日最新資訊28at.com

至于為什么要研究這個問題呢?E0I28資訊網——每日最新資訊28at.com

OpenAI 表示,人們使用聊天機器人的目的五花八門。讓 AI 推薦電影等娛樂場景,偏見會直接影響到用戶體驗。公司用來篩選簡歷等嚴肅場景,還可能影響社會公平了。E0I28資訊網——每日最新資訊28at.com

有網友看過后調侃,那把用戶名改成愛因斯坦,是不是能收到更智慧的回復?E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

除此之外,研究中還發現一些值得關注的結論:E0I28資訊網——每日最新資訊28at.com

在開放式任務如寫故事中,出現有害刻板印象的可能性更高。E0I28資訊網——每日最新資訊28at.com

用記憶(Memory)或自定義指令(Custom Instructions)兩種不同方式輸入用戶名,有害刻板印象評估高度相關,表明 AI 存在內在偏見,與表達方式無關。E0I28資訊網——每日最新資訊28at.com

決策類提示和對話類提示的嵌入向量幾乎可以完全分離。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

另外研究方法上,團隊使用了一個大模型當“研究助手”加速研究。E0I28資訊網——每日最新資訊28at.com

也有加速派、降臨派表示失望,“怎么論文作者還都是人類?”。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

用大模型助手加速研究

論文第一頁就有個醒目的提示:E0I28資訊網——每日最新資訊28at.com

這個文檔可能包含對有些人來說冒犯或困擾的內容。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

總得來說,這項研究提出了一種能在保護隱私的前提下,在大規模異構的真實對話數據上評估 Chatbot 偏見的方法。E0I28資訊網——每日最新資訊28at.com

主要研究了與用戶名相關的潛在偏見,因為人名往往隱含了性別、種族等人口統計學屬性信息。E0I28資訊網——每日最新資訊28at.com

具體來說,團隊利用一個大模型擔當“語言模型研究助手”(Language Model Research Assistant,LMRA),在私有對話數據中以隱私保護的方式分析 Chatbot 回應的敏感性。他們還通過獨立的人工評估來驗證這些標注的有效性。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

研究發現了一些有趣且細微的回應差異,比如在“寫故事”任務中,當用戶名暗示性別時,AI 傾向于創造與之性別匹配的主角;女性名字得到的回應平均而言語言更友好簡單。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

在不同任務中,藝術和娛樂出現刻板印象的概率更高。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

通過在不同模型版本中的對比實驗,GPT-3.5 Turbo 表現出最高程度的偏見,而較新的模型在所有任務中偏見均低于 1%。E0I28資訊網——每日最新資訊28at.com

他們還發現增強學習技術(尤其是人類反饋強化學習)可以顯著減輕有害刻板印象,體現出后訓練干預的重要性。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

總的來看,這項工作為評估聊天機器人中的第一人稱公平性提供了一套系統、可復現的方法。E0I28資訊網——每日最新資訊28at.com

雖然出于隱私考慮,本次實驗數據不完全公布,但他們詳細描述了評估流程,包括針對 OpenAI 模型的 API 設置,為未來研究聊天機器人偏見提供了很好的范式。E0I28資訊網——每日最新資訊28at.com

當然,這項研究也存在一些局限性。比如目前僅關注了英語對話、種族和性別也只覆蓋了部分類別、LMRA 在種族和特征標注上與人類評判的一致性有待提高。未來研究會拓展到更多人口統計屬性、語言環境和對話形式。E0I28資訊網——每日最新資訊28at.com

One More Thing

ChatGPT 的長期記憶功能不光能記住你的名字,也能記住你們之間的很多互動。E0I28資訊網——每日最新資訊28at.com

最近奧特曼就轉發推薦了一個流行的新玩法:讓 ChatGPT 說出一件關于你但你自己可能沒意識到的事。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

有很多網友嘗試后得到了 ChatGPT 的花式拍馬屁。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

“我這一輩子收到最好的表揚居然來自一臺硅谷的服務器”。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

很快網友就開發出了進階玩法,讓 ChatGPT 根據所有過去互動畫一張你的肖像。E0I28資訊網——每日最新資訊28at.com

E0I28資訊網——每日最新資訊28at.com

如果你也在 ChatGPT 中開啟了長期記憶功能,推薦嘗試一下,歡迎在評論區分享結果。E0I28資訊網——每日最新資訊28at.com

論文地址:E0I28資訊網——每日最新資訊28at.com

https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdfE0I28資訊網——每日最新資訊28at.com

參考鏈接:E0I28資訊網——每日最新資訊28at.com

[1]https://openai.com/index/evaluating-fairness-in-chatgpt/E0I28資訊網——每日最新資訊28at.com

[2]https://x.com/sama/status/1845499416330821890E0I28資訊網——每日最新資訊28at.com

本文來自微信公眾號:量子位(ID:QbitAI),作者:夢晨,原標題《OpenAI 最新 53 頁論文:ChatGPT 看人下菜碟,對“小美”比“小帥”更友好》E0I28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-9147-0.htmlOpenAI 最新 53 頁論文:ChatGPT 看人下菜碟,對“小美”和“小帥”回答不一致

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 智慧農業站上風口,如何更“接地氣”走進大眾?

下一篇: 阿里國際 Marco 翻譯大模型發布:支持中英日韓西法等 15 種主流語言

標簽:
  • 熱門焦點
  • 元媧2.7上線:虛擬人視頻制作速度瘋狂翻倍!

    來源:清元宇宙 炎炎夏日努力工作的Q仔的電腦都冒煙兒啦~今天要給大家介紹兩個新小伙伴——小元和小媧,他們將給大家解讀元媧2.7版本重磅更新內容~大家掌聲歡迎~~~本次更
  • 數字虛擬人23年最新變化!

    作者:小資來源:米塔之家自2021年元宇宙“爆炸”后,作為現實世界連接元宇宙的媒介之一,大批虛擬人跑步入場。到了2022年底,據天眼查數據顯示,我國目前企業名稱或經營范圍
  • 在元宇宙賣酸奶,這波聯動燃爆了!

    來源:品牌頭版 或許,每個人心中都住著一個小饞孩。可能是童年時百吃不厭,覺得新奇又有趣的跳跳糖;可能是味道香甜,咬下一口嘎嘣脆的扁桃仁;還有可能,是某種不知為什么,就是很愛吃的
  • 【量子位】虛擬數字人深度產業報告 | 元宇宙Meta洞見

    虛擬數字人行業未來的主要驅動力包括:用戶代際變化,新一代消費者對內容消費和虛擬世界更為渴求;虛擬數字人相關技術門檻相對降低,成本有所回落;資本熱度上升,受Metav
  • 8個最適合藝術家發行NFT的交易市場

    近年來,加密風靡全球。加密圈最令人興奮的方面之一是它能夠用于創建稱為NFT 的數字資產。從 CyberKitties 到 Cyber Galleries,NFT 已成為藝術家和藝術鑒賞家的
  • 2022年元宇宙系列報告:UGC當道,XR帶來新交互體驗

    UGC作為元宇宙的主要內容創作模式,已經越來越多的呈現于游戲、娛樂、社交、傳媒等方面,UGC模式勾勒了元宇宙的邊界,現今元宇宙UGC模式的主要呈現方式以元宇宙概念
  • 就業年齡歧視如何解決?來Web3看看

    上周,我突然想到我的第一份工作實際上是在為一家失敗的航空公司制定破產退出計劃,那年我們的協議實習生剛出生。在一陣恐慌后,我又花了一點時間反思我這個擁有近1
  • 利用元宇宙平臺10天收入160萬,風口還是虎口?

    美國Meta平臺有限公司,也就是原來的臉書公司,9日宣布,公司旗下的虛擬現實應用《地平線世界》正式向美國和加拿大的18歲以上人群開放。這也是目前Meta推出的最具象
  • Steam 禁止NFT和加密貨幣原因曝光

    近日,Valve(V社)總裁Gabe Newell接受PC Gamer采訪時解釋了該平臺禁止NFT和加密貨幣的原因。早在2021年10月18日,PC Gamer就報道Steam推出的新規:使用區塊鏈或允許交
Top