12 月 21 日消息,據彭博社報道,斯坦福大學近日針對開源模型訓練數據集 LAION-5B 展開研究,發現該數據集中存在 3000 項“可疑的兒童性虐待內容”,之后 LAION 項目維護人員緊急下架了 LAION-5B,并聲稱已經移除了 1008 項“確鑿的相關內容”。
外媒表示,LAION-5B 訓練集總共擁有 58.5 億項圖片信息,Stability AI 曾利用 LAION 數據集來訓練自家 AI 模型,從而為用戶提供“文生圖服務”。
不過注意到,Stability AI 迅速向外媒回應,“Stable Diffusion 模型雖然使用 LAION-5B 進行訓練,但采用的是‘經過篩選及微調過的’訓練集版本,因此‘并不會影響模型輸出結果’”。
斯坦福大學聲稱,從 LAION-5B 事件可以看出業界“應當還有大量數據集存在有相關不當內容”,研究人員呼吁模型訓練方應當謹慎甄選“必要的訓練數據集”
本文鏈接:http://www.tebozhan.com/showinfo-45-3062-0.html開源訓練集 LAION-5B 遭曝內含“兒童性虐待內容”,Stable AI“緊急撇清關系”
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com