11月15日消息,AI 大模型創(chuàng)業(yè)公司“零一萬物”正式公開回應(yīng)了其Yi大模型涉嫌抄襲LLaMA事件,稱做法確實不妥,將會按照外界建議修改爭議張量(Tensor)名。
零一萬物由創(chuàng)新工場董事長兼CEO李開復(fù)于今年創(chuàng)辦,并在本月初宣布推出Yi-34B和Yi-6B兩個開源大模型,號稱對學(xué)術(shù)研究完全開放,同步開放免費商用申請。
然而在不久前,開發(fā)者ehartford在Yi-34B的Hugging Face開源主頁上表示,稱該模型使用了Meta LLaMA的架構(gòu),只對兩個張量名稱進(jìn)行了修改,分別為input_layernorm和post_attention_layernorm。
同時ehartford還表示,其希望該公司在模型被大量使用之前考慮重命名張量以符合LLaMA架構(gòu),并將這一更改應(yīng)用到官方模型中。
零一萬物開源團(tuán)隊總監(jiān)Richard Lin昨天承認(rèn),修改Llama張量名的做法不妥,將會按照外界建議把“修改后的張量名稱從Yi改回LLaMA”。
Richard Lin表示,出現(xiàn)這一問題主要是由于開發(fā)人員疏忽導(dǎo)致,開發(fā)人員為了滿足測試要求,在代碼中進(jìn)行了幾次重命名,但是后面忘記將張量名稱修改回LLaMA了。
不過另一名開發(fā)者JosephusCheung則表示,既然官方已經(jīng)宣布修改Yi大模型張量名稱,那么Yi便是LLaMA的衍生作品,因為其推理部分和模型定義都是“LLaMA”的一部分。
目前Richard Lin暫未對此進(jìn)行回復(fù)。
本文鏈接:http://www.tebozhan.com/showinfo-25-25989-0.html李開復(fù)旗下“零一萬物”回應(yīng)大模型被指抄襲:做法確實不妥 將修改爭議張量名
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com