12 月 8 日消息,據(jù) Meta 官方新聞稿,Meta 昨日推出一款名為 Purple Llama 的 AI 檢測(cè)套件,號(hào)稱(chēng)提供了一系列工具,可幫助開(kāi)發(fā)者檢測(cè)自家AI安全性,并“負(fù)責(zé)任地部署生成式AI 模型與應(yīng)用程序”。
獲悉,Purple Llama 套件目前提供“CyberSec Eval”評(píng)估工具、Llama Guard“輸入輸出安全分類(lèi)器”,Meta 聲稱(chēng),之后會(huì)有更多的工具加入這一套件。
Meta 介紹稱(chēng),Purple Llama 套件旨在規(guī)范自家 Llama 語(yǔ)言模型,也能夠作用于其它友商的 AI 模型,這一套件的名稱(chēng)由來(lái),是基于安全領(lǐng)域的“紫隊(duì)概念”。
Meta 聲稱(chēng),紫隊(duì)是“攻擊紅隊(duì)和防御藍(lán)隊(duì)”的結(jié)合,而 Purple Llama 套件的作用,就是在評(píng)估和緩解AI模型的潛在威脅,“兼顧攻擊和防御策略”。
具體而言,Purple Llama 套件目前能夠量化大模型在網(wǎng)絡(luò)安全風(fēng)險(xiǎn)的指標(biāo),評(píng)估可能存在的代碼漏洞,并為模型的安全性提供見(jiàn)解,此外還能檢查并過(guò)濾模型的輸入和輸出內(nèi)容,防止黑客“越獄”相關(guān)模型。
Meta 表示,未來(lái)該公司將持續(xù)檢測(cè)AI模型的安全性,除了持續(xù)完善 Purple Llama 套件外,Meta 還將與微軟、AMD、亞馬遜、谷歌、英特爾、英偉達(dá)等公司合作,計(jì)劃將 Purple Llama 評(píng)估套件整合進(jìn)行業(yè)模型評(píng)估基準(zhǔn)中。
本文鏈接:http://www.tebozhan.com/showinfo-45-2859-0.htmlMeta 推出 Purple Llama 檢測(cè)套件,可評(píng)估 AI 模型安全水準(zhǔn)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 馬斯克:Grok AI 測(cè)試版已向美國(guó)所有 X Premium + 訂閱者正式開(kāi)放
下一篇: Canalys:三星憑借設(shè)備端 Galaxy AI 獲得優(yōu)勢(shì),有望逃離“同質(zhì)陷阱”