當前位置：首頁 > 科技 > 數碼

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

來源：責編：時間：2024-10-01 17:06:37 130觀看

導讀快科技10月1日消息，AMD發布了自己的首個小語言模型(SLM)，名為“AMD-135M”。相比于越來越龐大的大語言模型(LLM)，它體積小巧，更加靈活，更有針對性，非常適合私密性、專業性很強的企業部署。AMD-135小模

快科技10月1日消息，AMD發布了自己的首個小語言模型(SLM)，名為“AMD-135M”。

相比于越來越龐大的大語言模型(LLM)，它體積小巧，更加靈活，更有針對性，非常適合私密性、專業性很強的企業部署。

AMD-135小模型隸屬于Llama家族，有兩個版本：

一是基礎型“AMD-Llama-135M”，擁有多達6700億個token，在八塊Instinct MIM250 64GB加速器上訓練了六天。

二是延伸型“AMD-Llama-135M-code”，額外增加了專門針對編程的200億個token，同樣硬件訓練了四天。

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍創建與部署流程

它使用了一種名為“推測解碼”(speculative decoding)的方法，通過較小的草稿模型，在單次前向傳播中生成多個候選token，然后發送給更大的、更精確的目標模型，進行驗證或糾正。

這種方法可以同時生成多個token，不會影響性能，還可以降低內存占用，但因為數據交易更多，功耗也會增加。

AMD還使用AMD-Llama-135M-code作為CodeLlama-7b的草案模型，測試了推測解碼使用與否的性能。

比如在MI250加速器上，性能可提升多約2.8倍，銳龍AI CPU上可提升多約3.88倍，銳龍AI NPU上可提升多約2.98倍。

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍推測解碼

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

AMD-135M小模型的訓練代碼、數據集等資源都已經開源，遵循Apache 2.0。

按照AMD的說法，它的性能與其他開源小模型基本相當或略有領先，比如Hellaswag、SciQ、ARC-Easy等任務超過Llama-68M、LLama-160M，Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任務則基本類似GTP2-124MN、OPT-125M。

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

本文鏈接：http://www.tebozhan.com/showinfo-24-117135-0.htmlAMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：銳龍7 9800X3D緩存不變還是104MB：頻率大漲！

下一篇： AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

標簽：

熱門焦點

7月安卓手機性價比榜：努比亞+紅魔兩款新機入榜

7月登場的新機有努比亞Z50S Pro和紅魔8S Pro，除了三星之外目前唯二的兩款搭載超頻版驍龍8Gen2處理器的產品，而且努比亞和紅魔也一貫有著不錯的性價比，所以在本次的性價比榜單
十個可以手動編寫的 JavaScript 數組 API

JavaScript 中有很多API，使用得當，會很方便，省力不少。你知道它的原理嗎? 今天這篇文章，我們將對它們進行一次小總結?，F在開始吧。1.forEach()forEach()用于遍歷數組接收一參
在線圖片編輯器，支持PSD解析、AI摳圖等

自從我上次分享一個人開發仿造稿定設計的圖片編輯器到現在，不知不覺已過去一年時間了，期間我經歷了裁員失業、面試找工作碰壁，寒冬下一直沒有很好地履行計劃.....這些就放在日
本地生活這塊肥肉，拼多多也想吃一口

出品/壹覽商業作者/李彥編輯/木魚拼多多也看上本地生活這塊蛋糕了。近期，拼多多在App首頁“充值中心”入口上線了本機生活界面。壹覽商業發現，該界面目前主要
華為發布HarmonyOS 4：更好玩、更流暢、更安全

在8月4日的華為開發者大會2023（HDC.Together）大會上，HarmonyOS 4正式發布。自2019年發布以來，HarmonyOS一直以用戶為中心，經歷四年多的發展HarmonyOS已
Android 14發布：首批適配機型公布

5月11日消息，谷歌在今天凌晨舉行了I/O大會，本次發布會谷歌帶來了自家的AI語言模型PaLM 2、谷歌Pixel Fold折疊屏、谷歌Pixel 7a手機，同時發布了Androi
聯想小新Pad Pro 12.6將要推出，搭載高通驍龍 870 處理器

聯想小新Pad Pro 12.6將于秋季新品會上推出，官方按照慣例直接在發布會前給出了機型的所有參數。聯想小新 Pad Pro 12.6 將搭載高通驍龍 870 處理器，重量為 5
外交部：美方應停止在網絡安全問題上不負責任地指責他國

　中國外交部今天（16日）舉行例行記者會。會上，有記者問，美國情報官員稱，他們正在阻攔來自中國以及其他國家的黑客獲取相關科研成果。中方對此有何評論？對此
利用職權私自解除被封帳號 Meta開除20多名員工

11月18日消息，據外媒援引知情人士表示，過去一年時間內，Facebook母公司Meta解雇或處罰了20多名員工以及合同工，指控這些人通過內部系統以不當方式重置用戶帳號，其

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

7月安卓手機性價比榜：努比亞+紅魔兩款新機入榜

十個可以手動編寫的 JavaScript 數組 API

在線圖片編輯器，支持PSD解析、AI摳圖等

本地生活這塊肥肉，拼多多也想吃一口

華為發布HarmonyOS 4：更好玩、更流暢、更安全

Android 14發布：首批適配機型公布

聯想小新Pad Pro 12.6將要推出，搭載高通驍龍 870 處理器

外交部：美方應停止在網絡安全問題上不負責任地指責他國

利用職權私自解除被封帳號 Meta開除20多名員工

最新推薦

猜你喜歡

熱門推薦

相關資訊

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍

最新推薦

猜你喜歡

熱門推薦

相關資訊

AMD發布首個AI小語言模型：6900億token、推測解碼提速3.88倍