AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

俄羅斯科技巨頭 Yandex 宣布開源“YaFSDP”大語言模型訓(xùn)練工具:大幅提升 GPU 利用率,對 Llama 3 可實現(xiàn) 26% 加速

來源: 責(zé)編: 時間:2024-06-14 08:44:21 161觀看
導(dǎo)讀 6 月 11 日消息,俄羅斯科技巨頭 Yandex 推出了一款開源的大語言模型訓(xùn)練工具 ——YaFSDP,號稱與現(xiàn)有工具相比速度最高可提升 26%。據(jù)介紹,YaFSDP 在訓(xùn)練速度方面優(yōu)于傳統(tǒng)的 FSDP 方法,尤其適用于大型模型。在預(yù)訓(xùn)

6 月 11 日消息,俄羅斯科技巨頭 Yandex 推出了一款開源的大語言模型訓(xùn)練工具 ——YaFSDP,號稱與現(xiàn)有工具相比速度最高可提升 26%。IPf28資訊網(wǎng)——每日最新資訊28at.com

IPf28資訊網(wǎng)——每日最新資訊28at.com

據(jù)介紹,YaFSDP 在訓(xùn)練速度方面優(yōu)于傳統(tǒng)的 FSDP 方法,尤其適用于大型模型。在預(yù)訓(xùn)練 LLM 方面,YaFSDP速度提高了 20%,并且在高內(nèi)存壓力條件下表現(xiàn)更佳。IPf28資訊網(wǎng)——每日最新資訊28at.com

例如,YaFSDP 對具有 700 億參數(shù)的 Llama 2 可以實現(xiàn) 21% 的效率提升,對具有同級參數(shù)的 Llama 3 也實現(xiàn) 了 26% 的效率提升。附官方數(shù)據(jù)一覽:IPf28資訊網(wǎng)——每日最新資訊28at.com

模型gpu-countseq-lennum-ckpt-layersspeedupLlama 2 7B64204809.92%Llama 2 7B64409603.43%Llama 2 7B64819202.68%Llama 2 7B128204809.57%Llama 2 7B128409602.42%Llama 2 7B128819202.32%Llama 2 13B1282048012.10%Llama 2 13B128409603.49%Llama 2 34B1282048020.70%Llama 2 34B2562048021.99%Llama 2 34B256409658.35%Llama 2 70B25620481021.48%Llama 2 70B2564096507.17%Llama 3 8B642048011.91%Llama 3 8B64409607.86%Llama 3 70B25620482026.60%

Yandex 表示,通過優(yōu)化 GPU 使用率,YaFSDP 可以為開發(fā)者和公司節(jié)省大量資金 —— 每月可能節(jié)省數(shù)十萬美元。IPf28資訊網(wǎng)——每日最新資訊28at.com

Yandex 的資深開發(fā)人員、YaFSDP 團隊成員之一 Mikhail Khruschev 還提到,“目前,我們正在積極嘗試各種模型架構(gòu)和參數(shù)大小,以擴展 YaFSDP 的通用性” 。IPf28資訊網(wǎng)——每日最新資訊28at.com

參考資料:IPf28資訊網(wǎng)——每日最新資訊28at.com

《Яндекс открывает YaFSDP — инструмент для ускорения обучения больших языковых моделей и сокращения расходов на GPU / Хабр》IPf28資訊網(wǎng)——每日最新資訊28at.com

《GitHub - yandex/YaFSDP: YaFSDP: Yet another Fully Sharded Data Parallel》IPf28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-4591-0.html俄羅斯科技巨頭 Yandex 宣布開源“YaFSDP”大語言模型訓(xùn)練工具:大幅提升 GPU 利用率,對 Llama 3 可實現(xiàn) 26% 加速

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 蘋果高管:正努力將“Apple Intelligence”引入中國市場

下一篇: Copilot Pro 訂閱魅力下降,微軟 7 月 10 日下線用戶自建 GPT 服務(wù)

標簽:
  • 熱門焦點
Top