當(dāng)前位置：首頁(yè) > 科技 > 數(shù)碼

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

來(lái)源：責(zé)編：時(shí)間：2025-02-10 08:20:15 56觀看

導(dǎo)讀快科技2月9日消息，DeepSeek火得一塌糊涂，國(guó)內(nèi)外的相關(guān)企業(yè)都在積極適配支持，而對(duì)于AI大模型來(lái)說(shuō)，使用GPU運(yùn)行無(wú)疑是高效的，比如AMD，無(wú)論是Instinct加速卡還是Radeon游戲卡，都已經(jīng)適配到位。你只需要任意一塊AMD RX

快科技2月9日消息，DeepSeek火得一塌糊涂，國(guó)內(nèi)外的相關(guān)企業(yè)都在積極適配支持，而對(duì)于AI大模型來(lái)說(shuō)，使用GPU運(yùn)行無(wú)疑是高效的，比如AMD，無(wú)論是Instinct加速卡還是Radeon游戲卡，都已經(jīng)適配到位。

你只需要任意一塊AMD RX 7000系列顯卡，就可以在本地體驗(yàn)DeepSeek。

AMD Radeon游戲卡本地部署DeepSeek非常簡(jiǎn)單，只需打開(kāi)AMD官網(wǎng)(中英文均可)，搜索“15.1.1”，進(jìn)入第一個(gè)結(jié)果，下載AMD Adrenalin 25.1.1測(cè)試版驅(qū)動(dòng)，安裝并重啟。

直接下載地址：

https://www.amd.com/zh-cn/resources/support-articles/release-notes/RN-RAD-WIN-25-1-1.html

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

然后打開(kāi)LM Studio官網(wǎng)網(wǎng)站的銳龍專(zhuān)欄(https://lmstudio.ai/ryzenai)，并下載LM Studio for Ryzen AI安裝包，安裝并運(yùn)行。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

啟動(dòng)之后，點(diǎn)擊右下角設(shè)置(可選中文語(yǔ)言)，找到并開(kāi)啟“Use LM Studio's Hugging Face”這個(gè)選項(xiàng)。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

回到主界面，在左側(cè)菜單欄點(diǎn)擊搜索圖標(biāo)，輸入“DeepSeek R1”，就可以看到已經(jīng)訓(xùn)練好的各種DeepSeek模型。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

至于如何選擇，可以參考如下的AMD官方推薦列表，比如旗艦級(jí)的RX 7900 XTX可以支持到32B參數(shù)，主流的RX 7600則僅支持8B模型。

順帶一提，新的中國(guó)特供版顯卡RX 7650 GRE也同樣支持本地部署DeepSeek，只待正式發(fā)布。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

然后下載合適的模型，在主界面上方選擇已下載的模型，然后調(diào)高“GPU Offload”的數(shù)值，不同選項(xiàng)的具體含義可自行搜索或者直接詢(xún)問(wèn)DeepSeek。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

模型加載完畢后，就可以盡情地在本地體驗(yàn)DeepSeek了。

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

與此同時(shí)，AMD Instinct GPU加速卡也已經(jīng)部署集成DeepSeek V3模型，并優(yōu)化了SGLang性能，支持完整的671B參數(shù)，開(kāi)發(fā)者可以借助AMD ROCm平臺(tái)快速、高效地開(kāi)發(fā)AI應(yīng)用。

1、啟動(dòng)Docker容器

docker run -it --ipc=host --cap-add=SYS_PTRACE --network=host /

--device=/dev/kfd --device=/dev/dri --security-opt seccomp=unconfined /

--group-add video --privileged -w /workspace lmsysorg/sglang:v0.4.2.post3-rocm630

2、開(kāi)始使用

(1)、使用CLI登陸進(jìn)入Hugging Face。

huggingface-cli login

(2)、啟動(dòng)SGLang Server，在本地部署DeepSeekV3 FP8模型。

python3 -m sglang.launch_server --model-path deepseek-ai/DeepSeek-V3 --port 30000 --tp 8 --trust-remote-code

(3)、服務(wù)器啟動(dòng)后，打開(kāi)新的終端，發(fā)送請(qǐng)求。

curl http://localhost:30000/generate /

-H "Content-Type: application/json" /

-d '{

"text": "Once upon a time,",

"sampling_params": {

"max_new_tokens": 16,

"temperature": 0

}

3、基準(zhǔn)測(cè)試

export HSA_NO_SCRATCH_RECLAIM=1

python3 -m sglang.bench_one_batch --batch-size 32 --input 128 --output 32 --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code

python3 -m sglang.launch_server --model deepseek-ai/DeepSeek-V3 --tp 8 --trust-remote-code

python3 benchmark/gsm8k/bench_sglang.py --num-questions 2000 --parallel 2000 --num-shots 8

Accuracy: 0.952

Invalid: 0.000

另外，如果需要BF16精度，可以自行轉(zhuǎn)換：

cd inference

python fp8_cast_bf16.py --input-fp8-hf-path /path/to/fp8_weights --output-bf16-hf-path /path/to/bf16_weights

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

本文鏈接：http://www.tebozhan.com/showinfo-24-129339-0.htmlAMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

聲明：本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： RTX 5090/5080黑屏變磚！NVIDIA終于啟動(dòng)調(diào)查

下一篇： GPU競(jìng)爭(zhēng)失衡 AMD股價(jià)重挫分析師：市場(chǎng)只認(rèn)NVIDIA！

標(biāo)簽：

熱門(mén)焦點(diǎn)

Mate60手機(jī)殼曝光致敬自己的經(jīng)典設(shè)計(jì)

8月3日消息，今天下午博主數(shù)碼閑聊站帶來(lái)了華為Mate60的第三方手機(jī)殼圖，可以讓我們?cè)谡鏅C(jī)發(fā)布之前看看這款華為全新旗艦的大致輪廓。從曝光的圖片看，Mate 60背后攝像頭面積依然
Rust中的高吞吐量流處理

作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優(yōu)化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫(kù)，還使用這些庫(kù)實(shí)現(xiàn)了一個(gè)流處理程序
分享六款相見(jiàn)恨晚的PPT模版網(wǎng)站, 祝你做出精美的PPT!

1、OfficePLUSOfficePLUS網(wǎng)站旨在為全球Office用戶(hù)提供豐富的高品質(zhì)原創(chuàng)PPT模板、實(shí)用文檔、數(shù)據(jù)圖表及個(gè)性化定制服務(wù)。優(yōu)點(diǎn)：OfficePLUS是微軟官方網(wǎng)站，囊括PPT模板、Word模
Flowable工作流引擎的科普與實(shí)踐

一.引言當(dāng)我們?cè)谌粘９ぷ骱蜆I(yè)務(wù)中需要進(jìn)行各種審批流程時(shí)，可能會(huì)面臨一系列技術(shù)和業(yè)務(wù)上的挑戰(zhàn)。手動(dòng)處理這些審批流程可能會(huì)導(dǎo)致開(kāi)發(fā)成本的增加以及業(yè)務(wù)復(fù)雜度的上升。在這
虛擬鍵盤(pán) API 的妙用

你是否在遇到過(guò)這樣的問(wèn)題：移動(dòng)設(shè)備上有一個(gè)固定元素，當(dāng)激活虛擬鍵盤(pán)時(shí)，該元素被隱藏在了鍵盤(pán)下方？多年來(lái)，這一直是 Web 上的默認(rèn)行為，在本文中，我們將探討這個(gè)問(wèn)題、為什么會(huì)發(fā)生
新電商三兄弟，“抖快紅”成團(tuán)！

來(lái)源：價(jià)值研究所作者：Hernanderz 隨著內(nèi)容電商的概念興起，抖音、快手、小紅書(shū)組成的“新電商三兄弟”成為業(yè)內(nèi)一股不可忽視的勢(shì)力，給阿里、京東、拼多多帶去了巨大壓
一條抖音4億人圍觀 ! 這家MCN比無(wú)憂(yōu)傳媒還野

作者：Hiu 來(lái)源：互聯(lián)網(wǎng)品牌官01 擦邊少女空降熱搜，幕后推手曝光被網(wǎng)友譽(yù)為“純欲天花板”的女網(wǎng)紅井川里予，近期因?yàn)橐唤M哥特風(fēng)照片登上熱搜，引發(fā)了一場(chǎng)互聯(lián)網(wǎng)世界關(guān)于
華為和江淮汽車(chē)合作開(kāi)發(fā)百萬(wàn)元問(wèn)界MPV？雙方回應(yīng)來(lái)了

8月1日消息，郭明錤今天在社交平臺(tái)發(fā)文稱(chēng)，華為正在和江淮汽車(chē)合作，開(kāi)發(fā)售價(jià)在100萬(wàn)元的問(wèn)界MPV，預(yù)計(jì)在2024年第2季度量產(chǎn)，銷(xiāo)量目標(biāo)為上市首年交付5萬(wàn)輛。
“買(mǎi)真退假” 這種“羊毛”不能薅

□ 法治日?qǐng)?bào) 記者王春　　□ 本報(bào)通訊員胡佳麗　　2020年初，還在上大學(xué)的小東加入了一個(gè)大學(xué)生兼職QQ群。群主“七王”在群里介紹一些刷單賺

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

AMD顯卡可以本地玩DeepSeek了！附簡(jiǎn)單部署教程

Mate60手機(jī)殼曝光致敬自己的經(jīng)典設(shè)計(jì)

Rust中的高吞吐量流處理

分享六款相見(jiàn)恨晚的PPT模版網(wǎng)站, 祝你做出精美的PPT!

Flowable工作流引擎的科普與實(shí)踐

虛擬鍵盤(pán) API 的妙用

新電商三兄弟，“抖快紅”成團(tuán)！

一條抖音4億人圍觀 ! 這家MCN比無(wú)憂(yōu)傳媒還野

華為和江淮汽車(chē)合作開(kāi)發(fā)百萬(wàn)元問(wèn)界MPV？雙方回應(yīng)來(lái)了

“買(mǎi)真退假” 這種“羊毛”不能薅

最新推薦

猜你喜歡

熱門(mén)推薦

相關(guān)資訊