當(dāng)前位置：首頁 > 科技 > 手機(jī)

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達(dá)40 tokens/s

來源：責(zé)編：時(shí)間：2025-02-15 15:50:16 48觀看

導(dǎo)讀快科技2月14日消息，安謀科技宣布，搭載新一代“周易”NPU處理器的硬件平臺(tái)，已經(jīng)成功在端側(cè)部署并運(yùn)行DeepSeek-R1系列模型，而且性能卓越、成本優(yōu)異。新款“周易”NPU采用專為AI大模型特性優(yōu)

快科技2月14日消息，安謀科技宣布，搭載新一代“周易”NPU處理器的硬件平臺(tái)，已經(jīng)成功在端側(cè)部署并運(yùn)行DeepSeek-R1系列模型，而且性能卓越、成本優(yōu)異。

新款“周易”NPU采用專為AI大模型特性優(yōu)化的架構(gòu)設(shè)計(jì)，Beta測試版本已在2024年底向早期用戶開放評(píng)估測試，預(yù)計(jì)今年上半年正式發(fā)布亮相。

DeepSeek-R1 1.5B、7B蒸餾版本推出后，安謀科技新一代“周易”NPU在很短的時(shí)間內(nèi)，就在Emulation平臺(tái)上完成了部署與優(yōu)化，并在FPGA平臺(tái)上成功實(shí)現(xiàn)了端到端應(yīng)用的演示。

測試顯示，在標(biāo)準(zhǔn)單批次輸入、上下文長度為1024的測試環(huán)境中，新款“周易”NPU在首字計(jì)算階段的算力利用率突破40％，解碼階段的有效帶寬利用率超過80％。

帶寬利用率呈現(xiàn)高線性特性，能夠靈活適配16GB/s至256GB/s的系統(tǒng)帶寬需求。

7B版本、1024上下文長度的場景下，保障模型應(yīng)用精度的同時(shí)，新款“周易”NPU的高處理速度可達(dá)每秒40 tokens，并支持動(dòng)態(tài)長度的模型推理輸入。

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達(dá)40 tokens/s

這也展現(xiàn)了安謀科技軟件棧對大模型的成熟支持、深度優(yōu)化，包括動(dòng)態(tài)推理優(yōu)化和硬件算力潛力的挖掘，從而顯著提升推理速度和吞吐量。

目前，軟件棧已支持Llama、Qwen、DeepSeek、ChatGLM、MiniCPM等多種主流大模型，并提供與Hugging Face模型庫的對接工具鏈，方便直接部署主流模型。

硬件層面，新一代“周易”NPU采用7nm工藝制造，單Cluster算力高可達(dá)80 TOPS(每秒80萬億次計(jì)算)，能夠輕松應(yīng)對超過16K上下文長度的大模型部署需求，同時(shí)對外帶寬提高至256GB/s，解決大模型計(jì)算的帶寬瓶頸問題。

它還全面支持FP16數(shù)據(jù)精度計(jì)算，完整支持INT4軟硬量化加速，還支持多核算力擴(kuò)展，滿足端側(cè)模型的低首字延遲需求。

它還具備強(qiáng)大的多任務(wù)并行處理能力，通過細(xì)粒度的任務(wù)調(diào)度和優(yōu)先級(jí)資源分配，實(shí)現(xiàn)多任務(wù)靈活切換，確保傳統(tǒng)語音、視覺業(yè)務(wù)、大模型應(yīng)用的高效協(xié)同。

本文鏈接：http://www.tebozhan.com/showinfo-22-130640-0.html安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達(dá)40 tokens/s

聲明：本網(wǎng)頁內(nèi)容旨在傳播知識(shí)，若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除處理。郵件：2376512515@qq.com

上一篇： iPhone 17 Pro渲染圖出爐：神似小米11 Ultra 工業(yè)設(shè)計(jì)煥然一新

下一篇：女生刷同一視頻6小時(shí)后手機(jī)燒屏：畫面超崩潰再也抹不掉了

標(biāo)簽：

熱門焦點(diǎn)

一加Ace2 Pro真機(jī)揭曉鈦空灰配色質(zhì)感拉滿

終于，在經(jīng)過了幾波預(yù)熱之后，一加Ace2 Pro的外觀真機(jī)圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的，這次的外觀設(shè)計(jì)還是延續(xù)了一加11的方案，只是細(xì)節(jié)上有了調(diào)整，例如新加入了鈦空灰
《英雄聯(lián)盟》夏季賽總決賽今日開打！JDG對陣LNG首發(fā)名單來了 Knight：準(zhǔn)備三連冠

8月5日消息，今日17:00，《英雄聯(lián)盟》2023LPL夏季賽總決賽將正式開打，由JDG對陣LNG。對兩支隊(duì)伍來說，這場比賽不僅要爭奪夏季賽冠軍，更要決定誰才是LPL賽區(qū)一
一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

8月5日消息，此前就有爆料稱，一加首款折疊屏手機(jī)將會(huì)在第三季度上市，如今隨著時(shí)間臨近，新機(jī)的各種消息也開始浮出水面。據(jù)悉，這款新機(jī)將會(huì)被命名為“On
自動(dòng)化在DevOps中的力量：簡化軟件開發(fā)和交付

自動(dòng)化在DevOps中扮演著重要角色，它提升了DevOps的效能。通過自動(dòng)化工具和方法，DevOps團(tuán)隊(duì)可以實(shí)現(xiàn)以下目標(biāo)：消除手動(dòng)和重復(fù)性任務(wù)。簡化流程。在整個(gè)軟件開發(fā)生命周期中實(shí)現(xiàn)更
使用LLM插件從命令行訪問Llama 2

最近的一個(gè)大新聞是Meta AI推出了新的開源授權(quán)的大型語言模型Llama 2。這是一項(xiàng)非常重要的進(jìn)展：Llama 2可免費(fèi)用于研究和商業(yè)用途。(幾小時(shí)前，swyy發(fā)現(xiàn)它已從LLaMA 2更名為Lla
花7萬退貨退款無門：誰在縱容淘寶珠寶商家造假？

來源：極點(diǎn)商業(yè)作者：楊銘在淘寶購買珠寶玉石后，因?yàn)楸ＷC金不夠賠付，店鋪關(guān)閉，退貨退款難、維權(quán)無門的比比皆是。“提供相關(guān)產(chǎn)品鑒定證書，支持全國復(fù)檢，可以30天無理由退換貨。&
AMD的AI芯片轉(zhuǎn)單給三星可能性不大與臺(tái)積電已合作至2nm制程

據(jù) DIGITIMES 消息，英偉達(dá) AI GPU 出貨逐季飆升，接下來 AMD MI 300 系列將在第 4 季底量產(chǎn)。而半導(dǎo)體業(yè)內(nèi)人士表示，近日傳出 AMD 的 AI 芯片將轉(zhuǎn)單給
2299元起！iQOO Pad開啟預(yù)售：性能最強(qiáng)天璣平板

5月23日，iQOO如期舉行了新品發(fā)布會(huì)，除了首發(fā)安卓最強(qiáng)旗艦處理器的iQOO Neo8系列新機(jī)外，還在發(fā)布會(huì)上推出了旗下首款平板電腦——iQOO Pad，其搭載了天璣
iQOO Neo8系列或定檔5月23日：首發(fā)天璣9200+ 安卓跑分王者

去年10月，iQOO推出了iQOO Neo7系列機(jī)型，不僅搭載了天璣9000+，而且是同價(jià)位唯一一款天璣9000+直屏旗艦，一經(jīng)上市便受到了用戶的廣泛關(guān)注。在時(shí)隔半年后，

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

安謀科技下代“周易”NPU成功部署DeepSeek-R1：速度高達(dá)40 tokens/s

一加Ace2 Pro真機(jī)揭曉鈦空灰配色質(zhì)感拉滿

《英雄聯(lián)盟》夏季賽總決賽今日開打！JDG對陣LNG首發(fā)名單來了 Knight：準(zhǔn)備三連冠

一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

自動(dòng)化在DevOps中的力量：簡化軟件開發(fā)和交付

使用LLM插件從命令行訪問Llama 2

花7萬退貨退款無門：誰在縱容淘寶珠寶商家造假？

AMD的AI芯片轉(zhuǎn)單給三星可能性不大與臺(tái)積電已合作至2nm制程

2299元起！iQOO Pad開啟預(yù)售：性能最強(qiáng)天璣平板

iQOO Neo8系列或定檔5月23日：首發(fā)天璣9200+ 安卓跑分王者

最新推薦

猜你喜歡

熱門推薦

相關(guān)資訊