清華大學(xué)高性能計(jì)算研究所傳來(lái)重要消息,翟季冬教授團(tuán)隊(duì)攜手清華系科創(chuàng)先鋒清程極智,共同宣布了一項(xiàng)重大開(kāi)源成果——大模型推理引擎“赤兔 Chitu”。
這款引擎開(kāi)創(chuàng)性地實(shí)現(xiàn)了在非英偉達(dá)Hopper架構(gòu)GPU及眾多國(guó)產(chǎn)芯片上的FP8精度模型原生運(yùn)行,顯著降低了推理成本,性能更是實(shí)現(xiàn)了翻倍。據(jù)悉,赤兔引擎被精準(zhǔn)定位為“生產(chǎn)級(jí)大模型推理引擎”,旨在為用戶帶來(lái)多重優(yōu)勢(shì)。
首先,赤兔引擎具備強(qiáng)大的多元算力適配能力。無(wú)論是NVIDIA的最新旗艦產(chǎn)品,還是舊款的多系列產(chǎn)品,亦或是國(guó)產(chǎn)芯片,赤兔引擎都能提供優(yōu)化的支持,確保了廣泛的兼容性。
其次,赤兔引擎全場(chǎng)景可伸縮的特性使其應(yīng)用場(chǎng)景更加靈活。無(wú)論是純CPU部署、單GPU部署,還是大規(guī)模集群部署,赤兔引擎都能提供可擴(kuò)展的解決方案,滿足不同場(chǎng)景下的需求。
赤兔引擎的長(zhǎng)期穩(wěn)定運(yùn)行能力也是其一大亮點(diǎn)。在實(shí)際生產(chǎn)環(huán)境中,赤兔引擎的穩(wěn)定性足以承載高并發(fā)的業(yè)務(wù)流量,確保了業(yè)務(wù)的連續(xù)性和穩(wěn)定性。
在部署DeepSeek-R1-671B滿血版時(shí),赤兔引擎在A800集群的測(cè)試中展現(xiàn)出了卓越的性能。與部分國(guó)外開(kāi)源框架相比,赤兔引擎在實(shí)現(xiàn)GPU使用量減少50%的同時(shí),推理速度還提升了3.15倍,這一成績(jī)無(wú)疑令人矚目。
對(duì)于廣大開(kāi)發(fā)者和用戶而言,赤兔引擎的開(kāi)源無(wú)疑是一個(gè)巨大的福音。現(xiàn)在,大家可以通過(guò)訪問(wèn)GitHub上的開(kāi)源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗(yàn)這款強(qiáng)大的大模型推理引擎。
本文鏈接:http://www.tebozhan.com/showinfo-45-11507-0.html清華開(kāi)源赤兔大模型推理引擎,國(guó)產(chǎn)芯片上DeepSeek推理成本減半性能翻倍
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 神策數(shù)據(jù)攜手DeepSeek,AI如何重塑數(shù)據(jù)分析與智能運(yùn)營(yíng)新生態(tài)?
下一篇: 阿里達(dá)摩院技術(shù)大牛鄢志杰離職,語(yǔ)音技術(shù)領(lǐng)域或?qū)⒂瓉?lái)新變局?