當前位置：首頁 > 科技 > 數碼

NVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型

來源：責編：時間：2023-11-17 08:49:39 406觀看

導讀快科技11月16日消息，正在舉行的微軟Iginte全球技術大會上，微軟發布一系列AI相關的全新優化模型、開發工具資源，幫助開發者更深入地釋放硬件性能，拓展AI場景。尤是對于當下在AI領域占據絕對主導地位的NVIDIA來

快科技11月16日消息，正在舉行的微軟Iginte全球技術大會上，微軟發布一系列AI相關的全新優化模型、開發工具資源，幫助開發者更深入地釋放硬件性能，拓展AI場景。

尤是對于當下在AI領域占據絕對主導地位的NVIDIA來說，微軟這次送上了一份大禮包，無論是面向OpenAI Chat API的TensorRT-LLM封裝接口，還是RTX驅動的性能改進DirectML for Llama 2，以及其他熱門大語言模型(LLM)，都可以在NVIDIA硬件上獲得更好的加速和應用。

其中，TensorRT-LLM是一款用于加速LLM推理的庫，可大大提升AI推理性能，還在不斷更以支持越來越多的語言模型，而且它還是開源的。

就在10月份，NVIDIA也發布了面向Windows平臺的TensorRT-LLM，在配備RTX 30/40系列GPU顯卡的臺式機、筆記本上，只要顯存不少于8GB，就可以更輕松地完成要求嚴苛的AI工作負載。

現在，Tensor RT-LLM for Windows可以通過全新的封裝接口，與 OpenAI 廣受歡迎的聊天 API 兼容，因此可以在本地直接運行各種相關應用，而不需要連接云端，有利于在 PC 上保留私人和專有數據，防范隱私泄露。

只要是針對TensorRT-LLM優化過的大語言模型，都可以與這一封裝接口配合使用，包括Llama 2、Mistral、NV LLM，等等。

對于開發者來說，無需繁瑣的代碼重寫和移植，只需修改一兩行代碼，就可以讓AI應用在本地快速執行。

NVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型 ↑↑↑基于TensorRT-LLM的微軟Visual Studio代碼插件——Continue.dev編碼助手

本月底還會有TensorRT-LLM v0.6.0版本更新，將會在RTX GPU上帶來多達5倍的推理性能提升，并支持更多熱門的 LLM，包括全新的70億參數Mistral、80億參數Nemotron-3，讓臺式機和筆記本也能隨時、快速、準確地本地運行LLM。

根據實測數據，RTX 4060顯卡搭配TenroRT-LLM，推理性能可以跑到每秒319 tokens，相比其他后端的每秒61 tokens提速足足4.2倍。

RTX 4090則可以從每秒tokens加速到每秒829 tokens，提升幅度達2.8倍。

NVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型

基于強大的硬件性能、豐富的開發生態、廣闊的應用場景，NVIDIA RTX正成為本地端側AI不可或缺的得力助手，而越來越豐富的優化、模型和資源，也在加速AI功能、應用在上億臺RTX PC上的普及。

目前已經有400多個合作伙伴發布了支持RTX GPU加速的AI應用、游戲，而隨著模型易用性的不斷提高，相信會有越來越多的AIGC功能出現在Windows PC平臺上。

NVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型

本文鏈接：http://www.tebozhan.com/showinfo-24-27406-0.htmlNVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：牙膏都懶得擠了！RTX 40筆記本暫時按兵不動

下一篇：微軟推出兩款定制芯片Azure Maia 100和Azure Cobalt 100

標簽：

熱門焦點

小米平板5 Pro 12.4簡評：多專多能兼顧影音娛樂的大屏利器

疫情帶來了網課，網課盤活了安卓平板，安卓平板市場雖然中途停滯了幾年，但好的一點就是停滯的這幾年行業又有了新的發展方向，例如超窄邊框、高刷新率、多攝鏡頭組合等，這就讓安卓
如何使用JavaScript創建一只圖像放大鏡？

譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站，可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域，以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
一文掌握 Golang 模糊測試（Fuzz Testing）

模糊測試（Fuzz Testing）模糊測試（Fuzz Testing）是通過向目標系統提供非預期的輸入并監視異常結果來發現軟件漏洞的方法。可以用來發現應用程序、操作系統和網絡協議等中的漏洞或
一個注解實現接口冪等，這樣才優雅！

場景碼猿慢病云管理系統中其實高并發的場景不是很多，沒有必要每個接口都去考慮并發高的場景，比如添加住院患者的這個接口，具體的業務代碼就不貼了，業務偽代碼如下：圖片上述代碼有
阿里大調整

來源：產品劉有媒體報道稱，近期淘寶天貓集團啟動了近年來最大的人力制度改革，涉及員工績效、層級體系等多個核心事項，目前已形成一個初步的“征求意見版”：1、取消P序列
年輕人的“職場羞恥感”，無處不在

作者：馮曉亭陶淘李欣張琳馬舒葉來源：燃次元“人在職場，應該選擇什么樣的著裝？”近日，在網絡上，一個與著裝相關的帖子引發關注，在該帖子里，一位在高級寫字樓亞洲金
AI芯片初創公司Tenstorrent獲三星和現代1億美元投資

Tenstorrent是一家由芯片行業資深人士Jim Keller領導的加拿大初創公司，專注于開發人工智能芯片，該公司周三表示，已經從現代汽車集團和三星投資基金等
2299元起！iQOO Pad明晚首銷：性能最強天璣平板

5月23日，iQOO如期舉行了新品發布會，除了首發安卓最強旗艦處理器的iQOO Neo8系列新機外，還在發布會上推出了旗下首款平板電腦——iQOO Pad，其最大的賣點
iQOO Neo8系列今日官宣：首發天璣9200+ 全球安卓最強芯！

在昨日舉行的的聯發科新一代旗艦芯片天璣9200+的發布會上，iQOO官方也正式宣布，全新的iQOO Neo8系列新品將全球首發搭載這款當前性能最強大的移動平臺

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

NVIDIA RTX顯卡AI推理提速5倍！RTX PC輕松在本地搞定大模型

小米平板5 Pro 12.4簡評：多專多能兼顧影音娛樂的大屏利器

如何使用JavaScript創建一只圖像放大鏡？

一文掌握 Golang 模糊測試（Fuzz Testing）

一個注解實現接口冪等，這樣才優雅！

阿里大調整

年輕人的“職場羞恥感”，無處不在

AI芯片初創公司Tenstorrent獲三星和現代1億美元投資

2299元起！iQOO Pad明晚首銷：性能最強天璣平板

iQOO Neo8系列今日官宣：首發天璣9200+ 全球安卓最強芯！

最新推薦

猜你喜歡

熱門推薦

相關資訊