AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

借助Python庫CuPy,發掘GPU的威力

來源: 責編: 時間:2023-11-07 09:13:05 250觀看
導讀譯者 | 布加迪審校 | 重樓CuPy簡介CuPy是一個Python庫,與NumPy和SciPy數組兼容,為GPU加速計算而設計。通過將NumPy換成CuPy語法,您可以在英偉達CUDA或AMD ROCm平臺上運行代碼。這讓您可以使用GPU加速執行與數組相關的任

譯者 | 布加迪0sN28資訊網——每日最新資訊28at.com

審校 | 重樓0sN28資訊網——每日最新資訊28at.com

CuPy簡介

CuPy是一個Python庫,與NumPy和SciPy數組兼容,為GPU加速計算而設計。通過將NumPy換CuPy語法,您可以在英偉達CUDA或AMD ROCm平臺上運行代碼。這可以使用GPU加速執行與數組相關的任務,從而更快地處理更龐大的數組。0sN28資訊網——每日最新資訊28at.com

只需換掉幾行代碼,就可以利用GPU的大規模并行處理能力來顯著加快索引、規范化和矩陣乘法等數組操作。0sN28資訊網——每日最新資訊28at.com

CuPy還支持訪問低級CUDA功能。它允許使用RawKernels將ndarray傳遞給現有的CUDA C/ C++程序,借助Streams簡化性能,并允許直接調用CUDA Runtime API。0sN28資訊網——每日最新資訊28at.com

安裝CuPy

您可以使用pip安裝CuPy,但在此之前,您必須使用以下命令找到正確的CUDA版本。0sN28資訊網——每日最新資訊28at.com

0sN28資訊網——每日最新資訊28at.com

!nvcc --versionnvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2022 NVIDIA CorporationBuilt on Wed_Sep_21_10:33:58_PDT_2022Cuda compilation tools, release 11.8, V11.8.89Build cuda_11.8.r11.8/compiler.31833905_0

谷歌Colab的當前版本似乎使用CUDA版本11.8。因此,我們將繼續安裝cupy-cuda11x版本。0sN28資訊網——每日最新資訊28at.com

如果您使用較舊的CUDA版本,我提供了下面的表格來幫助您確定要安裝的合適的CuPy軟件包。0sN28資訊網——每日最新資訊28at.com

0sN28資訊網——每日最新資訊28at.com

選擇正確的版本后,我們將使用pip安裝Python軟件包。0sN28資訊網——每日最新資訊28at.com

0sN28資訊網——每日最新資訊28at.com

pip install cupy-cuda11x

如果您已安裝了Anaconda,還可以使用conda命令自動檢測并安裝CuPy軟件的正確版本0sN28資訊網——每日最新資訊28at.com

0sN28資訊網——每日最新資訊28at.com

conda install -c conda-forge cupy

CuPy基礎知識

在本節中,我們將比較CuPy和Numpy的語法,它們相似度為95%。不是使用np,而是用cp代替它。0sN28資訊網——每日最新資訊28at.com

我們將先使用Python列表創建NumPy和CuPy數組。之后,我們將計算向量的范數。0sN28資訊網——每日最新資訊28at.com

import cupy as cpimport numpy as npx = [3, 4, 5]x_np = np.array(x)x_cp = cp.array(x)l2_np = np.linalg.norm(x_np)l2_cp = cp.linalg.norm(x_cp)print("Numpy: ", l2_np)print("Cupy: ", l2_cp)

正如我們所,我們得到了類似的結果。0sN28資訊網——每日最新資訊28at.com

0sN28資訊網——每日最新資訊28at.com

Numpy: 7.07106781186547550sN28資訊網——每日最新資訊28at.com

Cupy: 7.07106781186547550sN28資訊網——每日最新資訊28at.com

為了將NumPy轉換CuPy數組,只需使用cp.asarray(X)。0sN28資訊網——每日最新資訊28at.com

x_array = np.array([10, 22, 30])x_cp_array = cp.asarray(x_array)type(x_cp_array)cupy.ndarray

或者,使用.get()將CuPy轉換Numpy數組。0sN28資訊網——每日最新資訊28at.com

x_np_array = x_cp_array.get()type(x_np_array)numpy.ndarray

性能比較

在本節中,我們將比較NumPy和CuPy的性能。0sN28資訊網——每日最新資訊28at.com

我們將使用time.time()對代碼執行時間進行計時。然后,我們將創建一個3D NumPy數組并執行一些數學函數。0sN28資訊網——每日最新資訊28at.com

import time# NumPy and CPU Runtimes = time.time()x_cpu = np.ones((1000, 100, 1000))np_result = np.sqrt(np.sum(x_cpu**2, axis=-1))e = time.time()np_time = e - sprint("Time consumed by NumPy: ", np_time)Time consumed by NumPy: 0.5474584102630615

類似地,我們將創建一個3D CuPy數組,執行數學運算,并進行計時以評測性能0sN28資訊網——每日最新資訊28at.com

# CuPy and GPU Runtimes = time.time()x_gpu = cp.ones((1000, 100, 1000))cp_result = cp.sqrt(cp.sum(x_gpu**2, axis=-1))e = time.time()cp_time = e - sprint("/nTime consumed by CuPy: ", cp_time)Time consumed by CuPy: 0.001028299331665039

為了計算差異,我們將NumPy時間除以CuPy時間,我們使用CuPy獲得了500倍以上的性能提升。0sN28資訊網——每日最新資訊28at.com

diff = np_time/cp_timeprint(f'/nCuPy is {diff: .2f} X time faster than NumPy')CuPy is 532.39 X time faster than NumPy

注意為了達到更好的效果,建議進行一番預熱運行,以盡量減少時間波動。0sN28資訊網——每日最新資訊28at.com

除了速度優勢外,CuPy還提供了出色的多GPU支持,可以充分利用多個GPU的集體計算能力。0sN28資訊網——每日最新資訊28at.com

此外,如果您想比較結果,可以看看我的Colab筆記本。0sN28資訊網——每日最新資訊28at.com

結論

總之,CuPy提供了一種在英偉達GPU上加速NumPy代碼的簡單方法。只需做幾個修改,將NumPy替換CuPy,就可以體驗到數組計算在速度上有數量級的提升。這種性能提升使您可以處理龐大得多的數據集和模型,從而實現更先進的機器學習和科學計算。0sN28資訊網——每日最新資訊28at.com

相關資源:0sN28資訊網——每日最新資訊28at.com

  • 說明文檔:https://docs.cupy.dev/en/stable/index.html
  • GitHubhttps://github.com/cupy/cupy
  • 示例:https://github.com/cupy/cupy/tree/main/examples
  • APIhttps://docs.cupy.dev/en/stable/reference/

原文標題:Leveraging the Power of GPUs with CuPy in Python,作者:Abid Ali Awan0sN28資訊網——每日最新資訊28at.com


0sN28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-17375-0.html借助Python庫CuPy,發掘GPU的威力

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: Golang 中的 Bytes 包詳解之Bytes.Buffer

下一篇: 想快速進入人工智能領域的Java程序員?你準備好了嗎?

標簽:
  • 熱門焦點
  • 影音體驗是真的強 簡單聊聊iQOO Pad

    大公司的好處就是產品線豐富,非常細分化的東西也能給你做出來,例如早先我們看到了新的vivo Pad2,之后我們又在iQOO Neo8 Pro的發布會上看到了iQOO的首款平板產品iQOO Pad。雖
  • 印度登月最關鍵一步!月船三號今晚進入環月軌道

    8月5日消息,據印度官方消息,月船三號將于北京時間今晚21時30分左右開始近月制動進入環月軌道。這是該探測器能夠成功的最關鍵步驟之一,如果成功將開始圍
  • 從 Pulsar Client 的原理到它的監控面板

    背景前段時間業務團隊偶爾會碰到一些 Pulsar 使用的問題,比如消息阻塞不消費了、生產者消息發送緩慢等各種問題。雖然我們有個監控頁面可以根據 topic 維度查看他的發送狀態,
  • 企業采用CRM系統的11個好處

    客戶關系管理(CRM)軟件可以為企業提供很多的好處,從客戶保留到提高生產力。  CRM軟件用于企業收集客戶互動,以改善客戶體驗和滿意度。  CRM軟件市場規模如今超過580
  • 谷歌KDD'23工作:如何提升推薦系統Ranking模型訓練穩定性

    谷歌在KDD 2023發表了一篇工作,探索了推薦系統ranking模型的訓練穩定性問題,分析了造成訓練穩定性存在問題的潛在原因,以及現有的一些提升模型穩定性方法的不足,并提出了一種新
  • 一個注解實現接口冪等,這樣才優雅!

    場景碼猿慢病云管理系統中其實高并發的場景不是很多,沒有必要每個接口都去考慮并發高的場景,比如添加住院患者的這個接口,具體的業務代碼就不貼了,業務偽代碼如下:圖片上述代碼有
  • 微軟邀請 Microsoft 365 商業用戶,測試視頻編輯器 Clipchamp

    8 月 1 日消息,微軟近日宣布即將面向 Microsoft 365 商業用戶,開放 Clipchamp 應用,邀請用戶通過該應用來編輯視頻。微軟于 2021 年收購 Clipchamp,隨后開始逐步整合到 Microsof
  • 大廠卷向扁平化

    來源:新熵作者丨南枝 編輯丨月見大廠職級不香了。俗話說,兵無常勢,水無常形,互聯網企業調整職級體系并不稀奇。7月13日,淘寶天貓集團啟動了近年來最大的人力制度改革,目前已形成一
  • 與兆芯合作 聯想推出全新旗艦版筆記本電腦開天N7系列

    聯想與兆芯合作推出全新聯想旗艦版筆記本電腦開天 N7系列。這個系列采用兆芯KX-6640MA處理器平臺,KX-6640MA 處理器是采用了陸家嘴架構,16nm 工藝,4 核 4 線
Top