快科技2月2日消息,據國內媒體報道稱,DeepSeek在研發大模型時繞過了英偉達的護城河CUDA,這讓美國不少巨頭們感到了很大的威脅,而現在這件事才剛剛開始。
DeepSeek真的繞過了CUDA,那這件事意味著什么?對此,北京航空航天大學黃雷副教授接受采訪時表示,繞過CUDA,可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細粒度的操作。
譬如DeepSeek在多節點通信時繞過了 CUDA 直接使用 PTX(Parallel Thread Execution),其多只能實現以算法的方式來高效利用硬件層面的加速。
一旦速度變得更快,打個比方這就意味著別人家的模型要訓練十天,而DeepSeek只需要訓練五天,那么就能給模型喂更多的數據,即能讓模型在同等時間內看到更多的數據,間接提高模型的效果。
按照消息人士的說法,DeepSeek擁有一些擅長寫PTX語言的內部開發者。
那么,假如它之后使用國產GPU,其在硬件適配方面將會更得心應手,其只要了解這些硬件驅動提供的一些基本函數接口,就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產硬件。
本文鏈接:http://www.tebozhan.com/showinfo-24-128392-0.html繞開英偉達護城河CUDA!消息稱DeepSeek準備適配國產GPU
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com