AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當(dāng)前位置:首頁(yè) > 科技  > 資訊

DeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

來源: 責(zé)編: 時(shí)間:2025-02-20 09:35:26 45觀看
導(dǎo)讀  仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應(yīng)用熱潮,而且給全球的算力資本市場(chǎng)帶來了重大沖擊。究其原因,DeepSeek不僅在訓(xùn)練成本及使用成本、模型訓(xùn)練及優(yōu)化方式等領(lǐng)域?qū)崿F(xiàn)了大量

  仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應(yīng)用熱潮,而且給全球的算力資本市場(chǎng)帶來了重大沖擊。究其原因,DeepSeek不僅在訓(xùn)練成本及使用成本、模型訓(xùn)練及優(yōu)化方式等領(lǐng)域?qū)崿F(xiàn)了大量的工程創(chuàng)新,而且打破了AI領(lǐng)域許多的傳統(tǒng)敘事邏輯。簡(jiǎn)而言之,DeepSeek正在改變游戲規(guī)則。g7c28資訊網(wǎng)——每日最新資訊28at.com

  DeepSeek最新推理模型R1的橫空出世,帶來了一個(gè)非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術(shù)上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對(duì)中美下一個(gè)十年的科技競(jìng)爭(zhēng)產(chǎn)生哪些影響?g7c28資訊網(wǎng)——每日最新資訊28at.com

g7c28資訊網(wǎng)——每日最新資訊28at.com

本圖片為AI生成并進(jìn)行了人為后期加工。 遙歌/制作g7c28資訊網(wǎng)——每日最新資訊28at.com

工程創(chuàng)新g7c28資訊網(wǎng)——每日最新資訊28at.com

成就與眾不同g7c28資訊網(wǎng)——每日最新資訊28at.com

  DeepSeek不僅引發(fā)了全球新一輪的AI應(yīng)用熱潮,而且對(duì)全球的算力資本市場(chǎng)產(chǎn)生重大沖擊。究其原因,DeepSeek在訓(xùn)練成本及使用成本、模型訓(xùn)練及優(yōu)化方式方面均實(shí)現(xiàn)了大量工程創(chuàng)新。g7c28資訊網(wǎng)——每日最新資訊28at.com

  成本是最大的亮點(diǎn)。DeepSeek-R1的整體訓(xùn)練成本比OpenAI少了一個(gè)數(shù)量級(jí)以上。R1在整個(gè)訓(xùn)練過程中的工程優(yōu)化和創(chuàng)新亮點(diǎn)非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機(jī)制”“Multi-token predication——多token預(yù)測(cè)”“有選擇性地使用8個(gè)浮點(diǎn)數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實(shí)都不容易實(shí)現(xiàn)。每一個(gè)看似不顯著的優(yōu)化,在層級(jí)疊加效應(yīng)下卻產(chǎn)生了非常驚人的效果。g7c28資訊網(wǎng)——每日最新資訊28at.com

  DeepSeek其實(shí)一共發(fā)布了兩個(gè)模型,分別是R1和R1-zero。DeepSeek基于V3這個(gè)基礎(chǔ)模型聚焦強(qiáng)化學(xué)習(xí)獲得了R1-zero。但是,R1-zero在回答一些問題的時(shí)候容易產(chǎn)生包括“多語(yǔ)言混雜”在內(nèi)的諸多問題。Deep-Seek又對(duì)這個(gè)模型進(jìn)行了SFT(監(jiān)督微調(diào)優(yōu)化),從而產(chǎn)生了R1。R1的強(qiáng)化學(xué)習(xí)功能可以實(shí)現(xiàn)自動(dòng)化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。g7c28資訊網(wǎng)——每日最新資訊28at.com

  顛覆性改變g7c28資訊網(wǎng)——每日最新資訊28at.com

  打破傳統(tǒng)敘事邏輯g7c28資訊網(wǎng)——每日最新資訊28at.com

  DeepSeek之所以備受關(guān)注,本質(zhì)在于打破了很多AI領(lǐng)域的傳統(tǒng)敘事邏輯,例如OpenAI對(duì)于推理模型的算力堆疊霸權(quán)邏輯、AI應(yīng)用圈的OpenAI寡頭壟斷格局邏輯、美國(guó)對(duì)中國(guó)的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……g7c28資訊網(wǎng)——每日最新資訊28at.com

  首先,AI圈公認(rèn)這種推理模型的實(shí)現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強(qiáng)于o1。進(jìn)一步來看,R1不僅免費(fèi)還開源,訓(xùn)練成本和使用成本均實(shí)現(xiàn)了指數(shù)級(jí)下降。原先o1憑借領(lǐng)先性可以“收割”相當(dāng)長(zhǎng)一段時(shí)間的價(jià)值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應(yīng)用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對(duì)于所有大模型公司的估值邏輯。g7c28資訊網(wǎng)——每日最新資訊28at.com

  其次,DeepSeek的出現(xiàn)打破了AI應(yīng)用圈原有的競(jìng)爭(zhēng)枷鎖。就算是美國(guó)的頂尖應(yīng)用公司選擇DeepSeek和ChatGPT時(shí),答案也很清楚。Cursor、Perplexity這些AI領(lǐng)域的超級(jí)明星應(yīng)用,都第一時(shí)間進(jìn)行了DeepSeek模型的部署,而且設(shè)置了推薦第一優(yōu)先級(jí)。此外,Google、Amazon、NV等平臺(tái)也都部署了Deep-Seek模型。這些改變,同步影響了云服務(wù)的市場(chǎng)格局。國(guó)內(nèi)大量從事應(yīng)用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項(xiàng)。g7c28資訊網(wǎng)——每日最新資訊28at.com

  再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達(dá)CUDA生態(tài)的更底層(例如PTX層),通過微調(diào)底層代碼來優(yōu)化性能,從而解決“連接通信能力和調(diào)度能力被閹割”的問題。專家普遍認(rèn)為,目前中美AI大模型領(lǐng)域的技術(shù)差距約為4個(gè)月。從技術(shù)能力發(fā)展的趨勢(shì)來看,這一差距繼續(xù)縮小的概率大于擴(kuò)大的概率。g7c28資訊網(wǎng)——每日最新資訊28at.com

  最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風(fēng)”。在AGI的道路上做出最強(qiáng)大的模型并開源,應(yīng)該是OpenAI最早的初心和使命。市場(chǎng)永遠(yuǎn)不會(huì)說謊,誰(shuí)的模型能力強(qiáng)誰(shuí)就能掌握最終的話語(yǔ)權(quán)。2024年12月DeepSeek V3發(fā)布的時(shí)候,國(guó)際主流媒體主要關(guān)注其“成本低廉”;當(dāng)Deep-Seek-R1發(fā)布時(shí),情況則截然不同,因?yàn)椤疤咸斓牧髁俊眮砹恕W鳛橐粋€(gè)開源模型,DeepSeek讓所有用戶在任何領(lǐng)域都增加了一個(gè)“頂尖專家”,免費(fèi)且24小時(shí)隨時(shí)在線。(作者:鄭濤)g7c28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-16-131582-0.htmlDeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com

上一篇: 小心AI伴侶背后的“溫柔陷阱”

下一篇: 快手星光百貨明星直播收官,何潔、蔡明、趙雅芝直播間拜大年

標(biāo)簽:
  • 熱門焦點(diǎn)
  • K60至尊版剛預(yù)熱 一加Ace2 Pro正面硬剛

    Redmi這邊剛?cè)缁鹑巛钡男麄髁薑60 Ultra的各種技術(shù)和硬件配置,作為競(jìng)品的一加也坐不住了。一加中國(guó)區(qū)總裁李杰發(fā)布了兩條微博,表示在自家的一加Ace2上早就已經(jīng)采用了和PixelWo
  • 對(duì)標(biāo)蘋果的靈動(dòng)島 華為帶來實(shí)況窗功能

    繼蘋果的靈動(dòng)島之后,華為也在今天正式推出了“實(shí)況窗”功能。據(jù)今天鴻蒙OS 4.0的現(xiàn)場(chǎng)演示顯示,華為的實(shí)況窗可以更高效的展現(xiàn)出實(shí)時(shí)通知,比如鎖屏上就能看到外賣、打車、銀行
  • 天貓精靈Sound Pro體驗(yàn):智能音箱沒有音質(zhì)?來聽聽我的

    這幾年除了手機(jī)作為智能生活終端最主要的核心之外,第二個(gè)可以成為中心點(diǎn)的產(chǎn)品是什么?——是智能音箱。 手機(jī)在執(zhí)行命令的時(shí)候有兩種操作方式,手和智能語(yǔ)音助手,而智能音箱只
  • 石頭自清潔掃拖機(jī)器人G10S評(píng)測(cè):多年黑科技集大成之作 懶人終極福音

    科技圈經(jīng)常能看到一個(gè)詞叫“縫合怪”,用來形容那些把好多功能或者外觀結(jié)合在一起的產(chǎn)品,通常這樣的詞是貶義詞,但如果真的是產(chǎn)品縫合的好、縫合的實(shí)用的話,那它就成了中性詞,今
  • 7月安卓手機(jī)好評(píng)榜:三星S23Ultra好評(píng)率第一

    性能榜和性價(jià)比榜之后,我們來看最后的安卓手機(jī)好評(píng)榜,數(shù)據(jù)來源安兔兔評(píng)測(cè),收集時(shí)間2023年7月1日至7月31日,僅限國(guó)內(nèi)市場(chǎng)。第一名:三星Galaxy S23 Ultra好評(píng)率:95.71%在即將迎來新
  • 印度登月最關(guān)鍵一步!月船三號(hào)今晚進(jìn)入環(huán)月軌道

    8月5日消息,據(jù)印度官方消息,月船三號(hào)將于北京時(shí)間今晚21時(shí)30分左右開始近月制動(dòng)進(jìn)入環(huán)月軌道。這是該探測(cè)器能夠成功的最關(guān)鍵步驟之一,如果成功將開始圍
  • Rust中的高吞吐量流處理

    作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優(yōu)化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫(kù),還使用這些庫(kù)實(shí)現(xiàn)了一個(gè)流處理程序
  • 自律,給不了Keep自由!

    來源 | 互聯(lián)網(wǎng)品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時(shí)不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺(tái)Keep正式登陸港交所,努力
  • 小米MIX Fold 3下月亮相:今年唯一無短板的全能折疊屏

    這段時(shí)間以來,包括三星、一加、榮耀等等有不少品牌旗下的最新折疊屏旗艦都有新的進(jìn)展,其中榮耀、三星都已陸續(xù)發(fā)布了最新的折疊屏旗艦,尤其號(hào)榮耀Magi
Top