近日,科技界圍繞Grok 3是否已成為地表最強(qiáng)AI展開了熱烈討論。盡管爭(zhēng)議不斷,但Grok 3在能耗方面的“壯舉”卻無人能否認(rèn)。這款A(yù)I大模型的訓(xùn)練耗電量驚人,據(jù)估算,其能源消耗量相當(dāng)于一座小城市一年的總用電量,或等同于4萬多輛燃油車一年的碳排放。
Grok 3的問世,再次凸顯了當(dāng)前AI發(fā)展所面臨的能耗挑戰(zhàn)。在開源趨勢(shì)盛行、性價(jià)比日益受到重視的行業(yè)背景下,如何在提升模型效率與降低能耗之間找到平衡點(diǎn),成為了Grok 3亟需攻克的難題。其背后的“規(guī)模擴(kuò)展”模式,依舊是以巨大的能源消耗為代價(jià)。
2月18日,馬斯克在X平臺(tái)的一次直播活動(dòng)中,親自發(fā)布了Grok 3模型,并進(jìn)行了現(xiàn)場(chǎng)演示。他展示的PPT中提到,基準(zhǔn)測(cè)試結(jié)果顯示,Grok 3在包括AIME'24數(shù)學(xué)能力測(cè)試、GPQA科學(xué)知識(shí)評(píng)估以及LCB Oct - Feb編程能力測(cè)試在內(nèi)的多項(xiàng)測(cè)試中,均擊敗了包括谷歌Gemini 2 Pro、DeepSeek V3、Anthropic的Claude 3.5 sonnet和OpenAI的GPT-4o在內(nèi)的多個(gè)競(jìng)爭(zhēng)對(duì)手。
在大模型競(jìng)技場(chǎng)Chatbot Arena LLM排行榜上,代號(hào)為巧克力的Grok 3早期版本更是以突破1400分的成績(jī)榮登榜首,成為首個(gè)達(dá)到這一高度的模型。然而,值得注意的是,這一分?jǐn)?shù)僅比DeepSeek R1高出2.9%。PPT中的柱狀圖之所以呈現(xiàn)出顯著的差距,是因?yàn)榻貓D起始點(diǎn)選擇了1300分,從而產(chǎn)生了“放大”效果。
盡管Grok 3的1400分看似遙遙領(lǐng)先,但實(shí)際上與其他大模型的差距并不懸殊。柱狀圖的起始點(diǎn)選擇,使得這一優(yōu)勢(shì)被人為放大。直播過程中,還出現(xiàn)了多次“翻車”情況。例如,當(dāng)馬斯克嘗試用Grok 3演示飛向火星的代碼時(shí),輸出直接崩潰,兩次生成均失敗,直到第三次后臺(tái)重新生成才成功。
直播結(jié)束后,部分X用戶測(cè)試了最新的Beta版Grok 3,并提出了一個(gè)經(jīng)典難題:“9.11與9.9哪個(gè)大?”令人意外的是,號(hào)稱最聰明的Grok 3竟然給出了錯(cuò)誤答案。這一事件再次引發(fā)了外界對(duì)Grok 3實(shí)用性的質(zhì)疑。
回顧Grok 2發(fā)布時(shí)的轟動(dòng)效應(yīng),以及后續(xù)在實(shí)際應(yīng)用中的表現(xiàn)并不盡如人意,人們不禁擔(dān)心Grok 3是否會(huì)重蹈覆轍。不過,可以肯定的是,馬斯克口中的“地球上最聰明的AI”是依靠算力堆疊而成的,其背后的訓(xùn)練成本極為高昂。
馬斯克在直播中透露,Grok 3的訓(xùn)練量是Grok 2的10倍,這一龐大的訓(xùn)練任務(wù)是在人工智能初創(chuàng)公司xAI位于孟菲斯的超級(jí)計(jì)算機(jī)集群上完成的。該集群在短短數(shù)月內(nèi)從10萬塊NVIDIA H100 GPU擴(kuò)展到了20萬塊,僅第二階段的建設(shè)就耗時(shí)92天。據(jù)估算,僅硬件消耗就已超過30億美元。
相比之下,DeepSeek V3在配備2048塊算力受限的英偉達(dá)H800 GPU集群上訓(xùn)練,整個(gè)流程僅用時(shí)278.8萬個(gè)H800 GPU小時(shí),總成本僅為557.6萬美元。DeepSeek V3在GPU用量、訓(xùn)練用時(shí)和算力成本上均大幅縮減,其低成本卻能與閉源模型比肩的表現(xiàn),讓硅谷的“燒錢模式”受到了質(zhì)疑。
分析指出,盡管Grok 3在數(shù)學(xué)推理和編程能力上表現(xiàn)更優(yōu)異,但其算力消耗卻是DeepSeek V3的263倍。這凸顯了兩者在資源使用上的巨大差異。在能耗方面,Grok 3使用的GPU總能耗相當(dāng)于一個(gè)小城市的用電量,產(chǎn)生的碳排放量也大致相當(dāng)于4萬多輛燃油車一年的碳排放。
有網(wǎng)友形象地比喻道:“Grok 3像是20支AK綁在一起狂射,而DeepSeek則像是在練定向狙擊。一個(gè)是土豪堆裝備的打法,一個(gè)是在算力有限的情況下壓縮能耗實(shí)現(xiàn)性能最大化。后者強(qiáng)調(diào)了人類在其中的作用和價(jià)值,這才是真正的AI精神和未來的方向。”
xAI的超級(jí)計(jì)算機(jī)集群在孟菲斯還引發(fā)了環(huán)保爭(zhēng)議。據(jù)報(bào)道,xAI計(jì)劃繼續(xù)使用燃?xì)廨啓C(jī)為其超級(jí)計(jì)算機(jī)供電,這一舉措引發(fā)了當(dāng)?shù)丨h(huán)保組織的擔(dān)憂。他們指出,這些燃?xì)廨啓C(jī)自去年夏季以來一直在運(yùn)行,且未向公眾發(fā)出通知也未受到監(jiān)管,使得孟菲斯本已不佳的空氣質(zhì)量更加惡化。
環(huán)保組織南方環(huán)境法中心的發(fā)言人表示,xAI在未獲得空氣許可證的情況下使用燃?xì)廨啓C(jī)供電,違反了相關(guān)規(guī)定。管理當(dāng)?shù)仉娋W(wǎng)的孟菲斯電力、煤氣和水務(wù)公司也表示,xAI的算力擴(kuò)充計(jì)劃需要額外的150MW電力,他們?nèi)栽谘芯窟@對(duì)于當(dāng)?shù)仉娏ο到y(tǒng)的影響。
本文鏈接:http://www.tebozhan.com/showinfo-45-10913-0.html馬斯克20萬塊GPU打造的Grok 3,真的是地表最強(qiáng)AI還是能耗巨獸?
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 谷歌新推AI助手,成生物醫(yī)學(xué)科學(xué)家得力伙伴,能推理提假設(shè)還優(yōu)化方案