近日,科技界圍繞Grok 3是否已成為地表最強AI展開了熱烈討論。盡管爭議不斷,但Grok 3在能耗方面的“壯舉”卻無人能否認。這款AI大模型的訓練耗電量驚人,據估算,其能源消耗量相當于一座小城市一年的總用電量,或等同于4萬多輛燃油車一年的碳排放。
Grok 3的問世,再次凸顯了當前AI發展所面臨的能耗挑戰。在開源趨勢盛行、性價比日益受到重視的行業背景下,如何在提升模型效率與降低能耗之間找到平衡點,成為了Grok 3亟需攻克的難題。其背后的“規模擴展”模式,依舊是以巨大的能源消耗為代價。
2月18日,馬斯克在X平臺的一次直播活動中,親自發布了Grok 3模型,并進行了現場演示。他展示的PPT中提到,基準測試結果顯示,Grok 3在包括AIME'24數學能力測試、GPQA科學知識評估以及LCB Oct - Feb編程能力測試在內的多項測試中,均擊敗了包括谷歌Gemini 2 Pro、DeepSeek V3、Anthropic的Claude 3.5 sonnet和OpenAI的GPT-4o在內的多個競爭對手。
在大模型競技場Chatbot Arena LLM排行榜上,代號為巧克力的Grok 3早期版本更是以突破1400分的成績榮登榜首,成為首個達到這一高度的模型。然而,值得注意的是,這一分數僅比DeepSeek R1高出2.9%。PPT中的柱狀圖之所以呈現出顯著的差距,是因為截圖起始點選擇了1300分,從而產生了“放大”效果。
盡管Grok 3的1400分看似遙遙領先,但實際上與其他大模型的差距并不懸殊。柱狀圖的起始點選擇,使得這一優勢被人為放大。直播過程中,還出現了多次“翻車”情況。例如,當馬斯克嘗試用Grok 3演示飛向火星的代碼時,輸出直接崩潰,兩次生成均失敗,直到第三次后臺重新生成才成功。
直播結束后,部分X用戶測試了最新的Beta版Grok 3,并提出了一個經典難題:“9.11與9.9哪個大?”令人意外的是,號稱最聰明的Grok 3竟然給出了錯誤答案。這一事件再次引發了外界對Grok 3實用性的質疑。
回顧Grok 2發布時的轟動效應,以及后續在實際應用中的表現并不盡如人意,人們不禁擔心Grok 3是否會重蹈覆轍。不過,可以肯定的是,馬斯克口中的“地球上最聰明的AI”是依靠算力堆疊而成的,其背后的訓練成本極為高昂。
馬斯克在直播中透露,Grok 3的訓練量是Grok 2的10倍,這一龐大的訓練任務是在人工智能初創公司xAI位于孟菲斯的超級計算機集群上完成的。該集群在短短數月內從10萬塊NVIDIA H100 GPU擴展到了20萬塊,僅第二階段的建設就耗時92天。據估算,僅硬件消耗就已超過30億美元。
相比之下,DeepSeek V3在配備2048塊算力受限的英偉達H800 GPU集群上訓練,整個流程僅用時278.8萬個H800 GPU小時,總成本僅為557.6萬美元。DeepSeek V3在GPU用量、訓練用時和算力成本上均大幅縮減,其低成本卻能與閉源模型比肩的表現,讓硅谷的“燒錢模式”受到了質疑。
分析指出,盡管Grok 3在數學推理和編程能力上表現更優異,但其算力消耗卻是DeepSeek V3的263倍。這凸顯了兩者在資源使用上的巨大差異。在能耗方面,Grok 3使用的GPU總能耗相當于一個小城市的用電量,產生的碳排放量也大致相當于4萬多輛燃油車一年的碳排放。
有網友形象地比喻道:“Grok 3像是20支AK綁在一起狂射,而DeepSeek則像是在練定向狙擊。一個是土豪堆裝備的打法,一個是在算力有限的情況下壓縮能耗實現性能最大化。后者強調了人類在其中的作用和價值,這才是真正的AI精神和未來的方向。”
xAI的超級計算機集群在孟菲斯還引發了環保爭議。據報道,xAI計劃繼續使用燃氣輪機為其超級計算機供電,這一舉措引發了當地環保組織的擔憂。他們指出,這些燃氣輪機自去年夏季以來一直在運行,且未向公眾發出通知也未受到監管,使得孟菲斯本已不佳的空氣質量更加惡化。
環保組織南方環境法中心的發言人表示,xAI在未獲得空氣許可證的情況下使用燃氣輪機供電,違反了相關規定。管理當地電網的孟菲斯電力、煤氣和水務公司也表示,xAI的算力擴充計劃需要額外的150MW電力,他們仍在研究這對于當地電力系統的影響。
本文鏈接:http://www.tebozhan.com/showinfo-45-10913-0.html馬斯克20萬塊GPU打造的Grok 3,真的是地表最強AI還是能耗巨獸?
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com