近日,科技界傳出了一則引人注目的消息,據(jù)知名科技媒體The Information報(bào)道,meta Platforms在人工智能領(lǐng)域的競(jìng)賽中正面臨巨大的成本壓力。據(jù)悉,為了支撐其旗艦大語(yǔ)言模型Llama的訓(xùn)練,meta曾在2024年向包括微軟、亞馬遜在內(nèi)的多家競(jìng)爭(zhēng)對(duì)手尋求資金支持。
報(bào)道指出,meta內(nèi)部對(duì)于Llama模型所需的龐大資源感到擔(dān)憂,因此提出了“Llama Consortium”的構(gòu)想,并愿意讓潛在投資者參與到Llama未來(lái)功能的開(kāi)發(fā)中,以此作為吸引合作的籌碼。然而,據(jù)知情人士透露,這一提議的初期反響并不熱烈,目前尚不清楚是否已達(dá)成正式的資金協(xié)議。
這一事件凸顯了構(gòu)建先進(jìn)AI系統(tǒng)所需承擔(dān)的巨額成本,即便是像meta這樣財(cái)力雄厚的科技巨頭也難以承受。這也進(jìn)一步揭示了生成式AI領(lǐng)域的高風(fēng)險(xiǎn)性,即便是行業(yè)領(lǐng)先者也可能面臨資金短缺的困境。
值得注意的是,meta近期推出的Llama 4系列模型進(jìn)一步展示了其在AI技術(shù)方面的雄心壯志以及所面臨的成本挑戰(zhàn)。其中,Llama 4 Scout專為單GPU使用設(shè)計(jì),擁有109億總參數(shù)和17億活躍參數(shù),以及超大的1000萬(wàn)token上下文窗口,能夠一次性處理約750萬(wàn)字的內(nèi)容。而Llama 4 Maverick則針對(duì)更大規(guī)模的任務(wù),擁有400億總參數(shù)和17億活躍參數(shù),以及128個(gè)專家系統(tǒng)。
這兩款模型均采用Mixture-of-Experts(MoE)架構(gòu),通過(guò)激活特定的子網(wǎng)絡(luò)來(lái)提升效率。meta內(nèi)部還開(kāi)發(fā)了一款參數(shù)高達(dá)2萬(wàn)億的Llama 4 Behemoth模型,用于訓(xùn)練小型模型,這一過(guò)程需要?jiǎng)佑枚噙_(dá)3.2萬(wàn)塊GPU。
meta尋求資金的行為與其Llama模型在公司業(yè)務(wù)中的核心地位密切相關(guān)。自Llama 4發(fā)布以來(lái),它迅速被集成到WhatsApp、Instagram和Facebook的meta AI功能中,并通過(guò)亞馬遜SageMaker JumpStart和微軟Azure AI Foundry等云平臺(tái)提供商用許可。這一舉措不僅展示了meta在AI技術(shù)方面的實(shí)力,也為其帶來(lái)了可觀的商業(yè)收益。
同時(shí),meta在競(jìng)爭(zhēng)中展現(xiàn)出了強(qiáng)硬的姿態(tài)。據(jù)報(bào)道,meta已阻止蘋果的Apple Intelligence功能在其iOS應(yīng)用中使用,迫使用戶轉(zhuǎn)向基于Llama的AI工具。這一舉動(dòng)不僅彰顯了meta在AI領(lǐng)域的競(jìng)爭(zhēng)力,也反映了其對(duì)于自身技術(shù)優(yōu)勢(shì)的自信。
本文鏈接:http://www.tebozhan.com/showinfo-45-12407-0.htmlMeta AI競(jìng)賽遇資金挑戰(zhàn),向微軟亞馬遜求助,Llama模型未來(lái)何去何從?
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com