4 月 19 日消息,科技媒體 The Information 昨日(4 月 18 日)發(fā)布博文,報(bào)道稱 Meta Platforms 在 AI 競(jìng)賽中面臨巨大成本壓力,2024 年曾向微軟、亞馬遜等競(jìng)爭(zhēng)對(duì)手尋求資金支持,用于訓(xùn)練其旗艦大語(yǔ)言模型 Llama。
援引該媒體報(bào)道,Meta 內(nèi)部因擔(dān)憂資源需求,發(fā)起“Llama Consortium”的提議,Meta 甚至提出讓潛在投資者參與 Llama 未來(lái)功能的開(kāi)發(fā),以吸引合作。
消息人士透露,初期反應(yīng)并不熱烈,正式資金協(xié)議是否達(dá)成仍不明朗。這一嘗試凸顯了構(gòu)建領(lǐng)先 AI 系統(tǒng)的巨額成本,即便是擁有雄厚財(cái)力的 Meta 也感受到壓力,顯示出生成式 AI 領(lǐng)域的高風(fēng)險(xiǎn)。
Meta 近期公布的 Llama 4 系列模型進(jìn)一步凸顯其技術(shù)雄心與成本挑戰(zhàn)。其中,Llama 4 Scout(總參數(shù) 109B,活躍參數(shù) 17B)面向單 GPU 使用,具備超大的 1000 萬(wàn) token 上下文窗口,可一次性處理約 750 萬(wàn)字內(nèi)容。而 Llama 4 Maverick(總參數(shù) 400B,活躍參數(shù) 17B,128 個(gè)專家)則針對(duì)更大規(guī)模任務(wù)。
兩款模型均采用 Mixture-of-Experts(MoE)架構(gòu),通過(guò)激活特定子網(wǎng)絡(luò)提升效率。此外,Meta 內(nèi)部還開(kāi)發(fā)了參數(shù)高達(dá) 2 萬(wàn)億的 Llama 4 Behemoth,用于訓(xùn)練小型模型,需動(dòng)用多達(dá) 3.2 萬(wàn)塊 GPU。
Meta 的資金尋求與 Llama 模型在其業(yè)務(wù)中的核心地位密切相關(guān)。Llama 4 發(fā)布后迅速集成到 WhatsApp、Instagram 和 Facebook 的 Meta AI 功能中,并通過(guò)亞馬遜 SageMaker JumpStart 和微軟 Azure AI Foundry 等云平臺(tái)提供商用許可。
同時(shí),Meta 在競(jìng)爭(zhēng)中采取強(qiáng)硬姿態(tài),阻止蘋(píng)果的 Apple Intelligence 功能在其 iOS 應(yīng)用中使用,迫使用戶轉(zhuǎn)向基于 Llama 的 AI 工具。
本文鏈接:http://www.tebozhan.com/showinfo-45-12447-0.htmlAI 競(jìng)賽壓力山大:Meta 被曝資金缺口,向微軟、亞馬遜求援
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 歷時(shí) 2 小時(shí) 40 分,天工 Ultra 拿下北京亦莊人形機(jī)器人半程馬拉松冠軍
下一篇: 27B 顯存需求 54 → 14.1GB:谷歌發(fā)布 Gemma 3 QAT AI 模型,RTX 3090 顯卡可運(yùn)行