據(jù)TechCrunch報(bào)道,結(jié)合Meta官方信息,Meta近日發(fā)布了全新的人工智能模型Llama 4系列。該系列首次引入混合專(zhuān)家模型(MoE)架構(gòu),這種設(shè)計(jì)可以將復(fù)雜任務(wù)分解為更小的部分,從而顯著提升效率。值得一提的是,混合專(zhuān)家架構(gòu)也是DeepSeek聲稱(chēng)能夠大幅降低成本的關(guān)鍵技術(shù)。
Llama 4系列具備多模態(tài)處理能力,能夠同時(shí)應(yīng)對(duì)文本、圖像、音頻和視頻任務(wù),但目前僅支持美式英語(yǔ)。該系列包含三款模型,按參數(shù)規(guī)模從大到小依次為Behemoth、Maverick和Scout。
Behemoth擁有2萬(wàn)億參數(shù),目前仍在訓(xùn)練中。而Maverick和Scout作為“蒸餾”版本,已經(jīng)開(kāi)放給開(kāi)發(fā)者和普通用戶(hù)使用。Maverick的活躍參數(shù)為170億,包含128個(gè)專(zhuān)家模型。Meta表示,Maverick在推理和代碼生成方面表現(xiàn)優(yōu)異,其主要競(jìng)爭(zhēng)對(duì)手包括OpenAI的GPT-4o和Google的Gemini 2.0 Flash。此外,Meta還聲稱(chēng),Maverick在參數(shù)規(guī)模較小的情況下,性能已經(jīng)超越DeepSeek v3。
Scout同樣擁有170億活躍參數(shù),但僅包含16個(gè)專(zhuān)家模型。它對(duì)硬件需求較低,僅需一塊NVIDIA H100 GPU即可運(yùn)行。其上下文處理能力達(dá)到1000萬(wàn)詞元(token),與Google的Gemma 3、Gemini 2.0 Flash-Lite以及Mistral 3.1形成競(jìng)爭(zhēng)關(guān)系。
Meta強(qiáng)調(diào),Llama 4系列在多項(xiàng)測(cè)試中表現(xiàn)優(yōu)于競(jìng)爭(zhēng)對(duì)手。此外,該系列模型將避免回答涉及政治或社會(huì)爭(zhēng)議性問(wèn)題的內(nèi)容。
本文鏈接:http://www.tebozhan.com/showinfo-27-142234-0.htmlMeta推出Llama 4系列模型,首次采用混合專(zhuān)家架構(gòu)
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 美程科技完成超億元融資,加速電子陶瓷產(chǎn)業(yè)化布局
下一篇: 通嘉宏瑞完成5億元融資,發(fā)力半導(dǎo)體級(jí)真空泵市場(chǎng)
標(biāo)簽: