在科技界的又一次重大突破中,meta公司于深夜震撼發(fā)布了其最新的Llama 4系列開源AI模型,這一系列包括了Llama 4 Scout、Llama 4 Maverick以及尚在訓(xùn)練中的Llama 4 Behemoth。
據(jù)meta官方介紹,這些模型均經(jīng)過海量未標(biāo)注文本、圖像和視頻數(shù)據(jù)的嚴(yán)格訓(xùn)練,旨在賦予它們卓越的視覺理解能力。這一舉措被視為多模態(tài)人工智能創(chuàng)新領(lǐng)域的一個(gè)全新里程碑。
“今天,我們迎來了原生多模態(tài)AI的新時(shí)代,”meta公司表示,“我們自豪地推出了首批Llama 4模型——Llama 4 Scout和Llama 4 Maverick。這些模型不僅代表了我們的最高技術(shù)水平,也在多模態(tài)領(lǐng)域中樹立了新的標(biāo)桿。”
具體來看,Llama 4 Scout擁有170億活躍參數(shù),并配備了16個(gè)專家系統(tǒng)。其上下文窗口能力行業(yè)領(lǐng)先,能夠處理高達(dá)1000萬標(biāo)記的數(shù)據(jù)。在多項(xiàng)基準(zhǔn)測試中,Llama 4 Scout的表現(xiàn)超越了Gemma 3、Gemini 2.0 Flash-Lite和Mistral 3.1等競爭對手。
而Llama 4 Maverick同樣擁有170億活躍參數(shù),但專家系統(tǒng)數(shù)量增加至128個(gè)。在圖像定位方面,它展現(xiàn)出了頂尖水平,能夠?qū)⒂脩籼崾九c視覺概念精準(zhǔn)對齊,并將模型響應(yīng)定位在圖像的特定區(qū)域。在基準(zhǔn)測試中,Llama 4 Maverick的表現(xiàn)優(yōu)于GPT-4o和Gemini 2.0 Flash。在推理和編碼方面,它與DeepSeek v3取得了相當(dāng)?shù)慕Y(jié)果,但活躍參數(shù)僅為后者的一半。在性價(jià)比方面,其聊天版本在LMArena上的ELO得分高達(dá)1417。
meta強(qiáng)調(diào),Llama 4 Scout和Llama 4 Maverick之所以能成為迄今為止最好的模型,得益于從Llama 4 Behemoth中進(jìn)行的知識蒸餾。Llama 4 Behemoth作為meta最強(qiáng)大的模型,目前仍在訓(xùn)練中,但在專注于STEM領(lǐng)域的基準(zhǔn)測試中,已經(jīng)展現(xiàn)出了超越GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro的實(shí)力。
Llama 4系列模型是meta旗下首批采用混合專家(MoE)架構(gòu)的模型。這種架構(gòu)通過將數(shù)據(jù)處理任務(wù)分解為子任務(wù),并委派給更小的、專門的“專家”模型,從而提高了訓(xùn)練和回答用戶查詢時(shí)的效率。
“混合專家架構(gòu)的引入,是我們技術(shù)創(chuàng)新的重要一步,”meta公司表示,“它使我們能夠更高效地處理復(fù)雜的數(shù)據(jù)處理任務(wù),為用戶提供更準(zhǔn)確、更快速的AI服務(wù)。”
隨著Llama 4系列的發(fā)布,meta再次展示了其在人工智能領(lǐng)域的領(lǐng)先地位。這一系列模型的推出,不僅將推動(dòng)多模態(tài)AI技術(shù)的發(fā)展,也將為各行各業(yè)帶來更多的創(chuàng)新和變革。
未來,隨著Llama 4 Behemoth的完成訓(xùn)練以及更多基于混合專家架構(gòu)的模型的推出,meta有望在人工智能領(lǐng)域繼續(xù)引領(lǐng)潮流,為人類社會(huì)的發(fā)展貢獻(xiàn)更多的智慧和力量。
本文鏈接:http://www.tebozhan.com/showinfo-45-12010-0.htmlMeta推出Llama 4系列,開創(chuàng)性采用“混合專家”架構(gòu)引領(lǐng)AI新紀(jì)元
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com