AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 科技  > 軟件

Meta發布Llama 4系列AI,混合專家架構能否助其效率飆升?

來源: 責編: 時間:2025-04-06 08:33:47 26觀看
導讀meta近期推出了其最新的Llama 4系列AI模型,這一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。據meta透露,這些模型均經過了龐大的未標注文本、圖像和視頻數據的訓練,旨在賦予它們廣泛的視覺理

meta近期推出了其最新的Llama 4系列AI模型,這一系列包括了Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth三款模型。據meta透露,這些模型均經過了龐大的未標注文本、圖像和視頻數據的訓練,旨在賦予它們廣泛的視覺理解能力。6xE28資訊網——每日最新資訊28at.com

目前,meta已將Scout和Maverick兩款模型上架至Hugging Face平臺。而Behemoth模型仍在緊鑼密鼓的訓練中。Scout模型能夠在單個英偉達H100 GPU上運行,而Maverick則需要更高配置的英偉達H100 DGX AI平臺或性能相當的設備。6xE28資訊網——每日最新資訊28at.com

值得注意的是,Llama 4系列是meta首次采用混合專家(MoE)架構的模型。這種架構通過將數據處理任務分解為多個子任務,再將這些子任務分配給更小的、專門化的“專家”模型,從而在訓練和回答用戶查詢時展現出更高的效率。例如,Maverick模型擁有4000億個參數,但在128個“專家”模型中,只有170億個參數處于活躍狀態。6xE28資訊網——每日最新資訊28at.com

6xE28資訊網——每日最新資訊28at.com

相比之下,Scout模型擁有170億個活躍參數,分布在16個“專家”模型中,總參數數為1090億個。盡管Llama 4系列模型在性能上有所提升,但它們并非像OpenAI的o1和o3-mini那樣的“推理模型”。推理模型會對答案進行事實核查,通常能更可靠地回答問題,但響應時間相對較長。6xE28資訊網——每日最新資訊28at.com

meta內部測試顯示,Maverick模型在通用AI助手和聊天等應用場景中表現出色,尤其在創意寫作、代碼生成、翻譯、推理、長文本上下文總結和圖像基準測試等方面,其性能超過了OpenAI的GPT-4和谷歌的Gemini 2.0等模型。然而,與谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.7 Sonnet和OpenAI的GPT-4.5等更強大的最新模型相比,Maverick仍有一定的提升空間。6xE28資訊網——每日最新資訊28at.com

6xE28資訊網——每日最新資訊28at.com

Scout模型則擅長總結文檔和基于大型代碼庫進行推理。該模型支持處理1000萬個詞元,這意味著它一次能夠處理數百萬字的文本。meta還預告了其Behemoth模型。據透露,Behemoth擁有2880億個活躍參數,分布在16個“專家”模型中,總參數數接近2萬億個。meta內部基準測試顯示,在一些衡量解決數學問題等科學、技術、工程和數學(STEM)技能的評估中,Behemoth的表現優于GPT-4.5、Claude 3.7 Sonnet和Gemini 2.0 Pro,但略遜于Gemini 2.5 Pro。6xE28資訊網——每日最新資訊28at.com

6xE28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-26-141495-0.htmlMeta發布Llama 4系列AI,混合專家架構能否助其效率飆升?

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 超人歸來!DC全新電影超前預覽曝光,7月北美上映引期待

下一篇: 適馬或將發布200mm f/1.8全畫幅鏡頭,索尼E和徠卡L卡口適用?

標簽:
  • 熱門焦點
  • 對標蘋果的靈動島 華為帶來實況窗功能

    繼蘋果的靈動島之后,華為也在今天正式推出了“實況窗”功能。據今天鴻蒙OS 4.0的現場演示顯示,華為的實況窗可以更高效的展現出實時通知,比如鎖屏上就能看到外賣、打車、銀行
  • K8S | Service服務發現

    一、背景在微服務架構中,這里以開發環境「Dev」為基礎來描述,在K8S集群中通常會開放:路由網關、注冊中心、配置中心等相關服務,可以被集群外部訪問;圖片對于測試「Tes」環境或者
  • 學習JavaScript的10個理由...

    作者 | Simplilearn編譯 | 王瑞平當你決心學習一門語言的時候,很難選擇到底應該學習哪一門,常用的語言有Python、Java、JavaScript、C/CPP、PHP、Swift、C#、Ruby、Objective-
  • 自律,給不了Keep自由!

    來源 | 互聯網品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • 新電商三兄弟,“抖快紅”成團!

    來源:價值研究所作 者:Hernanderz 隨著內容電商的概念興起,抖音、快手、小紅書組成的“新電商三兄弟”成為業內一股不可忽視的勢力,給阿里、京東、拼多多帶去了巨大壓
  • 華為和江淮汽車合作開發百萬元問界MPV?雙方回應來了

    8月1日消息,郭明錤今天在社交平臺發文稱,華為正在和江淮汽車合作,開發售價在100萬元的問界MPV,預計在2024年第2季度量產,銷量目標為上市首年交付5萬輛。
  • 蘋果140W USB-C充電器:采用氮化鎵技術

    據10 月 30 日 9to5 Mac 消息報道,當蘋果推出新的 MacBook Pro 2021 時,該公司還推出了新的 140W USB-C 充電器,附贈在 MacBook Pro 16 英寸機型的盒子里,也支
  • 最薄的14英寸游戲筆記本電腦 Alienware X14已可以購買

    2022年1月份在國際消費電子展(CES2022)上首次亮相的Alienware新品——Alienware X14現在已經可以購買了,這款筆記本電腦被譽為世界上最薄的 14 英寸游戲筆
  • 北京:科技教育體驗基地開始登記

      北京“科技館之城”科技教育體驗基地登記和認證工作日前啟動。首批北京科技教育體驗基地擬于2023年全國科普日期間掛牌,后續還將開展常態化登記。  北京科技教育體驗基
Top