AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

開源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列開啟邊緣 AI 革命

來源: 責編: 時間:2024-10-26 15:13:49 35觀看
導讀 Mistral 7B 誕生一周年之際,法國 AI 初創公司 Mistral 再次連發兩個輕量級模型 Ministral 3B 和 Ministral 8B,性能趕超 Llama 3 8B。Mistral 7B 僅僅發布一周年,法國 AI 初創小模型「les Ministraux」就打敗它

Mistral 7B 誕生一周年之際,法國 AI 初創公司 Mistral 再次連發兩個輕量級模型 Ministral 3B 和 Ministral 8B,性能趕超 Llama 3 8B。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

Mistral 7B 僅僅發布一周年,法國 AI 初創小模型「les Ministraux」就打敗它了。它堪稱是,世界上最好的邊緣模型。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

Ministral 3B 和 Ministral 8B 這兩款輕量級模型,專為邊緣設備打造。截至目前,它們正式加入 Mixtral、Pixtral、Codestral、Mathstral 行列,成為 Mistral 一員。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

別看僅有 30 億參數,在指令跟隨基準上,完全超越了 Llama 3 8B,以及前輩模型 Mistral 7B。而且 Ministral 3B 和 Ministral 8B 在大模型競技場中的測試,均拿下了媲美 Gemma 2、Llama 3.1 開源模型的成績。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

世界上最好的邊緣模型

Ministral 3B 和 Ministral 8B 都支持高達 128k 上下文(目前在 vLLM 上為 32k)。n5W28資訊網——每日最新資訊28at.com

在知識、常識、推理、函數調用、效率等方面,為低于 10B 參數模型設立了新標桿。n5W28資訊網——每日最新資訊28at.com

而且,Ministral 8B 還有配備了滑動窗口注意機制(sliding-window attention),以實現更快和內存高效的推理。n5W28資訊網——每日最新資訊28at.com

不論是管理復雜的 AI 智能體工作流,還是創建專門的任務助手,它們均可以被微調到各種用例中。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

趕超開源模型,擊敗 Mistral 7B

研究人員在多項基準測試中,評估了 Les Minimrau 的性能。n5W28資訊網——每日最新資訊28at.com

其中包括知識與常識、代碼、數學、多語言四大方面。n5W28資訊網——每日最新資訊28at.com

預訓練模型

如下圖所示,與 Gema 2 2B、Llama 3.2 3B 相比較,Minstral 3B 在以上基準上,取得了最優成績。n5W28資訊網——每日最新資訊28at.com

在與 Llama 3.1 8B、Mistral 7B 相比較過程中,僅有代碼能力,Minstral 8B 還有些差距,其余放方面均是性能最高的模型。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

如下是,更加直觀可視化柱狀圖,Minstral 8B 在各項評測中,占據首位。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

指令模型

再來看微調后的指令模型,性能比較的結果。n5W28資訊網——每日最新資訊28at.com

在大模型競技場中,Minstral 3B 在不同基準上,實現了最優。Minstral 8B 僅在 Wild bench 上,略遜于 Gema 2 9B。n5W28資訊網——每日最新資訊28at.com

另外,在代碼、數學、函數調用方面,兩款新模型性能大幅超越其余模型。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

下圖,可以直觀看出指令微調后的 Minstral 3B 比更大的 Mistral 7B 的改進。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

如下是指令微調后的 Minstral 8B 模型,與其他模型的性能對比直觀圖。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

邊緣計算皆可用,0.1 美金百萬 token

如今,大模型在實際落地中,不如小模型來的更切實際。越來越多的用戶,希望對關鍵應用程序能夠進行本地優先推理,比如設備上翻譯、不用聯網智能助理,自動機器人等等。n5W28資訊網——每日最新資訊28at.com

正如官博所述,Les Minimraux 正為這些場景,提供了高計算效率、低延遲的解決方案。n5W28資訊網——每日最新資訊28at.com

當與 Mistral Large 等更大的模型結合使用時,les Ministraux 還可以作為多步智能體工作流中,進行函數調用的高效中介。n5W28資訊網——每日最新資訊28at.com

通過微調,它們能以極低的延遲和成本基于用戶意圖,跨多個上下文處理輸入解析、任務路由和調用 API。n5W28資訊網——每日最新資訊28at.com

價格

根據官方公布的價格所示,Minstral 8B 輸入輸出價格為百萬 token,0.1 美元。Minstral 3B 則為百萬 token0.04 美元。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

開源版 OpenAI,不再 Open

自去年成立以來,Mistral 曾以磁力鏈方式開源了多款媲美 OpenAI 的模型,一路走紅得到 AI 社區的認可。n5W28資訊網——每日最新資訊28at.com

這家總部位于巴黎的 Mistral,由 Meta、谷歌 DeepMind 前員工創立。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

幾個月前,它以 60 億美金估值,完成 6.4 億美元新一輪融資,并隨之推出了一款 GPT-4 級別的模型 ——Mistral Large 2。n5W28資訊網——每日最新資訊28at.com

此外,他們在今年,還推出了一個專家混合模型 Mixtral 8x22B。n5W28資訊網——每日最新資訊28at.com

它包含了一個編碼模型 Codestral,以及一個數學推理和科學發現的模型。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

不過,今年這家明星公司陷入了巨大爭議,因為它變得不再那么 open。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

年初,有消息爆料稱,微軟宣布將收購 Mistral 一些股份,并對其投資,意味著它的模型將在 Azure AI 進行托管。n5W28資訊網——每日最新資訊28at.com

甚至,還有 Reddit 網友發現,Mistral 已從官網中,移除了致力于開源的承諾。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

在一些模型的調用上,Mistral 也開啟了收費模式,包括這次同樣如此。n5W28資訊網——每日最新資訊28at.com

有網友就此吐槽,不是開源的。n5W28資訊網——每日最新資訊28at.com

n5W28資訊網——每日最新資訊28at.com

要知道,對于一家初創公司來說,一直堅持開源代碼是一個巨大的挑戰。就比如反面教材 Stability AI,完全放棄了開源的商業模式,也轉向了收費策略。n5W28資訊網——每日最新資訊28at.com

對于 Mistral 也是如此,若要持續打造優秀的模型,只有這一種選擇。n5W28資訊網——每日最新資訊28at.com

參考資料:n5W28資訊網——每日最新資訊28at.com

https://x.com/dchaplot/status/1846575384718172448n5W28資訊網——每日最新資訊28at.com

https://x.com/GuillaumeLample/status/1846566817650679966n5W28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-9255-0.html開源版 OpenAI 再出神作:小模型吊打 Meta Llama 3,Ministral 系列開啟邊緣 AI 革命

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 華為Mate X6蓄勢待發,11月前后或將驚艷登場?

下一篇: 華為智駕+座艙,高端MPV市場迎新變局?

標簽:
  • 熱門焦點
  • 一份全面清單:Web3行業高薪酬的13種工作

    來源:區塊鏈騎士這可能會讓許多人感到震驚,但除了成為開發人員之外,Web3還有其他高薪工作。Web3可能是現代就業市場中跨學科最多的領域,換句話說,它由許多個在不同領域中具有不同
  • 元宇宙風口下,視覺中國如何重估?

    要說橫跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一個。不僅互聯網巨頭們紛紛布局,上市公司們趨之若鶩,還被不少地方政府寫入了產業規劃,大有在2022年
  • 2022年中國元宇宙產業系列研究報告-基礎設施篇(5)

    傳感器是由敏感元件和轉換元件構成,能夠感受規定的檢測量(物理量、化學量、生物量等),并按照一定規律將檢測量轉化成可用的輸出信號的器件和裝置,進而滿足信息的
  • 從NFT頂級公鏈到Web3.0基礎設施:帶你了解不一樣的Flow

    對于大部分年輕人來說,剛剛過去的春節有一個詞語突然成為了品牌宣傳的流行語,作為從NFT中衍生出來的“數字藏品”一時間獲得了不少品牌青睞,他們紛紛推出自己的數
  • 借VR產業東風,江西搶灘布局“元宇宙”

    自2016年起就在VR上傾注了大量精力的江西省,迅速搭上了“元宇宙”。VR、AR等技術是通往元宇宙的關鍵接口,使人們可以在數字空間和物理空間自由穿梭。自2016年起
  • 重溫 1602 年:DAO 是新的企業范式嗎?

    作者:Andrew Singer“ 將你的選票委托給行業有能力的專家,將使所有者在這些公司的管理中擁有更強大、更清晰的話語權 。”1602 年,荷蘭東印度公司成立,許多人認為
  • 元宇宙不完全是想出來的,而是實打實做出來的

    沈陽強調,元宇宙不完全是想出來的,而是靠實打實做出來的;互聯網向三維化升級是已經明確的大方向,這意味著大量的資金和技術會持續涌入。跨入2022年,元宇宙并沒有“
  • 爆發在即的Layer2賽道百花齊放,誰將是領跑者?

    還記得幾年前最早我們提起ETH擴容,首先想到就是Layer2,而Layer2里,首先想到的是閃電網絡,狀態通道,Plasma…然后折騰了幾年,發現并沒有什么用,許多項目方和資本也等不
  • 我們離元宇宙的實現只差一副眼鏡?

    近日的蘋果春季新品發布會,想必許多人都守在了屏幕前,就為等待傳說中的首款AR Glass。在發布會之前,蘋果全球營銷主管Greg Joswiak曾在Twitter上分享了一段短視頻
Top