當前位置：首頁 > 元宇宙 > AI

非 Transformer 架構 AI 模型 Liquid 問世，號稱性能“凌駕 Meta Llama 微軟 Phi”

來源：責編：時間：2024-10-05 19:24:56 99觀看

導讀 10 月 2 日消息，去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型（Liquid Foundation Models，LFM），分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構，號稱在基準測

10 月 2 日消息，去年剛成立的 Liquid AI 公司于 9 月 30 日發布了三款 Liquid 基礎模型（Liquid Foundation Models，LFM），分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構，號稱在基準測試中凌駕同規模的 Transformer 模型。

注意到，目前業界在深度學習和自然語言處理方面主要使用 Transformer架構，該架構主要利用自注意力機制捕捉序列中單詞之間的關系，包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型，都是基于 Transformer 架構。

而Liquid AI 則反其道而行之，其 Liquid 基礎模型號稱對模型架構進行了“重新設想”，據稱受到了“交通信號處理系統、數值線性代數”理念的深刻影響，主打“通用性”，能夠針對特定類型的數據進行建模，同時支持對視頻、音頻、文本、時間序列和交通信號等內容進行處理。

Liquid AI 表示，與 Transformer 架構模型相比 LFM 模型的RAM用量更少，特別是在處理大量輸入內容場景時，由于 Transformer 架構模型處理長輸入時需要保存鍵值（KV）緩存，且緩存會隨著序列長度的增加而增大，導致輸入越長，占用的RAM越多。

而 LFM 模型則能夠避免上述問題，系列模型能夠有效對外界輸入的數據進行壓縮，降低對硬件資源的需求，在相同硬件條件下，這三款模型相對業界競品能夠處理更長的序列。

參考 Liquid AI 首批發布的三款模型，其中 LFM-1.3B 專為資源受限的環境設計，而 LFM-3.1B 針對邊緣計算進行了優化，LFM-40.3B 則是一款“專家混合模型（MoE）”，該版本主要適用于數學計算、交通信號處理等場景。

這些模型在通用知識和專業知識的處理上表現較為突出，能夠高效處理長文本任務，還能夠處理數學和邏輯推理任務，目前該模型主要支持英語，不過也對中文、法語、德語、西班牙語、日語、韓語和阿拉伯語提供有限支持。

根據 Liquid AI 的說法，LFM-1.3B 在許多基準測試中擊敗了其他 1B 參數規模的領先模型，包括蘋果的 OpenELM、Meta 的 Llama 3.2、微軟的 Phi 1.5 以及 Stability 的 Stable LM 2，這標志著首次有非 GPT 架構的模型明顯超越了 Transformer 模型。

而在 LFM-3.1B 方面，這款模型不僅能夠超越了 3B 規模的各種 Transformer 模型、混合模型和 RNN 模型，甚至還在特定場景超越上一代的 7B 和 13B 規模模型，目前已戰勝谷歌的 Gemma 2、蘋果的 AFM Edge、Meta 的 Llama 3.2 和微軟的 Phi-3.5 等。

LFM-40.3B 則強調在模型規模和輸出質量之間的平衡，不過這款模型有所限制，雖然其擁有 400 億個參數，但在推理時僅啟用 120 億個參數，Liquid AI 聲稱進行相關限制是因為模型出品質量已經足夠，在這種情況下對相應參數進行限制“反而還能夠提升模型效率、降低模型運行所需的硬件配置”。

本文鏈接：http://www.tebozhan.com/showinfo-45-8028-0.html非 Transformer 架構 AI 模型 Liquid 問世，號稱性能“凌駕 Meta Llama 微軟 Phi”

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇： PyTorch 架構優化庫 torchao 正式發布，可大幅提升 AI 模型效率

下一篇： OpenAI 引領 AI 浪潮：o1 模型可處理 5 小時任務，顛覆營銷思維和模式

標簽：

熱門焦點

三院士三教授熱聊元宇宙&——AIGC，學術界怎么看？

來源：清元宇宙在近日舉辦的中國江寧2023元宇宙產業·人才高峰論壇暨AIGC發展大會上，中國工程院院士譚建榮、劉韻潔、鄭緯民出席并發表了主旨演講。除了三大院士，還有清華
聚焦虛擬數字人技術，這三大商機要抓?。?/a>

關于虛擬數字人，企業可以從三個方面入局，分別是ToG（To Government，面向政府），即為數字政府和數字城市提供支持服務；ToB（To Business，面向企業），即為企業提供虛擬員工解決方案；ToC（To Cons

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

撰文/ 蔥鮪魚本屆世界杯可能不是最精彩的一屆，卻絕對是看點十足的一屆：后疫情時代的首屆世界杯、耗資2200億美元打造的“史上最貴”世界杯、足壇黃金
“我沒搞懂元宇宙，但一天能賺9w塊”

作者：鄭宇軒最近幾個月，“元宇宙”爆火，除了 Facebook 改名為 Meta 高調進軍元宇宙外， BAT 為代表的大廠紛紛著手“元宇宙”新業務。剎那之間，元宇宙成為新風口，除了
NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

引言：NFT Insider由WHALE社區、BeepCrypto聯合出品，濃縮每周NFT新聞，為大家帶來關于NFT最全面、最新鮮、最有價值的訊息。每期周報將從NFT市場數據，藝術新聞類，游戲
2022年去中心化交易所會崛起嗎？

“在某個時候，去中心化衍生品的交易量可能會超過去中心化現貨交易所?！盌EX 越來越多地轉向第二層解決方案。“數字化金融市場的概念以及如何沿著以用戶為中心
3月份值得關注的5個NFT項目

2021年，我們見證了一個新的創造者經濟的誕生。它是在區塊鏈上誕生的。自從NFT成為流行文化的中心舞臺以來，有些藝術家們已經成為了NFT的超級明星，在幾個月的時間
從概念到落地 Web3.0初具雛形

加密資產熱潮催生出的鏈上應用中，除了DeFi、NFT、鏈游GameFi等場景外，還有一個熱詞叫「Web3.0」。Web3.0的概念最早出現在2014年，由以太坊聯合創始人及波卡創建者
TX加入的NFT數字收藏品，元宇宙的破圈之路?

3月7日，澳大利亞 NFT 初創公司 Immutable 在新加坡淡馬錫牽頭的R資中以估值 25 億美元完成2億美元R資，騰訊參投。想必國人最熟知的應該就是TX，作為國內四大互聯網

在數字世界再造世界杯，元宇宙體育正變得越來越豐滿

AVt天堂网手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

首頁

元宇宙

NFT

區塊鏈

虛擬人

AR/VR

AI

元宇宙百科

非 Transformer 架構 AI 模型 Liquid 問世，號稱性能“凌駕 Meta Llama 微軟 Phi”

三院士三教授熱聊元宇宙&——AIGC，學術界怎么看？

聚焦虛擬數字人技術，這三大商機要抓?。?/a>

“我沒搞懂元宇宙，但一天能賺9w塊”

NFT Insider #47：YGG發布2021Q4社區報告，GameFi領域1月份獲超10億美元融資

2022年去中心化交易所會崛起嗎？

3月份值得關注的5個NFT項目

從概念到落地 Web3.0初具雛形

TX加入的NFT數字收藏品，元宇宙的破圈之路?

最新推薦

元宇宙的文旅賽道，還能如何發力？

上海虹口成立10億元元宇宙基金，香港首只元宇宙ETF擬上市

本周NFT領域重要資訊回顧

從英式拍到荷蘭拍，看傳統金融拍賣玩法如何玩轉NFT市場交易

NFT高玩必備：NFT分析工具大盤點

爆發在即的Layer2賽道百花齊放，誰將是領跑者？

猜你喜歡

熱門推薦

相關資訊

非 Transformer 架構 AI 模型 Liquid 問世，號稱性能“凌駕 Meta Llama 微軟 Phi”

最新推薦

猜你喜歡

熱門推薦

相關資訊

非 Transformer 架構 AI 模型 Liquid 問世，號稱性能“凌駕 Meta Llama 微軟 Phi”