AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

來源: 責編: 時間:2024-10-05 19:24:56 65觀看
導讀 10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發(fā)布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測

10 月 2 日消息,去年剛成立的 Liquid AI 公司于 9 月 30 日發(fā)布了三款 Liquid 基礎模型(Liquid Foundation Models,LFM),分別為 LFM-1.3B、LFM-3.1B 和 LFM-40.3B。這些模型均采用非 Transformer 架構,號稱在基準測試中凌駕同規(guī)模的 Transformer 模型。akK28資訊網——每日最新資訊28at.com

akK28資訊網——每日最新資訊28at.com

注意到,目前業(yè)界在深度學習和自然語言處理方面主要使用 Transformer架構,該架構主要利用自注意力機制捕捉序列中單詞之間的關系,包括 OpenAI 的 GPT、Meta 的 BART 和谷歌的 T5 等模型,都是基于 Transformer 架構。akK28資訊網——每日最新資訊28at.com

而Liquid AI 則反其道而行之,其 Liquid 基礎模型號稱對模型架構進行了“重新設想”,據稱受到了“交通信號處理系統(tǒng)、數值線性代數”理念的深刻影響,主打“通用性”,能夠針對特定類型的數據進行建模,同時支持對視頻、音頻、文本、時間序列和交通信號等內容進行處理。akK28資訊網——每日最新資訊28at.com

akK28資訊網——每日最新資訊28at.com

Liquid AI 表示,與 Transformer 架構模型相比 LFM 模型的RAM用量更少,特別是在處理大量輸入內容場景時,由于 Transformer 架構模型處理長輸入時需要保存鍵值(KV)緩存,且緩存會隨著序列長度的增加而增大,導致輸入越長,占用的RAM越多。akK28資訊網——每日最新資訊28at.com

而 LFM 模型則能夠避免上述問題,系列模型能夠有效對外界輸入的數據進行壓縮,降低對硬件資源的需求,在相同硬件條件下,這三款模型相對業(yè)界競品能夠處理更長的序列。akK28資訊網——每日最新資訊28at.com

參考 Liquid AI 首批發(fā)布的三款模型,其中 LFM-1.3B 專為資源受限的環(huán)境設計,而 LFM-3.1B 針對邊緣計算進行了優(yōu)化,LFM-40.3B 則是一款“專家混合模型(MoE)”,該版本主要適用于數學計算、交通信號處理等場景。akK28資訊網——每日最新資訊28at.com

這些模型在通用知識和專業(yè)知識的處理上表現較為突出,能夠高效處理長文本任務,還能夠處理數學和邏輯推理任務,目前該模型主要支持英語,不過也對中文、法語、德語、西班牙語、日語、韓語和阿拉伯語提供有限支持。akK28資訊網——每日最新資訊28at.com

根據 Liquid AI 的說法,LFM-1.3B 在許多基準測試中擊敗了其他 1B 參數規(guī)模的領先模型,包括蘋果的 OpenELM、Meta 的 Llama 3.2、微軟的 Phi 1.5 以及 Stability 的 Stable LM 2,這標志著首次有非 GPT 架構的模型明顯超越了 Transformer 模型。akK28資訊網——每日最新資訊28at.com

而在 LFM-3.1B 方面,這款模型不僅能夠超越了 3B 規(guī)模的各種 Transformer 模型、混合模型和 RNN 模型,甚至還在特定場景超越上一代的 7B 和 13B 規(guī)模模型,目前已戰(zhàn)勝谷歌的 Gemma 2、蘋果的 AFM Edge、Meta 的 Llama 3.2 和微軟的 Phi-3.5 等。akK28資訊網——每日最新資訊28at.com

LFM-40.3B 則強調在模型規(guī)模和輸出質量之間的平衡,不過這款模型有所限制,雖然其擁有 400 億個參數,但在推理時僅啟用 120 億個參數,Liquid AI 聲稱進行相關限制是因為模型出品質量已經足夠,在這種情況下對相應參數進行限制“反而還能夠提升模型效率、降低模型運行所需的硬件配置”。akK28資訊網——每日最新資訊28at.com

akK28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-8028-0.html非 Transformer 架構 AI 模型 Liquid 問世,號稱性能“凌駕 Meta Llama 微軟 Phi”

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: PyTorch 架構優(yōu)化庫 torchao 正式發(fā)布,可大幅提升 AI 模型效率

下一篇: OpenAI 引領 AI 浪潮:o1 模型可處理 5 小時任務,顛覆營銷思維和模式

標簽:
  • 熱門焦點
  • 新周期,誰在堅守窄門?

    來源:錦緞今日的投資者恐怕已經忘記了,在OpenAI創(chuàng)造出ChatGPT這一殺器的前夜,生成式AI也曾經是一道窄門,窄到連馬斯克都差點失去了信心。在當時的輿論眼中,AGI的道路不夠性感,不夠
  • AIGC產品測評TOP25丨誰能搶到下個十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦陽策劃 | 楊曉鶴封面來源 | 圖蟲創(chuàng)意 2016年,李彥宏站在百度聯(lián)盟峰會的講臺上,向所有人宣布:互聯(lián)網的下一幕是人工智能。同年,Google 旗下 Dee
  • 從科幻走進現實,元宇宙概念逐漸清晰

    2021年,元宇宙概念如同一顆炸彈投進互聯(lián)網行業(yè),掀起了一場數字海嘯,眾多企業(yè)紛紛入局,在此新領域展開新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻紅,元宇宙走進資本圈2021年3
  • 中國銀保監(jiān)管委提示:謹慎投資,勿做接盤俠

    中國銀保監(jiān)管委,發(fā)布一則風險提示,內容圍繞防范以“元宇宙”名義進行的非法集資風險。原文如下:近期,一些不法分子蹭熱點,以“元宇宙投資項目”“元宇宙鏈游”等名
  • 從NFT頂級公鏈到Web3.0基礎設施:帶你了解不一樣的Flow

    對于大部分年輕人來說,剛剛過去的春節(jié)有一個詞語突然成為了品牌宣傳的流行語,作為從NFT中衍生出來的“數字藏品”一時間獲得了不少品牌青睞,他們紛紛推出自己的數
  • 多地釋放積極信號,元宇宙正成為地方爭先競逐的主戰(zhàn)場?

    2月21日,2022中國·金魚嘴元宇宙生態(tài)賦能大會在南京建鄴區(qū)金魚嘴基金街區(qū)舉辦,南京建鄴區(qū)金魚嘴基金街區(qū)宣布計劃出資1億元,支持元宇宙行業(yè)發(fā)展。同時,會上發(fā)布了
  • 美國單曲排行榜Billboard和World of Women合作推出NFT雜志封面

    今天,Billboard宣布與流行的NFT頭像集World of Women(WoW)建立新的伙伴關系,向NFT生態(tài)系統(tǒng)又邁進了一步。在這次合作中,WoW的創(chuàng)建者Yam Karkai將幫助這個音樂行業(yè)巨
  • 以太坊面臨來自Fantom的巨大挑戰(zhàn)

    眾所周知,區(qū)塊鏈和加密貨幣項目經常因其對環(huán)境的影響而受到批評。但是有一個非營利性的加密貨幣和區(qū)塊鏈項目說它比其他的更環(huán)保。今天老雅痞就給大家聊一聊加
  • 元宇宙+劇本殺:“在異世界里當演員”

    你玩過劇本殺嗎?體驗過“元宇宙+劇本殺”嗎?2月,恒信東方推出了一款次時代劇本殺原創(chuàng)作品——《失落的王朝》。其劇本和線索以數字化資產打造,通過VR技術塑造了與
Top