6 月 27 日消息,科技媒體 NeoWin 今天(6 月 27 日)發布博文,報道稱在 2025 年 I/O 開發者大會上預覽發布后,谷歌已正式推出 Gemma 3n 端側多模態模型,支持在手機、平板和筆記本電腦上本地運行,處理音頻、文本、圖片和視頻多種數據類型。
相比較 5 月發布的預覽版,最新發布的 Gemma 3n 完整版進一步提升性能表現,支持在 2GB 內存的硬件上本地運行,重點提升了編碼和推理方面的能力。
援引博文介紹,Gemma 3n 共有兩種規模版本,其中 E2B 共有 50 億(5B)參數,支持在 2GB 以上內存設備上運行;E4B 共有 80 億(8B)參數,支持在 3GB 以上內存設備上運行,兩者通過架構創新,內存占用相當于 20 億(2B)和 40 億(4B)模型。
在架構方面,Gemma 3n 創新采用 MatFormer 架構,來提供計算靈活性,此外使用 Per Layer Embeddings(PLE)以提升內存效率、MobileNet-v5 視覺編碼器等等。
對于 MatFormer 架構,谷歌用一個俄羅斯套娃的比喻來描述:一個較大模型內部包含一個較小但完全功能的版本,讓單一模型能夠根據不同任務以不同大小運行。
Gemma 3n 在多語言(支持 140 種語言的文本和 35 種語言的多模態理解)、數學、編碼和推理方面都實現了質量提升。
在性能基準方面,較大的 E4B 模型是首個參數量低于 10B 但 LMArena 得分超過 1300 的模型。
模型的音頻能力現在支持設備上的語音轉文本和翻譯,使用一個能夠處理細致語音的編碼器。
視覺方面則由一個名為 MobileNet-V5 的新編碼器提供動力,比前代更快、更高效。它能在 Google Pixel 設備上以最高 60FPS 處理視頻。
本文鏈接:http://www.tebozhan.com/showinfo-45-14211-0.html谷歌正式發布 Gemma 3n 小鋼炮模型:2GB 內存本地玩轉 AI 多模態
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com