AVt天堂网 手机版,亚洲va久久久噜噜噜久久4399,天天综合亚洲色在线精品,亚洲一级Av无码毛片久久精品

當前位置:首頁 > 元宇宙 > AI

谷歌 DeepMind 發布 WebLI-100B:千億級數據集解鎖 AI 視覺語言模型的文化多樣性

來源: 責編: 時間:2025-02-16 08:41:35 71觀看
導讀 2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發布博文,報道稱谷歌 DeepMind 團隊發布了 WebLI-100B 千億級數據集,并通過增強文化多樣性和多語言性,以及減少子組之間的性能差異來提高包容性。目前挑戰注

2 月 14 日消息,科技媒體 marktechpost 昨日(2 月 13 日)發布博文,報道稱谷歌 DeepMind 團隊發布了 WebLI-100B 千億級數據集,并通過增強文化多樣性和多語言性,以及減少子組之間的性能差異來提高包容性。ate28資訊網——每日最新資訊28at.com

目前挑戰

注:機器通過學習大型數據集來連接圖像和文本,數據越多,模型識別模式和提高準確性的能力就越強。視覺語言模型 (VLMs) 依賴這些數據集執行圖像字幕和視覺問答等任務。ate28資訊網——每日最新資訊28at.com

視覺語言模型目前依賴于 Conceptual Captions 和 LAION 等大型數據集,包含數百萬到數十億的圖像-文本對。這些數據集支持零樣本分類和圖像字幕生成,但其發展已放緩至約 100 億對。ate28資訊網——每日最新資訊28at.com

這種限制降低了進一步提高模型精度、包容性和多語言理解的前景,現有方法基于網絡爬取的數據,存在樣本質量低、語言偏差和多元文化代表性不足等問題。ate28資訊網——每日最新資訊28at.com

WebLI-100B 千億級數據集

Google DeepMind 的研究人員為了緩解視覺語言模型在文化多樣性和多語言性方面的局限性,提出了 WebLI-100B 數據集,該數據集包含 1000 億個圖像-文本對,比之前的數據集大十倍。ate28資訊網——每日最新資訊28at.com

該數據集捕獲了罕見的文化概念,并提高了模型在低資源語言和多樣化表示等較少探索領域的性能。與先前的數據集不同,WebLI-100B 不是依賴嚴格的過濾(通常會刪除重要的文化細節),而是專注于擴展數據。ate28資訊網——每日最新資訊28at.com

該框架涉及在 WebLI-100B 數據集的不同子集(1B、10B 和 100B)上預訓練模型,以分析數據縮放的影響。ate28資訊網——每日最新資訊28at.com

在完整數據集上訓練的模型在文化和多語言任務中的表現優于在較小數據集上訓練的模型,即使使用相同的計算資源。該數據集沒有進行激進的過濾,而是保留了語言和文化元素的廣泛代表性,使其更具包容性。ate28資訊網——每日最新資訊28at.com

研究結果表明,將數據集大小從 10B 增加到 100B 對以西方為中心的基準測試的影響很小,但在文化多樣性任務和低資源語言檢索方面帶來了改進。ate28資訊網——每日最新資訊28at.com

本文鏈接:http://www.tebozhan.com/showinfo-45-10809-0.html谷歌 DeepMind 發布 WebLI-100B:千億級數據集解鎖 AI 視覺語言模型的文化多樣性

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 兩輪電動車行業首個,九號將深度融合 DeepSeek 大模型

下一篇: 英國政府同 Anthropic 深化合作:Claude 有望增強該國公共服務能力

標簽:
  • 熱門焦點
  • 一份全面清單:Web3行業高薪酬的13種工作

    來源:區塊鏈騎士這可能會讓許多人感到震驚,但除了成為開發人員之外,Web3還有其他高薪工作。Web3可能是現代就業市場中跨學科最多的領域,換句話說,它由許多個在不同領域中具有不同
  • 文心一言排名墊底,卻成為百度業績增長杠桿

    文/侯煜編輯/羅卿知識增強大預言模式文心一言發布后,百度公司熱度大幅提升,文心一言到底能為百度的業績帶來多大的增益成為業內關注焦點。近日,百度(NASDAQ:BIDU/09888.HK)公布了
  • 花房集團上市,走向元宇宙新征程

    文 | 港股研究社作者 | 熊生12月12日,花房集團在港交所成功上市,首日便受到追捧,當日最高漲幅達28.75%。繼360、360數科、魯大師后,這是“紅衣教主”周
  • 星展銀行(DBS)計劃推出零售數字資產交易服務

    2月14日消息,新加坡星展銀行CEO Piyush Gupta在財報會議上表示,計劃于2022年年底前推出零售數字資產交易服務。據悉,DBS于2021年初開設了機構數字資產交易平臺,全
  • 以太坊倫敦升級后,隨之生效的以太坊EIP-1559是什么?

    作者:三黎過去的一年里,除了 BTC 一如既往穩坐王位,DEFI 則是貫穿一整年的狂歡熱點。 DeFi 在讓 ETH 實現價值增長的同時,也使得其網絡日漸擁堵、交易費用增高,成為
  • 獨立故事片“Calladita”將使用 NFT 籌集資金

    導演 Miguel Faus 正在轉向加密來資助他的處女作,由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”(導演 Miguel Faus)。圖片:米格爾·福斯在過去的一年
  • 冬奧會數字收藏品升溫,市場再現“一墩難求”

    根據公開信息顯示,國際奧委會官方授權的冰墩墩數字盲盒于北京時間2月12日凌晨在nWayPlay平臺發售,總數為500個,每個99美元,每人限購5個。此外,不同的奧運徽章數字藏
  • 從NFT數字收藏,洞察數字音樂版權市場發展趨勢

    去年8月9日,騰訊音樂布局NFT數字收藏,在騰訊應用寶發布幻核app,騰訊音樂的提前布局示意著未來區塊鏈技術將對數字音樂版權市場進行改造升級。作者從深層測分析為
  • 全球十大元宇宙概念游戲

    A股市場中,不少游戲公司早早搭上了元宇宙概念。舉例,中青寶宣稱將發布一款元宇宙概念的模擬經營類游戲,盡管游戲尚在研發中,這一消息已經讓中青寶的股價在51個交易
Top