7 月 5 日消息,在 2024 世界人工智能大會(WAIC 2024)上,嗶哩嗶哩(以下簡稱“B站”)公布了多項自主研發的 AI 技術成果和 AIGC 多元創意,包括最新定制的 AI 語音聲庫、自研音視頻大模型必剪 Studio 以及自研 AI 動態漫技術等。
此外,B站自研的大語言模型系列也在此次 WAIC 2024 大會上首次展出,包括開源的 Index-1.9B chat 和 Index-1.9B character 兩個模型。
查詢 GitHub 獲悉,Index-1.9B 系列模型于 6 月開源,包含基座模型、對照組、對話模型、角色扮演模型:
Index-1.9B base: 基座模型,具有 19 億非詞嵌入參數量,在 2.8T 中英文為主的語料上預訓練,多個評測基準上與同級別模型比處于領先
Index-1.9B pure: 基座模型的對照組,與 base 具有相同的參數和訓練策略,不同之處在于過濾了該版本語料中所有指令相關的數據,以此來驗證指令對 benchmark 的影響
Index-1.9B chat: 基于 index-1.9B base 通過 SFT 和 DPO 對齊后的對話模型
Index-1.9B character: 在 SFT 和 DPO 的基礎上引入了 RAG 來實現 fewshots 角色扮演定制
在B站 15 周年演講上,B站董事長兼 CEO 陳睿表示,2023 年,B站 AI 相關內容的日均視頻播放量同比增長超過 80%,爆款內容涵蓋科普資訊、AI 技術應用、數字人和創意應用等領域。
根據B站透露的數據,當前超過 8000 萬用戶每月在B站觀看 AI 相關的視頻,其中 6 成為 00 后。
Index-1.9B 系列模型開源地址:
https://github.com/bilibili/Index-1.9B
本文鏈接:http://www.tebozhan.com/showinfo-45-4989-0.htmlB站亮相 2024 世界人工智能大會,首次展出自研大語言模型
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com