5 月 30 日消息,俄羅斯搜索引擎巨頭 Yandex 昨日發(fā)布了世界上最大的音樂推薦系統(tǒng)開源數(shù)據(jù)集 Yambda,包含 47.9 億條匿名用戶的交互數(shù)據(jù),旨在幫助開發(fā)者創(chuàng)建智能音樂服務。
Yandex 在十個月內(nèi)收集了近 2800 萬 Yandex Music 月度用戶的數(shù)據(jù),具體為用戶與 939 萬首歌曲的 47.9 億次交互,數(shù)據(jù)集包括聽眾對歌曲好惡的關鍵反饋,所有交互都帶有時間戳以提高準確度。
Yambda 在 Hugging Face 提供三種大小的數(shù)據(jù)集供自由下載:Yambda-5B(來自 100 萬名用戶的行為)、Yambda-500M(10 萬用戶)和 Yambda-50M(1 萬用戶)。其中規(guī)模最大的5B 數(shù)據(jù)集至少需要 85 GB 存儲空間。
數(shù)據(jù)集包含音樂聽眾的偏好信息,以 Apache Parquet 格式存儲,可用作研究用途或開發(fā)類似 Spotify 等流媒體服務提供的 AI 音樂推薦功能。
據(jù)了解,Spotify 和 Tidal 等流媒體服務通常不會發(fā)布其音樂推薦算法的代碼或模型,因為推薦聽眾喜愛歌曲的能力被視為其成功的商業(yè)秘密。
本文鏈接:http://www.tebozhan.com/showinfo-45-13294-0.htmlYandex 發(fā)布最大音樂推薦開源數(shù)據(jù)集 Yambda
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com