6 月 7 日消息,研究人員正在嘗試使用 AI 來解讀狗的叫聲是在玩耍還是在生氣。與此同時,研究人員還嘗試使用 AI 識別狗的年齡、性別和品種。
密歇根大學(xué)的研究人員與位于普埃布拉的墨西哥國家天體物理、光學(xué)和電子研究所(INAOE)合作開展了這一研究,發(fā)現(xiàn)最初用于訓(xùn)練人類語音的 AI 模型可以作為訓(xùn)練動物交流模型的起點。
密歇根大學(xué)人工智能實驗室負責(zé)人 Rada Mihalcea 表示,人工智能在理解語音的微妙之處方面有了顯著進步,可以區(qū)分音調(diào)、音調(diào)和口音的細微差別,可憑借這些研究基礎(chǔ)來理解狗吠。
開發(fā)這種分析動物發(fā)聲 AI 模型的主要障礙之一,是缺乏公開可用的數(shù)據(jù)。雖然有許多資源和機會來記錄人類的語音,但從動物身上收集數(shù)據(jù)更加困難。
團隊嘗試使用采集人類語音數(shù)據(jù)的方式來采集狗的叫聲信息,各種情況下收集了 74 只不同品種、年齡和性別狗狗的吠叫、咆哮和嗚嗚聲。
團隊將采集到的這些聲音信息用于分析人類語音的機器模型中,模型可以很好地理解狗之間的交流,模型在各種測試中準確率達到 70%。
Rada Mihalcea 表示,“來自人類語音的聲音和模式可以作為分析和理解其他聲音(如動物發(fā)聲)的聲學(xué)模式的基礎(chǔ)”。團隊其他研究人員也表示,更好地了解動物發(fā)出各種聲音的細微差別,可以改善人類對其情感和身體需求的解釋和反應(yīng)。
據(jù)悉實驗結(jié)果在 2024 年計算語言學(xué)、語言資源與評估國際聯(lián)合會議進行了展示。附論文鏈接:
https://arxiv.org/pdf/2404.18739
本文鏈接:http://www.tebozhan.com/showinfo-45-4569-0.html準確率可達 70%,科學(xué)家利用 AI 解讀狗的叫聲
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com