阿里巴巴通義實驗室宣布開源R1-Omni模型,該模型能識別影片中人物情緒。R1-Omni是HumanOmni的升級版,具備更強的推理和理解能力。
通過詳細分析人物的衣著、發(fā)型、臉部表情、談話內容和語調,R1-Omni能預測角色傳達的最明顯情緒。
這是通義首次將強化學習與可驗證獎勵機制應用于多模態(tài)大型語言模型。
研究人員利用該技術優(yōu)化R1-Omni的推理能力、情緒識別準確度及泛化能力,使其在處理新數(shù)據(jù)時仍能保持良好表現(xiàn)。目前,R1-Omni已在Hugging Face上開放免費下載。
阿里巴巴加速在AI領域的布局,此前已與深度求索進行基準測試,并與蘋果達成合作。阿里巴巴集團CEO吳泳銘表示,通用人工智能是首要目標,而讓AI具備情商是邁向該目標的關鍵一步。
本文鏈接:http://www.tebozhan.com/showinfo-27-136669-0.html阿里巴巴開源R1-Omni AI模型,具備更強的推理和理解能力
聲明:本網(wǎng)頁內容旨在傳播知識,若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com