8 月 26 日消息,云知聲于 23 日宣布推出山海多模態大模型。
通過整合跨模態信息,山海多模態大模型能夠接收文本、音頻、圖像等多種形式作為輸入,并實時生成文本、音頻和圖像的任意組合輸出。
獲悉,山海多模態大模型有如下特點:
實時秒回,自由插話:與現實對話中人類的響應時間相似;支持對話隨時打斷,用戶可在對話中任意插話
感知情緒,表達情緒:通過語音文本判斷用戶情緒,還能捕捉用戶語音的語氣、節奏和音調等微妙變化,感知對方情緒狀態
音色自由切換:根據用戶的個性化需求,自由切換音色;學習用戶的音色、風格,復刻用戶聲音
視覺場景理解:“看見”周圍環境,結合圖像和文字,提供易于理解的總結
圖像生成,構筑個性藝術:根據用戶指令創建視覺內容,提供符合個性化需求的定制畫面
本文鏈接:http://www.tebozhan.com/showinfo-45-6498-0.html云知聲推出山海多模態大模型:實時生成文本、音頻和圖像
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com