7 月 5 日消息,商湯科技發布“日日新 SenseNova 5.5”大模型體系,并發布國內首個所見即所得模型“日日新 5o”,交互效果對標 GPT-4o。
通過整合跨模態信息,基于聲音、文本、圖像和視頻等多種形式,“日日新 5o”帶來全新的 AI 交互模式 —— 實時的流式多模態交互。
據介紹,“日日新 5o”能聽、會看、更會找話題,就如同“真人聊天一般”,這種交互模式適用于實時對話和語音識別等應用,能夠在同一模型中自然處理多種任務,且根據不同上下文自適應調整行為和輸出。
日日新 5.5 是國內首個正式發布的流式原生多模態交互模型,模型訓練基于超過 10TB tokens 高質量訓練數據,包括大量高質量的人工合成數據,構建了高階思維鏈。模型采用混合端云協同架構,擁有 6000 億參數,可最大限度發揮云邊端協同,達到 109.5 字 / 秒的推理速度。
據此前報道,商湯科技在世界人工智能大會上還發布了首個“可控”人物視頻生成大模型 Vimi,通過一張任意風格的照片就能生成和目標動作一致的人物類視頻,并支持多種驅動方式,可通過已有人物視頻、動畫、聲音、文字等多種元素進行驅動。
本文鏈接:http://www.tebozhan.com/showinfo-45-4988-0.html交互效果對標 GPT-4o,商湯發布國內首個所見即所得模型“日日新 5o”
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com