商湯科技在近期舉辦的2025技術交流日活動中,震撼發布了其全新迭代的大模型體系——“日日新SenseNova V6”(簡稱:日日新V6)。據商湯科技透露,該體系通過多模態長思維鏈訓練、全局記憶技術和強化學習的革新性突破,成功構建了業界領先的多模態推理能力,并有效降低了成本。
日日新V6的多模態訓練效率與語言訓練相當,均達到了業內的最優水平,推理成本亦是如此。尤為其推出的輕量級全模態交互模型SenseNova V6 Omni,在國內多模態交互領域樹立了新的標桿。日日新V6還涵蓋了國內首個能夠深度解析10分鐘中長視頻的大模型,其性能與Gemini 2.5 Turbo不相上下,堪稱同類最強。
商湯科技董事長兼首席執行官徐立表示:“AI的價值,在于其在日常生活中的廣泛應用。商湯的日日新V6將跨越多模態的界限,探索推理與智能的無限潛能。”
在復雜的文檔處理場景中,日日新V6憑借其強大的多模態推理能力,為用戶提供了高效的解決方案。以保險理賠為例,該模型能夠迅速分析理賠材料,判斷其是否符合要求,并準確識別出材料缺失、亂開藥或亂檢查等問題。
對于小額理賠而言,盡管金額不大,但處理流程往往繁瑣且耗時(3-7天)。而日日新V6則能夠自主檢測風險提示,進行交叉驗證,最終為用戶提供詳盡、多維的結論,從而實現了從模型到客戶使用的無縫對接。
商湯科技在多模態強化學習方面取得了重大突破,構建了面向多種圖文任務的混合增強學習框架。該框架基于不同難度分級和多獎勵模型的強化學習訓練,極大地提升了模型的性能。
憑借“全局記憶”技術,日日新V6打破了傳統模型對短視頻的限制,能夠支持10分鐘級視頻的全幀率解析。用戶不僅可以獲得視頻的精彩內容智能剪輯,還能保留住珍貴的瞬間。
對于游戲玩家而言,日日新V6同樣具備強大的吸引力。它能夠理解游戲錄屏中的精彩內容和值得記錄的時刻,并剪輯出高光時刻。同時,用戶還可以自定義生成解說文案,分享游玩經驗和精彩操作。
商湯科技自研的技術能夠將視覺、聽覺和語言信息以及時間軸邏輯進行對齊,形成多模態統一時序表征。通過細粒度級聯信息壓縮和內容敏感的動態過濾,實現了長視頻的高比例壓縮,10分鐘視頻可以壓縮到16K tokens,同時保留關鍵語義。
隨著日日新SenseNova V6的發布,商湯科技的實時交互融合大模型也升級至SenseNova V6 Omni。該模型在角色扮演、翻譯點讀、文旅導游、講解繪本、數學講解等多個場景下進行了深度優化。以翻譯點讀為例,SenseNova V6 Omni能夠讓用戶通過手指實現精準的空間交互,并理解局部與全局信息的關系。
SenseNova V6 Omni擁有更加人性化的感知和表達能力,以及情感理解能力,已在具身智能等多個領域實現了多行業、多場景的落地應用。整合日日新SenseNova V6的全部能力,商湯科技還推出了全新的商量APP。用戶只需通過一個入口,即可享受文字、圖像、視頻等多種模態的流式交互體驗。
本文鏈接:http://www.tebozhan.com/showinfo-45-12164-0.html商湯發布日日新V6大模型,對標OpenAI,解鎖10分鐘視頻全幀率解析
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com