News

商湯「日日新V6」多模態能力強成本低

  •  
  •  
  •  

商湯科技SenseTime在上海、深圳等多地舉辦2025技術交流日活動,重磅推出全新升級的「日日新SenseNova V6」(日日新V6)大模型體系,通過多模態長思維鏈訓練、全局記憶、強化學習的技術突破,形成領先的多模態推理能力,並突破成本邊界。

「日日新V6」模型能力顯著提升,在長思維鏈、推理、數理、全局記憶方面擁有顯著優勢,多模態推理能力國內第一,對標OpenAI o1,數據分析能力大幅領先GPT-4o。同時,其高效能與低成本完美結合:多模態訓練整體效率對齊語言訓練實現業內最低、推理成本均實現業界最低;全新的輕量級全模態交互模型SenseNova V6 Omni帶來了國内最強的多模態交互能力;涵蓋國内首個支持10分鐘中長視頻深度解析的大模型,對標Gemini 2.5 Turbo,達同類型最強。

日日新SenseNova特點

商湯科技董事長兼首席執行官徐立表示:「 AI之道,在於百姓之日用。商湯日日新V6已跨越多模態邊界,釋放推理與智能的無限可能。」

商湯科技董事長兼首席執行官徐立表示:「 AI之道,在於百姓之日用。」

多模態長思維鏈、強化學習、全局記憶,日日新V6率先實現多模態下深度思考

作為擁有超6,000億參數的混合專家架構(MoE)原生多模態通用大模型,「日日新 V6」實現了多項技術突破,憑藉單一模型就可以完成文本、多模態等各類任務:

Ÿ 長思維鏈:超過 200B 高質量多模態長思維鏈數據,最長64K思維鏈;

Ÿ 數理能力:數據分析能力大幅領先GPT-4o;

Ÿ 推理能力:多模態深度推理國内第一,對標OpenAI o1;

Ÿ 全局記憶:率先在國内突破長視頻理解,支持10分鐘的視頻理解及深度推理。

日日新SenseNova V6 參數

在權威的推理能力及多模態能力評測中,「日日新 V6」在多個維度獲得SOTA (State-of-the-Art):

【核心指標】純文本任務綜合性能優秀,比肩國際一線模型;多模態性能領先,各方面性能突出;純文本推理與多模態推理能力均對標GPT-4.5和Gemini 2.0 Pro等國際一流模型的水平
【強推理能力】日日新融合模型從 5.5 到 V6 / V6 Reasoner,推理能力顯著提升。在獨立評測中,多模態和語言深度推理任務上同時超過了OpenAI的o1和Gemini 2.0 flash-thinking的水平

基於超過200B高質量多模態長思維鏈數據,商湯通過多智能體協作進行長思維鏈合成和驗證,「日日新 V6」形成了突出的多模態推理能力,可以支持合成最長64K的多模態長思維鏈,支持模型長時間思考能力。

針對真實環境存在的複雜問題,「日日新 V6」強大的混合圖文理解推理能力,能夠幫助用戶解決各類問題。

在複雜文檔繁瑣的文檔處理場景中,「日日新 V6」同樣能夠以多模態強推理能力解決用戶難題,可於商湯辦公小浣熊體驗:點擊此處

以保險理賠場景為例,「日日新 V6」可根據商業醫療保險理賠材料,判斷提供材料是否符合理賠要求,檢查是否存在亂開藥、亂檢查、材料缺失或者材料不齊等問題。

小額理賠雖然金額小但往往耗費時間長(3-7天),而交予「日日新 V6」,它能自主檢測到風險提示,自主進行交叉驗證,最後再給予用戶非常細緻、多維的結論,完成模型到客戶使用的最後一公里

得益於多模態強化學習的突破,商湯構建了面向多種圖文任務的混合增強學習框架,基於不同難度分級和多獎勵模型的強化學習訓練。

國内率先於視頻理解打破10分鐘限制,超長內容實現秒級推理拆解

憑藉「全局記憶」能力,「日日新 V6」打破了傳統模型僅支持短視頻的限制,可支持10分鐘級視頻全幀率解析。

基於強大的理解能力,「日日新 V6」還可以對視頻的精彩內容進行智能剪輯輸出,幫助用戶保留珍貴瞬間。

針對一段《黑神話》遊戲錄屏,遊戲玩家可將日常積累的遊戲錄製、實況,輸入「日日新 V6」理解精彩內容和值得記錄的時間,剪輯出高光時刻,同時可自定義生成解說文案,幫助分享遊玩經驗和遊戲內的精彩操作

商湯自研技術可將視覺信息(畫面)、聽覺信息(語音、音效)、語言信息(字幕、口語)、時間軸邏輯對齊,形成多模態統一時序表徵。在此基礎上,通過細粒度級聯信息壓縮和內容敏感的動態過濾,實現長視頻的高比例壓縮,10分鐘視頻可以壓縮到16K tokens,仍然保留關鍵語義。

真正像人一樣交互,「SenseNova V6 Omni」發佈即實現多行業落地

伴隨日日新SenseNova V6的發佈,商湯日日新實時交互融合大模型升級至「SenseNova V6 Omni」,在角色扮演、翻譯點讀、文旅導遊、講解繪本、數學講解等場景下進行了深度優化。

「SenseNova V6 Omni」讓用戶通過手指就能實現精準位置的空間交互

以翻譯點讀場景為例,「SenseNova V6 Omni」讓用戶通過手指就能實現精準位置的空間交互,並精準理解局部信息與全局信息的關係,帶來更符合人類自然直觀的指讀交互體驗。

「SenseNova V6 Omni」擁有更像人的感知和表達能力、情感理解能力,並已在具身智能等領域實現多行業、多場景落地,成為國内首個商業化的全模態實時交互模型。

整合「日日新SenseNova V6」全部能力,商湯商量也迎來全面升級,並推出全新商量APP。用戶通過一個入口,即可體驗文字、圖像、視頻等多種模態流式交互體驗。

商量APP已啟動內測,「日日新 V6」目前可於商量Web端體驗請:點擊此處

商湯科技還宣布投入人民幣1億元專項補貼,聚焦具身智能、AIGC等多個前沿領域,通過多維度的精準扶持,為企業提供從專家諮詢到模型訓練、推理驗證的全流程AI服務支持,打造「高效率、低成本、端到端」的一站式賦能方案。


  •  
  •  
  •