News

商湯科技日日新SenseNova 4.0發布 強大代碼生成力全新AI體驗

  •  
  •  
  •  

商湯科技正式發布「日日新SenseNova 4.0」,全面升級大模型體系。「日日新SenseNova 4.0」擁有更全面的知識覆蓋、更可靠的推理能力、更優越的長文本理解能力、及更穩定的數字推理能⼒,以及更強的代碼生成能力,同時支持跨模態交互。日日新·商量大語言模型-通用版本 (SenseChat V4),支持128K語境窗口長度,綜合整體評測成績水平媲美GPT 4,更全面超越GPT 3.5。

商湯亦推出支援不同模態工具調用的日日新·商量大語言模型Function call & Assistants API版本,為先進的大模型與各類應用服務工具的連接提供便利橋梁,顯著降低開發者使用大模型的門檻。商湯也將先進的大模型能力轉化為落地實際場景的產品應用,基於最新發布的日日新·商量大語言模型Function call & Assistants API完成開發並正式發佈數據分析工具「辦公小浣熊」。

目前,憑借豐富的AI技術能力,商湯「日日新Sense Nova」大模型體系以低成本、高效率打通了各類AI應用,提供包括面向辦公場景的商湯日日新·商量語言大模型-數據分析版本、面向醫療場景的日日新·商量語言大模型-醫療版本「大醫」、 面向自動駕駛及工業場景的日日新·商量多模態大模型,以及面向創作創意場景的日日新·秒畫文生圖大模型等豐富的工具。

商湯「日日新·商量大語言模型」在金融、手機、醫療、汽車、地產、能源、傳媒、工業製造等眾多垂直行業,已與超過500家客戶建立深度合作,加速行業企業的智能化轉型。

接下來,商湯「日日新SenseNova」大模型體系及相關產品和工具為實現通用人工智能(AGI)提供了精准著力點,助力全場景、多產業實現「大模型+」,拓寬大模型應用邊界。

「日日新SenseNova 4.0」提供了多種靈活的API接口和服務,開發人員可以根據實際應用需要,輕鬆地調用日日新SenseNova大模型的各項AI技術能力,以更低成本、更高效率實現各類AI應用。

大模型性能提升的基礎,在於語言建模能力的增強。「日日新SenseNova4.0」全新升級日日新·商量大語言模型-通用版本 (SenseChat V4),目前支持4k、32k、128k tokens不同窗口,拓展了模型應用範圍。SenseChat V4 顯著提升了在知識理解、閱讀理解、綜合推理、數理、代碼和長文本理解等領域的通用能力,綜合整體評測成績水平媲美GPT-4 ,其中推理和代碼編程的測評表現更是超越了GPT-4。於權威測試集HumanEval Coding的測試中,一次通過率達到75.6% (GPT-4此項數據為74.4%)。

基於大模型評測平台OpenCompass全集測試,日日新·商量大語言模型SenseChat V4,綜合整體評測成績水平媲美GPT-4

商湯日日新·商量語言大模型-數據分析版本 (SenseChat-DataAnalysis V4) 正式發布,在數據分析場景下的數據測試集 (1000+題目) 中以85.71%的正確率超過GPT-4,支持複雜表格、多表格、多文件的理解,實現數據清洗、數據運算、比較分析、趨勢分析,預測性分析、可視化等常見數據分析任務,賦能財務分析、商業分析、銷售預測、市場分析、宏觀分析等多個應用場景。

商湯推出的日日新·商量語言大模型-醫療版本:「大醫」(SenseChat-Medical V4),在本次更新中實現了更強的多輪對話與上下文理解能力,以及更豐富的工具調用能力,有效實現專業醫學問答及複雜醫學任務推理,並支持更多模態醫學文件的智能解讀和交互問答。「大醫」在兩項行業權威評測——「2023年職業藥劑師考試大模型評測」和「中文醫療大語言模型開放評測平台MedBench」中,綜合評分排名第二,性能逼近GPT-4,其中職業藥劑師考試大模型評測中的兩個細分方向性能已超越GPT-4。

2023年職業藥劑師考試大模型評測結果,「大醫」綜合評分排名第二,並在兩個細分方向上性能超越GPT-4
覆蓋13個醫學場景的大醫Web端展示頁面

多模態是人工智能大模型重要的技術演進方向,日日新·商量多模態大模型(SenseChat-Vision V4)全新推出,其擁有300億參數,圖文理解能力處於全球領先水平,在權威評測基準測試集MME Benchmark上綜合得分排名首位,綜合得分達2199.5(超過GPT-4V的1926.57),已在智能駕駛、智能車艙、電力行業等多個實際場景落地應用,助力千行百業的產業升級。

多模態大模型權威綜合基準測試MME Benchmark可以從定位、名人識別、景點識別、OCR、數學計算等14個維度來系統綜合評測模型的能力。
日日新·商量圖文多模態大模型可回答交通場景中圖文內容理解等複雜任務

商湯自研的日日新-秒畫文生圖大模型(SenseMirage V4)較此前版本,參數量提升至百億量級,通過Mixture of text experts、Spatial-aware CFG等算法優化,語義理解能力與圖像質感細節表現顯著增強,海報生成水平可達到電影級。同時結合Adversarial Distillation算法,秒畫SenseMirage-Turbo加速版也正式對外發布,相較於基礎版本,可達到10倍推理加速效果。

秒畫SenseMirage 4.0全新升級,電影級圖片一鍵生成

大模型的能力前沿且豐富,為讓更多開發人員及相關行業更便捷、高效地用好大模型,商湯推出日日新·商量大語言模型Function call & Assistants API 版本

日日新·商量大語言模型Function call & Assistants API 版本為開發人員提供一個靈活、高度可定制的工具調用框架,提供了聯網搜索、代碼解釋、圖文問答及文生圖等多種工具調用,支持商湯日日新大模型體系,賦能多行業場景應用。  

與其他同類產品相比,日日新·商量大語言模型Function call & Assistants API 版本率先支持不同模態的工具調用,能夠支持圖文結合的多模態交互和數據分析代碼執行結果的直觀呈現,從而解決更加複雜的問題,讓各種應用程序中集成AI功能變得更加簡單和高效。

大模型的出現帶來了人機交互範式的巨大轉換,依託商湯「日日新Sensenova」能力的快速迭代,小浣熊家族再添新成員——數據分析工具 「辦公小浣熊」,重塑大模型時代的應用產品形態。

辦公小浣熊是一款無需編程或複雜操作即可使用的數據分析工具。通過自然語言輸入,辦公小浣熊結合商湯大模型體系的意圖識別、邏輯理解、代碼生成能力,自動將數據轉化為有意義的分析結果和可視化圖表。得益於商湯大模型體系的強大中文理解能力,該產品更適應中國的數據分析需求。

辦公小浣熊演示頁面:輸入表格,輕鬆獲取分析報告。

產品形態的出現是大模型技術落地應用的嘗試之一,自2023年4月10日商湯「日日新SenseNova」問世以來,企業用戶超過3000家,覆蓋行業包括互聯網、遊戲、文旅、教育、醫療健康、金融和編程等。

商湯始終推動降低大模型使用門檻,拓展人工智能落地場景,讓大模型真正在行業里用起來,未來將持續推進「日日新SenseNova」大模型體系建設,實現創新場景應用,不斷推動大模型前置化,讓更多智能走向更多場景、更多行業,攜手行業生態邁向AGI時代。


  •  
  •  
  •  

benny

Benny Yeung ~ 企業IT傳媒人,經常四周穿梭科技巨企及論壇,熱愛探討新商機。性格貪玩,但喜歡閱讀沉悶的企業賺蝕數字,最重視辦事效率。