News

AWS全新企業專屬模型Nova Forge服務及AI代理Nova Act

  •  
  •  
  •  

在Amazon Web Services(AWS)2025 re:Invent全球大會上,亞馬遜宣布擴展Nova產品組合:推出四款全新模型、一項開創性的「開放式訓練」服務 (支援企業基於Nova構建專屬的頂尖模型變體),以及一項用於創建高可靠性AI Agent的新服務。

目前,數以萬計的企業已經在使用Nova來支援多種應用場景,例如生產高質素內容、將多步驟任務自動化以及加速AI Agent的研發。亞馬遜全新的Nova 2模型系列在多個 AI領域實現了速度、成本與智能水平的均衡:

Nova 2 Lite是一款為日常工作負載而設的快速、經濟型推理模型,能夠處理文字、圖像和影片輸入並生成文字輸出。客戶可以根據需求調節模型在回答前進行「思考」的深度,在智能程度與響應速度、成本之間靈活平衡,是客戶服務聊天機器人、文件處理和業務流程自動化等場景的理想選擇。

在同級模型中,Nova 2 Lite憑藉性價比表現領先業界:與Claude Haiku 4.5相比,它在15項基準測試中有13項持平或更佳;與GPT-5 Mini相比,在17項基準測試中,有11項持平或更佳;與Gemini Flash 2.5相比,在18項基準測試中有14項持平或更佳。Nova 2 Lite在以下能力上尤其突出:處理各類文件、從影片中提取關鍵資訊、生成程式碼、提供準確的基於事實的回答,以及自動化執行多步驟的AI Agent工作流程。

Nova 2 Lite與其他AI模型的比較。

Nova 2 Pro是亞馬遜最智能的推理模型,能夠處理文字、圖像、影片和語音輸入,並生成文字輸出。它非常適合用於需要最高準確率的高度複雜任務,如agentic coding、長期規劃以及複雜問題求解。該模型還可以作為「教師模型」,透過知識蒸餾將自身能力轉移到更小、更高效的「學生模型」上,用於特定垂直領域和應用場景。在公開基準測試中,Nova 2 Pro表現出色:與Claude Sonnet 4.5對比,在16項評測中有10項持平或更佳;與GPT-5.1的16 項評測中有8項持平或更佳;與 Gemini 2.5 Pro 的 19項評測中有15項持平或更佳;與Gemini 3 Pro Preview 的18項評測中有8項持平或更佳。Nova 2 Pro在多文件分析、影片推理、複雜指令執行、高階數學問題解答,以及執行 AI Agent與軟件工程任務等方面表現出眾。

Nova 2 Pro與其他AI模型的比較。

Nova 2 Lite和Nova 2 Pro均內置網頁查找和程式碼執行能力,可以根據需要搜尋最新的互聯網資訊並直接運行程式碼,從而確保模型的回答始終基於最新事實,而不僅僅依賴訓練數據。

Nova 2 Sonic是亞馬遜的端到端語音模型,將文字與語音的理解與生成深度融合,實現了實時、類人對話式 AI 體驗。該模型支援更多語言和富有表現力的音色,具備更高識別準確率,並提供高達100萬tokens的上下文窗口,能夠支援長時互動,並在語音與文字之間無縫切換。模型可以異步處理任務:用戶在繼續自然對話、甚至切換話題的同時,系統仍可在後台完成諸如訂票等操作。

Nova 2 Sonic還能與Amazon Connect、第三方語音服務供應商(如 Vonage、Twilio、AudioCodes)以及對話式AI框架(如 LiveKit、Pipecat)無縫整合,使其成為客戶服務、AI 助理和互動語音體驗的理想選擇。與透過實時API提供服務的OpenAI gpt-realtime以及Gemini 2.5 Flash模型相比,Nova 2 Sonic在性價比和語音質素方面均處於行業領先水平。

Nova 2 Omni是一款統一的多模態推理與生成模型,既可處理文字、圖像、影片和語音輸入,又能同時生成文字和圖像——在業內尚屬首例。Nova 2 Omni可處理多達75萬單詞的文字、數小時音訊、長影片以及數百頁文件,可一次性同時分析完整產品目錄、用戶評價、品牌規範和影片素材庫,降低了連接多種專業模型所帶來的成本與複雜度。例如,團隊可以利用Nova 2 Omni綜合分析所有格式的產品資訊,在一個工作流程中即時生成整套營銷活動內容,包括標題、內文、社交媒體帖子以及視覺方案。雖然目前業內沒有與 Nova 2 Omni 類似的模型,但它在文件、圖像、影片和音訊的多模態推理公開基準測試中展現了優勢,並且可以生成與其他領先圖像生成模型相媲美的高質素圖像。

包括思科(Cisco)、西門子(Siemens)、Sumo Logic和Trellix在內的眾多企業,已經在利用 Nova 2 模型構建從 AI Agent 威脅檢測到影片理解和語音 AI 助理等各種創新應用。

將專有知識融入 AI 應用的過程中,企業往往面臨三種不盡如人意的選擇:對閉源模型進行有限度微調,只能淺層次地注入企業專業知識;在缺乏原始訓練數據的情況下,持續訓練開源權重模型,可能導致模型在指令跟隨等基礎能力上「退化」;從零開始構建模型,又需要投入巨大成本與時間。企業真正需要的,是既能獲得頂尖模型能力,又能深度融合自身專業知識的解決方案。

Nova Forge正是為此而生:它透過將企業的專有數據與Nova的頂尖能力相結合,幫助企業打造專屬的 Nova 優化變體——我們將這些客製化模型稱為「Novellas」。Nova Forge開創性地提供「開放式訓練」路徑:向客戶開放 Nova 預訓練、中期訓練和後期訓練階段的模型檢查點,以便客戶可以在訓練各階段將自身數據與Amazon Nova精選數據集進行混合,從而打造既結合了Nova完整知識與推理能力,又深刻理解企業業務語境的客製化模型。目前,客戶已經可以基於Nova 2 Lite開始構建自身Novellas。Nova Forge客戶還將優先獲得Nova 2 Pro和Nova 2 Omni 的早期存取權限,從而搶先基於更強大的Nova模型構建應用和 Novellas。

除了模型檢查點和數據混合能力,Nova Forge還提供三大關鍵能力:首先,自定義強化學習「gym」(訓練環境)。客戶可以使用自身業務場景構建強化學習環境(即「gym」),讓模型在高度貼近真實應用的模擬場景中持續學習和優化。其次,構建更小、更快的高性價比模型。客戶可透過合成數據蒸餾方式,利用更大模型生成的示例訓練更小、更高效的模型,從而在顯著降低成本與延遲的同時,盡可能保留智能水平。第三,負責任AI工具套件。Nova Forge提供一套負責任AI工具,幫助客戶在模型訓練和應用部署中實施安全控制,滿足合規和治理要求。

Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit 和Sony等多家企業或機構,已經開始利用Nova Forge構建更契合自身需求的專屬模型。

Reddit技術總監Chris Slowe表示:「借助Nova Forge,我們正在構建更統一的Reddit內容審核系統,該系統已經取得令人印象深刻的成果。我們正在用一套更加準確的解決方案替換過去的多個不同模型,讓審核流程更高效。將多個專業化機器學習工作流程整合為統一方法,是我們在Reddit實施和擴展AI方式的一次重要轉變。在安全領域看到初步成效之後,我們非常期待探索Nova Forge在Reddit其他業務領域的更多可能。」

一旦客戶透過Nova Forge構建了自身頂尖模型,即可將其部署在Amazon Bedrock上,享受與其他Amazon Bedrock模型一致的企業級安全性、可擴展性和資料私隱保護。透過這一端到端方案——從自建頂尖模型,到生產環境部署——企業可以獲得針對自身業務量身訂造的最佳AI性能,並在AWS上安全託管、獨享其模型資產。

Nova Act現已作為AWS的一項服務正式推出,用於在瀏覽器中構建和部署高可靠性的AI Agent,實現自動執行各類操作。該服務由客製化版Nova 2 Lite模型提供運算能力支援,是構建和管理大規模瀏覽器自動化AI Agent集群的最快捷路徑。Nova Act在早期客戶工作流程中達到了90%的執行可靠性,並在相關基準測試中優於競爭模型。

Nova Act透過對客製化版Nova 2 Lite模型進行強化學習訓練來實現突破性的可靠性:系統在數以百計的模擬網頁環境上持續運行數千個任務,使模型在基於 UI 的工作流程中表現尤其出色,例如更新客戶關係管理系統中的數據、測試網站功能,或提交醫療保險理賠申請等。

使用Nova Act,開發人員只需幾分鐘就能在零程式碼視覺化環境中,基於自然語言提示快速構建AI Agent原型;隨後可以在熟悉的整合開發環境(如VS Code)中對該AI Agent進行迭代優化,並部署到AWS生產環境中。開發人員在本地構建和測試的內容,可以無縫擴展到生產級規模,並透過Nova Act在AWS控制台進行統一管理與監控。

各行業客戶已經透過 Nova Act 收穫顯著成效:

  • 初創公司 Sola Systems將Nova Act整合到其平台中,每月為客戶自動完成數十萬次工作流程任務,涵蓋對業務至關重要的操作,如支付對賬、協調貨運和醫療記錄更新等。
  • 1Password利用Nova Act幫助用戶以更少的手動操作存取登入資訊,只需一個簡單提示即可在數百個不同網站上自動完成登入步驟。
  • Hertz透過使用Nova Act實現租車平台端到端測試自動化,將軟件交付速度提升了5倍,徹底消除品質保證(QA)瓶頸。這一平台每天處理數百萬美元的預訂業務,以往需要數周才能完成的測試流程,如今在數小時內即可完成。
  • Amazon Leo在衛星互聯網服務發布前,借助Nova Act消除了品質測試瓶頸,用自然語言撰寫測試場景,並自動在數千個Web和流動端測試用例中執行和適配,大幅減少工程師投入時間,將原本需要數周的人力工作壓縮到數分鐘完成;在初始運行之後,實際測試執行效率提升至 3 倍,同時不再產生額外 AI 成本。

  •  
  •  
  •  

benny

Benny Yeung ~ 企業IT傳媒人,經常四周穿梭科技巨企及論壇,熱愛探討新商機。性格貪玩,但喜歡閱讀沉悶的企業賺蝕數字,最重視辦事效率。