AWS全新企業專屬模型Nova Forge服務及AI代理Nova Act

2025-12-04 benny

在Amazon Web Services（AWS）2025 re:Invent全球大會上，亞馬遜宣布擴展Nova產品組合：推出四款全新模型、一項開創性的「開放式訓練」服務 (支援企業基於Nova構建專屬的頂尖模型變體)，以及一項用於創建高可靠性AI Agent的新服務。

目前，數以萬計的企業已經在使用Nova來支援多種應用場景，例如生產高質素內容、將多步驟任務自動化以及加速AI Agent的研發。亞馬遜全新的Nova 2模型系列在多個 AI領域實現了速度、成本與智能水平的均衡：

Nova 2 Lite是一款為日常工作負載而設的快速、經濟型推理模型，能夠處理文字、圖像和影片輸入並生成文字輸出。客戶可以根據需求調節模型在回答前進行「思考」的深度，在智能程度與響應速度、成本之間靈活平衡，是客戶服務聊天機器人、文件處理和業務流程自動化等場景的理想選擇。

在同級模型中，Nova 2 Lite憑藉性價比表現領先業界：與Claude Haiku 4.5相比，它在15項基準測試中有13項持平或更佳；與GPT-5 Mini相比，在17項基準測試中，有11項持平或更佳；與Gemini Flash 2.5相比，在18項基準測試中有14項持平或更佳。Nova 2 Lite在以下能力上尤其突出：處理各類文件、從影片中提取關鍵資訊、生成程式碼、提供準確的基於事實的回答，以及自動化執行多步驟的AI Agent工作流程。

Nova 2 Pro是亞馬遜最智能的推理模型，能夠處理文字、圖像、影片和語音輸入，並生成文字輸出。它非常適合用於需要最高準確率的高度複雜任務，如agentic coding、長期規劃以及複雜問題求解。該模型還可以作為「教師模型」，透過知識蒸餾將自身能力轉移到更小、更高效的「學生模型」上，用於特定垂直領域和應用場景。在公開基準測試中，Nova 2 Pro表現出色：與Claude Sonnet 4.5對比，在16項評測中有10項持平或更佳；與GPT-5.1的16 項評測中有8項持平或更佳；與 Gemini 2.5 Pro 的 19項評測中有15項持平或更佳；與Gemini 3 Pro Preview 的18項評測中有8項持平或更佳。Nova 2 Pro在多文件分析、影片推理、複雜指令執行、高階數學問題解答，以及執行 AI Agent與軟件工程任務等方面表現出眾。

Nova 2 Lite和Nova 2 Pro均內置網頁查找和程式碼執行能力，可以根據需要搜尋最新的互聯網資訊並直接運行程式碼，從而確保模型的回答始終基於最新事實，而不僅僅依賴訓練數據。

Nova 2 Sonic是亞馬遜的端到端語音模型，將文字與語音的理解與生成深度融合，實現了實時、類人對話式 AI 體驗。該模型支援更多語言和富有表現力的音色，具備更高識別準確率，並提供高達100萬tokens的上下文窗口，能夠支援長時互動，並在語音與文字之間無縫切換。模型可以異步處理任務：用戶在繼續自然對話、甚至切換話題的同時，系統仍可在後台完成諸如訂票等操作。

Nova 2 Sonic還能與Amazon Connect、第三方語音服務供應商（如 Vonage、Twilio、AudioCodes）以及對話式AI框架（如 LiveKit、Pipecat）無縫整合，使其成為客戶服務、AI 助理和互動語音體驗的理想選擇。與透過實時API提供服務的OpenAI gpt-realtime以及Gemini 2.5 Flash模型相比，Nova 2 Sonic在性價比和語音質素方面均處於行業領先水平。

Nova 2 Omni是一款統一的多模態推理與生成模型，既可處理文字、圖像、影片和語音輸入，又能同時生成文字和圖像——在業內尚屬首例。Nova 2 Omni可處理多達75萬單詞的文字、數小時音訊、長影片以及數百頁文件，可一次性同時分析完整產品目錄、用戶評價、品牌規範和影片素材庫，降低了連接多種專業模型所帶來的成本與複雜度。例如，團隊可以利用Nova 2 Omni綜合分析所有格式的產品資訊，在一個工作流程中即時生成整套營銷活動內容，包括標題、內文、社交媒體帖子以及視覺方案。雖然目前業內沒有與 Nova 2 Omni 類似的模型，但它在文件、圖像、影片和音訊的多模態推理公開基準測試中展現了優勢，並且可以生成與其他領先圖像生成模型相媲美的高質素圖像。

包括思科（Cisco）、西門子（Siemens）、Sumo Logic和Trellix在內的眾多企業，已經在利用 Nova 2 模型構建從 AI Agent 威脅檢測到影片理解和語音 AI 助理等各種創新應用。

Nova Forge：首個為自建頂尖AI模型而設的創新服務

將專有知識融入 AI 應用的過程中，企業往往面臨三種不盡如人意的選擇：對閉源模型進行有限度微調，只能淺層次地注入企業專業知識；在缺乏原始訓練數據的情況下，持續訓練開源權重模型，可能導致模型在指令跟隨等基礎能力上「退化」；從零開始構建模型，又需要投入巨大成本與時間。企業真正需要的，是既能獲得頂尖模型能力，又能深度融合自身專業知識的解決方案。

Nova Forge正是為此而生：它透過將企業的專有數據與Nova的頂尖能力相結合，幫助企業打造專屬的 Nova 優化變體——我們將這些客製化模型稱為「Novellas」。Nova Forge開創性地提供「開放式訓練」路徑：向客戶開放 Nova 預訓練、中期訓練和後期訓練階段的模型檢查點，以便客戶可以在訓練各階段將自身數據與Amazon Nova精選數據集進行混合，從而打造既結合了Nova完整知識與推理能力，又深刻理解企業業務語境的客製化模型。目前，客戶已經可以基於Nova 2 Lite開始構建自身Novellas。Nova Forge客戶還將優先獲得Nova 2 Pro和Nova 2 Omni 的早期存取權限，從而搶先基於更強大的Nova模型構建應用和 Novellas。

除了模型檢查點和數據混合能力，Nova Forge還提供三大關鍵能力：首先，自定義強化學習「gym」（訓練環境）。客戶可以使用自身業務場景構建強化學習環境（即「gym」），讓模型在高度貼近真實應用的模擬場景中持續學習和優化。其次，構建更小、更快的高性價比模型。客戶可透過合成數據蒸餾方式，利用更大模型生成的示例訓練更小、更高效的模型，從而在顯著降低成本與延遲的同時，盡可能保留智能水平。第三，負責任AI工具套件。Nova Forge提供一套負責任AI工具，幫助客戶在模型訓練和應用部署中實施安全控制，滿足合規和治理要求。

Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit 和Sony等多家企業或機構，已經開始利用Nova Forge構建更契合自身需求的專屬模型。

Reddit技術總監Chris Slowe表示：「借助Nova Forge，我們正在構建更統一的Reddit內容審核系統，該系統已經取得令人印象深刻的成果。我們正在用一套更加準確的解決方案替換過去的多個不同模型，讓審核流程更高效。將多個專業化機器學習工作流程整合為統一方法，是我們在Reddit實施和擴展AI方式的一次重要轉變。在安全領域看到初步成效之後，我們非常期待探索Nova Forge在Reddit其他業務領域的更多可能。」

一旦客戶透過Nova Forge構建了自身頂尖模型，即可將其部署在Amazon Bedrock上，享受與其他Amazon Bedrock模型一致的企業級安全性、可擴展性和資料私隱保護。透過這一端到端方案——從自建頂尖模型，到生產環境部署——企業可以獲得針對自身業務量身訂造的最佳AI性能，並在AWS上安全託管、獨享其模型資產。

Nova Act：AWS為UI工作流程而設的高可靠性AI Agent服務

Nova Act現已作為AWS的一項服務正式推出，用於在瀏覽器中構建和部署高可靠性的AI Agent，實現自動執行各類操作。該服務由客製化版Nova 2 Lite模型提供運算能力支援，是構建和管理大規模瀏覽器自動化AI Agent集群的最快捷路徑。Nova Act在早期客戶工作流程中達到了90%的執行可靠性，並在相關基準測試中優於競爭模型。

Nova Act透過對客製化版Nova 2 Lite模型進行強化學習訓練來實現突破性的可靠性：系統在數以百計的模擬網頁環境上持續運行數千個任務，使模型在基於 UI 的工作流程中表現尤其出色，例如更新客戶關係管理系統中的數據、測試網站功能，或提交醫療保險理賠申請等。

使用Nova Act，開發人員只需幾分鐘就能在零程式碼視覺化環境中，基於自然語言提示快速構建AI Agent原型；隨後可以在熟悉的整合開發環境（如VS Code）中對該AI Agent進行迭代優化，並部署到AWS生產環境中。開發人員在本地構建和測試的內容，可以無縫擴展到生產級規模，並透過Nova Act在AWS控制台進行統一管理與監控。

各行業客戶已經透過 Nova Act 收穫顯著成效：

初創公司 Sola Systems將Nova Act整合到其平台中，每月為客戶自動完成數十萬次工作流程任務，涵蓋對業務至關重要的操作，如支付對賬、協調貨運和醫療記錄更新等。
1Password利用Nova Act幫助用戶以更少的手動操作存取登入資訊，只需一個簡單提示即可在數百個不同網站上自動完成登入步驟。
Hertz透過使用Nova Act實現租車平台端到端測試自動化，將軟件交付速度提升了5倍，徹底消除品質保證（QA）瓶頸。這一平台每天處理數百萬美元的預訂業務，以往需要數周才能完成的測試流程，如今在數小時內即可完成。
Amazon Leo在衛星互聯網服務發布前，借助Nova Act消除了品質測試瓶頸，用自然語言撰寫測試場景，並自動在數千個Web和流動端測試用例中執行和適配，大幅減少工程師投入時間，將原本需要數周的人力工作壓縮到數分鐘完成；在初始運行之後，實際測試執行效率提升至 3 倍，同時不再產生額外 AI 成本。

2025 年 12 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31