Google：Vertex AI數十項更新提高性價比

2024-07-03 benny

Google Cloud宣布企業用AI平台Vertex AI為模型和功能帶來的重要升級。數十項新功能將可以調整、強化、自訂、擴展，以及提升平台的可靠度及安全性，協助企業更快速地推出強大的AI虛擬服務專員。

Gemini 1.5 Flash高性價比及低時延

上月發布的輕量級模型Gemini 1.5 Flash的公開預覽版現已全面開放使用。Gemini 1.5 Flash結合低時延、低成本，以及100萬個字詞 (token) 的上下文窗口 (context window) 的優勢，成為各種大規模應用的絕佳模型選擇，包括零售客服虛擬專員、文書處理，甚至是建立能夠整合完整數據庫的研究虛擬專員。

最重要的是，Gemini 1.5 Flash憑著強大功能、低時延及成本效益，已迅速地成為我們客戶的最愛。與GPT 3.5 Turbo等同類模型相比，Gemini 1.5 Flash具有許多強大的優勢：

100萬條上下文的長度比GPT-3.5 Turbo所提供的多約60倍
輸入一萬個字元的平均速度比GPT-3.5 Turbo高四成
輸入費用只需要GPT-3.5 Turbo的四分之一，並能為超過32,000字元的輸入提供上下文快取 (context caching) 功能

Gemini 1.5 Pro上下文窗口具處理200萬個字詞能力

Gemini 1.5 Pro提供高達200萬個字詞的上下文窗口，可支援其他模型無法處理的獨特多模態應用案例。處理一段六分鐘的影片需要超過10萬個字詞，而處理大型程式庫更可能需要超過100萬個字詞，因此不論是從無數的程式碼中找出錯處、從研究資料庫中尋找正確的資訊，或是分析數小時的音訊或影片，Gemini 1.5 Pro都能幫助企業實現各種案例。

Imagen 3加速圖像生成精準理解指令

Imagen 3是Google最新的圖像生成基礎模型，提供出色的影像品質之餘，亦比Imagen 2擁有更多強化功能。除了快速原型設計和反覆生成的速度提高了40%以上，Imagen 3還加強了理解及遵循指令的能力，可生成逼真的團體照片，以及更準確控制圖像中的文字成像。

我們已為申請早期實驗階段的Vertex AI客戶開放Imagen 3預覽版本。Imagen 3亦設多語言及多種畫面比例的支援，並內建安全功能 (如Google DeepMind的SynthID數碼浮水印)。

透過Vertex AI揀選更多第三方和開放式模型

Google Cloud致力為客戶提供多元選擇以加強他們的創新能力，因此在Vertex AI上增設經過精挑細選的第一方、開放式，和第三方模型。Google Cloud最近在Vertex AI上新增了Anthropic新推出的Claude 3.5 Sonnet模型，客戶可以開始在Google Cloud上體驗或部署生產階段的 Claude 3.5 Sonnet。今年夏季稍後時間，Google Cloud亦將會深化與Mistral的合作關係，將Mistral Small、Mistral Large和Mistral Codestral增至Vertex AI的模型園地 (Model Garden)。

Google在今年稍早推出了一系列的先進輕量級開放式模型Gemma，是利用與Gemini模型相同的研究成果和技術打造而成。Google現正式宣布向全球研究及開發人員推出Gemma 2。Gemma 2提供90億 (9B) 和270億 (27B) 兩種參數規格選擇，比第一代更強大及更有效率，同時更大幅加強內建系統的安全。客戶可從下個月起在Vertex AI上體驗Gemma 2。

Gemini 1.5 Pro和Flash的上下文快取功能降低成本

為了幫助客戶更有效利用Gemini龐大的上下文窗口，Google Cloud現已推出Gemini 1.5 Pro和Flash模型的上下文快取公開預覽版。隨著上下文長度增加，從上下文較長的應用程式獲得回應需更高成本及時間，因而難以部署到生產階段。Vertex AI的上下文快取功能利用常用上下文的快取資料，幫助客戶降低75%成本。Google亦是目前唯一提供上下文快取API的供應商。

Gemini模型預置吞吐量 (throughput) 加強效能預測

Google Cloud將為授權可用名單用戶提供Gemini模型預置吞吐量 (provisioned throughput)，保證容量充足及價格穩定，使客戶可負責任地加大Google第一方模型 (例如1.5 Flash) 的用量。此功能為客戶提供工作負載的可預測性和可靠性，讓他們可放心積極擴展生成式 AI 的工作負載。

傳遞「企業真理」(enterprise truth)：以Google搜尋及第三方資料作為連接 (grounding) 基石

企業為AI就緒，模型只是其中一環。為確保真確性並將AI「幻覺」減至最低，企業需要將模型的輸出建立在網絡、第一方和第三方事實和資料的基礎上，同時仍要滿足數據管治及主權等嚴格的企業就緒標準。

在Google I/O大會上，Google宣布了全面開放使用在Vertex AI中連接Google搜尋 (Grounding with Google Search)。此外，Google Cloud現宣布從下一季開始，Vertex AI將提供一項新服務，讓客戶將專業的第三方資料連接自家AI虛擬服務專員，解鎖獨特的應用案例並提升企業整個AI體驗中的真實資料可信程度。Google Cloud正在與穆迪、MSCI、湯森路透和Zoominfo等主要供應商合作，將其資料導入此服務中。

KPMG環球稅務與法律技術總監 (CTO) Brad Brown表示：「Google Cloud的第三方資料連結服務將為KPMG和我們的客戶開拓新的應用商機。在我們生成式AI產品中整合來自領先企業的第三方數據，可縮短提供洞察見解所需的時間，讓我們作出更明智的決策。」

KPMG環球稅務與法律技術總監Brad Brown表示，運用高度可信的資料來源，最終可為客戶提供更大的價值。

高度傳真模式連結回應更以事實為本

對於金融服務、醫療保健以及保險等資料密集型行業，應用生成式AI通常需要嚴格依照客戶提供的資訊，而非內部模型對世界認知的知識庫來生成回應。我們現宣布推出高度傳真 (high-fidelity) 模式連結的實驗預覽版本，專門為支援此類使用場景而設，包括橫跨多項文件的摘要生成、擷取財務語料庫的資料，或處理特定文件組。高度傳真模式由Gemini 1.5 Flash其中一個經微調的版本提供支援，將只會使用客戶提供的脈上下文來生成答案，並確保回應以事實為本。