News

Google:Vertex AI數十項更新 提高性價比

  •  
  •  
  •  

Google Cloud宣布企業用AI平台Vertex AI為模型和功能帶來的重要升級。數十項新功能將可以調整、強化、自訂、擴展,以及提升平台的可靠度及安全性,協助企業更快速地推出強大的AI虛擬服務專員。

上月發布的輕量級模型Gemini 1.5 Flash的公開預覽版現已全面開放使用。Gemini 1.5 Flash結合低時延、低成本,以及100萬個字詞 (token) 的上下文窗口 (context window) 的優勢,成為各種大規模應用的絕佳模型選擇,包括零售客服虛擬專員、文書處理,甚至是建立能夠整合完整數據庫的研究虛擬專員。

最重要的是,Gemini 1.5 Flash憑著強大功能、低時延及成本效益,已迅速地成為我們客戶的最愛。與GPT 3.5 Turbo等同類模型相比,Gemini 1.5 Flash具有許多強大的優勢:

  • 100萬條上下文的長度比GPT-3.5 Turbo所提供的多約60倍
  • 輸入一萬個字元的平均速度比GPT-3.5 Turbo高四成
  • 輸入費用只需要GPT-3.5 Turbo的四分之一,並能為超過32,000字元的輸入提供上下文快取 (context caching) 功能

Gemini 1.5 Pro提供高達200萬個字詞的上下文窗口,可支援其他模型無法處理的獨特多模態應用案例。處理一段六分鐘的影片需要超過10萬個字詞,而處理大型程式庫更可能需要超過100萬個字詞,因此不論是從無數的程式碼中找出錯處、 從研究資料庫中尋找正確的資訊,或是分析數小時的音訊或影片,Gemini 1.5 Pro都能幫助企業實現各種案例。

Imagen 3是Google最新的圖像生成基礎模型,提供出色的影像品質之餘,亦比Imagen 2擁有更多強化功能。除了快速原型設計和反覆生成的速度提高了40%以上,Imagen 3還加強了理解及遵循指令的能力,可生成逼真的團體照片,以及更準確控制圖像中的文字成像。

我們已為申請早期實驗階段的Vertex AI客戶開放Imagen 3預覽版本。Imagen 3亦設多語言及多種畫面比例的支援,並內建安全功能 (如Google DeepMind的SynthID數碼浮水印)。

Google Cloud致力為客戶提供多元選擇以加強他們的創新能力,因此在Vertex AI上增設經過精挑細選的第一方、開放式,和第三方模型。Google Cloud最近在Vertex AI上新增了Anthropic新推出的Claude 3.5 Sonnet模型,客戶可以開始在Google Cloud上體驗或部署生產階段的 Claude 3.5 Sonnet。今年夏季稍後時間,Google Cloud亦將會深化與Mistral的合作關係,將Mistral Small、Mistral Large和Mistral Codestral增至Vertex AI的模型園地 (Model Garden)。

Google在今年稍早推出了一系列的先進輕量級開放式模型Gemma,是利用與Gemini模型相同的研究成果和技術打造而成。Google現正式宣布向全球研究及開發人員推出Gemma 2。Gemma 2提供90億 (9B) 和270億 (27B) 兩種參數規格選擇,比第一代更強大及更有效率,同時更大幅加強內建系統的安全。客戶可從下個月起在Vertex AI上體驗Gemma 2。

為了幫助客戶更有效利用Gemini龐大的上下文窗口,Google Cloud現已推出Gemini 1.5 Pro和Flash模型的上下文快取公開預覽版。隨著上下文長度增加,從上下文較長的應用程式獲得回應需更高成本及時間,因而難以部署到生產階段。Vertex AI的上下文快取功能利用常用上下文的快取資料,幫助客戶降低75%成本。Google亦是目前唯一提供上下文快取API的供應商。

Google Cloud將為授權可用名單用戶提供Gemini模型預置吞吐量 (provisioned throughput),保證容量充足及價格穩定,使客戶可負責任地加大Google第一方模型 (例如1.5 Flash) 的用量。此功能為客戶提供工作負載的可預測性和可靠性,讓他們可放心積極擴展生成式 AI 的工作負載。

企業為AI就緒,模型只是其中一環。為確保真確性並將AI「幻覺」減至最低,企業需要將模型的輸出建立在網絡、第一方和第三方事實和資料的基礎上,同時仍要滿足數據管治及主權等嚴格的企業就緒標準。

在Google I/O大會上,Google宣布了全面開放使用在Vertex AI中連接Google搜尋 (Grounding with Google Search)。此外,Google Cloud現宣布從下一季開始,Vertex AI將提供一項新服務,讓客戶將專業的第三方資料連接自家AI虛擬服務專員,解鎖獨特的應用案例並提升企業整個AI體驗中的真實資料可信程度。Google Cloud正在與穆迪、MSCI、湯森路透 和Zoominfo等主要供應商合作,將其資料導入此服務中。

KPMG環球稅務與法律技術總監 (CTO) Brad Brown表示:「Google Cloud的第三方資料連結服務將為KPMG和我們的客戶開拓新的應用商機。在我們生成式AI產品中整合來自領先企業的第三方數據,可縮短提供洞察見解所需的時間,讓我們作出更明智的決策。」

KPMG環球稅務與法律技術總監Brad Brown表示,運用高度可信的資料來源,最終可為客戶提供更大的價值。

對於金融服務、醫療保健以及保險等資料密集型行業,應用生成式AI通常需要嚴格依照客戶提供的資訊,而非內部模型對世界認知的知識庫來生成回應。我們現宣布推出高度傳真 (high-fidelity) 模式連結的實驗預覽版本,專門為支援此類使用場景而設,包括橫跨多項文件的摘要生成、擷取財務語料庫的資料,或處理特定文件組。高度傳真模式由Gemini 1.5 Flash其中一個經微調的版本提供支援,將只會使用客戶提供的脈上下文來生成答案,並確保回應以事實為本。


  •  
  •  
  •  

benny

Benny Yeung ~ 企業IT傳媒人,經常四周穿梭科技巨企及論壇,熱愛探討新商機。性格貪玩,但喜歡閱讀沉悶的企業賺蝕數字,最重視辦事效率。