Columns

從ChatGPT走紅,談企業需要甚麼樣的人工智能

  •  
  •  
  •  

最近幾週,AI 業界最大的新聞無疑是 ChatGPT 橫空出世,從而引發的業界震動。市場上有大量的評論文章,有把它描述成無所不能的,大有代替人類職業之勢;也有提出擔憂,某些頂級學術雜誌和知名高校已經明確限制 AI 作者發表論文和科研成果。

ChatGPT 並非無所不能

出於好奇,筆者也試用了 ChatGPT。整體感覺對於一般的開放性問題,ChatGPT 生成的回答文法結構完整,語言風格自然,比之前的聊天機械人有明顯的進步。內容的準確性和完整性,往往能超過正常交流時大多數人的「第一反應」,更像是經過了一番思考並整理後的結果,條理清晰,很有啟發。但對於專業性問題,尤其是需要邏輯推理的知識,ChatGPT並沒有像網上文章說的那麼出色,經常張冠李戴或者形式上像、模像樣、但內容上卻不知所云。

ChatGPT 中的 GPT 的全稱是的 Generative Pre-trained Transformer — 即「生成式預訓練轉換器」。借用一位名叫 #矽谷學霸Jolin 的技術教育博主對GPT模型的淺顯解釋,她說,以 ChatGPT 為代表的「生成性AI」是一項技術突破,之前 AI 學習大多聚焦於觀測、分類和分析內容,而生成性AI則不限於分析現有數據,它可以生成新內容,可以根據需要生成新的代碼、詩歌、文章和藝術品。

ChatGPT 是專注於文本內容的生成性 AI。所謂「預訓練」是指該轉換器已經在某些有限的數據集上進行了訓練;事實上,ChatGPT 已經學習了 2021 年 6 月以前人類編寫和發佈在互聯網上的海量資料,而且是通過「監督學習」和「人類反饋強化學習」這兩種技術進行的學習。Transformer 是一個非常底層的 AI 機器學習的算法架構,是一種深度神經網絡。從 GPT-1 到今天的 GPT-3.5 都是採用 Transformer 架構,而 GPT 模型的進化有賴於底層硬件超級算力的效率提升 ,以支持AI對更多、更大數據集的訓練和學習。

也就是說,ChatGPT 是通過海量(約45TB)語料訓練而掌握了語法和語義結構的成熟的大型語言模型,其特色是文本生成能力很強,產生的文字風格和內容很像之前的輸入,即人類語言。由於訓練語料涉及面廣,所以 ChatGPT 對各行各業的資料都有涉獵,總能略知一二,有時甚至回答得頭頭是道。對某些專業領域,比如編程,甚至可以產生準確的代碼並直接運行。然而,若仔細觀察,這些代碼往往都是解決特定的小任務,代碼風格似曾相識。若要完成一個創新的算法,或者複雜問題的編程,ChatGPT 就無能為力了。

總體而言,這類通過學習語料來生成文本的 AI 模型,都是在學習過去,其目標是模仿過去,生成出幾可亂真的作品,並不是真正意義下的創造未來。 ChatGPT 也不例外。作為助手,對思考的廣度往往有幫助,對思考的深度卻不盡然。

企業對於聊天機械人抱持更高要求

ChatGPT讓我們看到了大型語言模型的未來。然而,在企業應用中,為了創造業務價值,ChatBot 的應用則更多用於對外的「客戶服務」或對內的「業務助手」方面。這就對此類模型提出更高的要求——

  • 第一,準確性和專業性:企業往往要求回答準確且專業,如果對答案沒有把握,回答「不知道」也好過生成一大段豐富而無用的文字。ChatGPT 是一種「開放領域系統」,類似的還有 Google 的 Bard,它們都需要海量的資料輸入和長時間的訓練,能應付所有領域的對話,回答內容相關度高,對答自知,語法自然。企業級的 ChatBot 是一種「封閉領域系統」,往往不是需要一個乖巧的「百事通」,而是需要專業領域可靠的「知識助手」。它的訓練語料是有限的,包含企業內部文檔和資料、專業領域知識庫、外部該領域的相關文章等,大量的資料都是不公開的。 ChatBot 能回答的問題也限定在專業領域的場景語境中。不必面面俱到,但求簡練、精準、專業。
  • 第二,主動式對話:碰到模棱兩可的提問時,企業應用往往要求通過主動引導式對話,甚至反問的方法,迅速澄清意圖,然後再給出明確的答案。這一點 ChatGPT 目前尚未做到,當問題模糊時,回答也模糊,提問者發現後,換一種問法,或者在對話中縮小範圍,可逐步得到想要的結果。整個過程中,ChatGPT 每次都是被動回答。
  • 第三,後台整合能力:ChatBot作為企業對話的窗口,在提供服務時需要和企業大量的後台系統連結和整合。比如:在識別意圖後可以從數據庫或大數據平台中自動收集相關數據,並進行分析和推理,得到客戶所需的明確答案;或者啟動一條指令或一個後台流程,幫助客戶完成相關操作。

人工智能變得日漸成熟

OpenAI 從 2018 年以來長期堅持研發大型語言模型,通過不斷迭代,從最初的 GPT-1 到目前的 GPT-3,且今年會發行 GPT-4。目前,在開源社區找到 GPT-3 模型,也
為企業開展此類研究提供了範本。

ChatGPT 對企業的吸引力是毋庸置疑的,多數企業都有意願擁有一個自己的 ChatGPT。然而,當前 ChatGPT 採用最新的 GPT-3.5 模型,含有千億級參數,一次訓練就要花費數百萬美元 。大多數企業都不具備如此大的算力,但如果為了獲得對話模型,把企業內部數據都上傳到網上,利用公共雲訓練也會有安全顧慮。所以,企業主導訓練一個定製版 ChatGPT,無論從財力還是合規方面都會有障礙。

IBM Watson,也就是 IBM 企業級的人工智能,經過十多年的發展,從研究到實驗,至今已經發展成為一套可以在 Red Hat OpenShift 上任意運行的 AI 能力,以產品化的方式提供給用戶,幫助企業整合和分析混合環境下分散而複雜的企業數據,從而實現數據驅動的預測性決策、智能自動化和基於企業內外適時數據和洞察的安全策略與回應。

IBM Watson服務企業級AI應用

今天 IBM Watson 已經應用於全球四萬多企業用戶的業務場景當中,為具有不同水平 AI 技能的用戶提供尖端的AI能力,無論是缺乏AI技能卻想通過AI重獲時間效率的商
務及專業人士(例如人力資源、財務、網絡安全管理人員等),或是具備一定 AI 技能並且正在大規模使用 AI 的數據科學家、IT 專業人員等。

IBM Watson 提供了許多不同的工具和服務,用於解決多種問題。它涵蓋了語言處理、解釋、回答和生成文本等多種功能,以幫助客戶解決商業問題。同時,它也提供了語音識別、圖像識別等其它功能,使之成為一個非常強大和全面的人工智能平台。

長期以來,IBM Watson 提供企業級 AI 應用,特別為企業定制「業務助手」類的對話式應用。基本上,Watson 有語音文字轉換、意圖識別、對話流設計、文本分析、知
識整理、情感分析等功能,使得 Watson 可以在通用的語言模型上疊加專業領域知識,並有意識地設計和引導對話方向。

Watson 通過後台的機器學習、自然語言處理、文本生成、語音識別與合成、對話系統、知識圖譜技術,可以分解文本結構,精準定位觀點、事實、論據、邏輯關係等。早在數年前,採用 IBM Watson 技術的 IBM 人工智能辯手就曾以它的機智幽默和高情商而驚艷業界,它可以針對任何一個預設話題,比如「國家應該為每個人提供基本收入」,臨時選擇正方或反方,與人類的辯論冠軍選手進行對辯。

今天的 ChatGPT 也可以達到這個效果。應該承認,其通用語言模型和文本生成技術所呈現的體驗感受甚至可以超過 Watson,令人驚詫,其開放的用戶界面更是讓大眾能夠親身體驗這種驚艷,然而 Watson 的專業性、可設計性、整合性則更適合企業級的業務定位。 IBM 把這種普適性的大型基礎模型稱為基礎模型,它利用遷移學習經過少量的專業訓練,就能進入一個知識領域,並且得到新的啟發,這一點非常像人類的學習過程,有廣闊的應用前景,也是 IBM 今後研究的重點。

我設想,對於企業已有的 Watson 對話模型,也可以利用 ChatGPT 得到增強。可以是協同模式:當發現是專業領域的封閉式問題,可用原有 Watson 模型回答,當發現是
開放式問題,可用 ChatGPT 回答。也可以通過競爭模式:一次生成多個答案,由人類做裁判,相互學習,共同提高。

總言之,ChatGPT 將人機對話的體驗提高了一個檔次,利用強大的搜索和知識整理的能力,在問題回答的廣度上往往很有啟發,但深度不足。目前只能學習人類語言和知識,還做不到思考推理,也難以駕馭高度創新和深度思考的任務。我認為,對於企業級的應用,融合 ChatGPT 與 IBM Watson 之所長,不乏為快速高效地應用 AI 提升體驗、創造價值之選。

作者簡介:IBM大中華區客戶成功架構師陳宇翔

陳宇翔先生長期致力於人工智能、雲運算、物聯網、量子運算的技術推廣,結合金融行業創新應用,是金融行業創新解決方案設計的領導者和實踐者。

  •  
  •  
  •