ChatGPT 是什麼?應用、優缺點以及未來展望
背景
2022 年 11 月,美國著名的人工智能實驗室 OpenAI 發佈了一款震驚世界的聊天機器人 ChatGPT。在短短不到一個禮拜的時間內,他的註冊使用人數就超過一百萬人,可見其熱門程度。
這款聊天機器人可以了解高達 18 種語言,其中也包括繁體中文!目前,用戶只需要註冊就可以免費和他對話。
從發布到現在,網路上各處可見 ChatGPT 的蹤影。從寫下簡單的應用程式、旅遊景點、歷史典故、到寫故事文章,這個機器人都可以幫你做到!並且做出來的結果與人類非常像,這就是 ChatGPT 厲害的地方。
在講更深入前,讓我們來了解一下 OpenAI 這個實驗室的背景。
OpenAI 是一家位於舊金山的人工智慧研究實驗室,成立於2015年,主要創立人為包括 Elon Musk 和 Sam Altman,但後來 Elon Musk 因爲其他企業的利益衝突而離開了公司董事會。
OpenAI 目標在創建先進的 AI 技術,並讓這些技術可用於造福全人類。並以安全和有益的方式推進人工智慧技術,確保 AI 技術的使用符合人類的利益。
自成立以來,OpenAI 已經取得了幾項顯著的里程碑,包括開發了像 GPT-3,一種先進的語言模型,以及開發了 Dactyl,一個能夠以出色的靈巧度操控物體的機器人手,以及創建了幾個用於 AI 開發的開源工具和框架。研究領域涵蓋自然語言處理、機器人技術、計算機視覺和強化學習等領域。
總之,OpenAI 就是人工智慧領域的領先組織,致力於推進 AI 技術以造福人類。
技術背景
ChatGPT 的基本架構是一個大型的語言模型。它可以根據使用者輸入的文字產生合理的回應。
通過學習大量資料,ChatGPT 可以模擬人類的對話方式,使對答更加順暢,並且讓對話有連續性。
而這個大型的語言模型是什麼呢?也就是在前一段提到的 GPT-3 的升級版 GPT-3.5。
GPT 的全名叫做 Generative Pre-trained Transformer,是一款透過深度學習來分析及訓練出來的自然語言文本。其實在更之前,OpenAI 也推出了第一版及第二版,讓我們來看看他們的差別。
模型 | 總參數數量 | 推出年份 |
---|---|---|
GPT-1 | 1.17 億 | 2018 |
GPT-2 | 15 億 | 2019 |
GPT-3 | 1750 億 | 2020 |
從上表我們可以知道第二版到第三版有了飛躍式的成長。總參數數量越高代表著模型的表現能力越好,但同時也代表越難訓練以及訓練的時間更長。
而 GPT-3.5 則是基於 GPT-3 的模型上的優化版,GPT-3.5 提供了更準確和連貫的回應。據說,OpenAI 也將在明年推出 GPT-4,總參數數量也將達到驚人的 100 萬億個。
ChatGPT 更使用了 RLFH (Reinforcement Learning from Human Feedback) 進行訓練,中文叫做人類反饋的強化學習。不了解沒關係,官方提供了一個很好的圖例來解釋。
第一步:使用現有的資料集訓練初版語言模型
這些訓練資料集的主要輸入是一些提示,比如說「吃飯」、「歷史」、「中午」等等關鍵字。
接下來會由人工的方式來告訴電腦說,看到這些提示時可能會回答什麼樣的答案。比如說如果提示是「吃飯」,那可能的結果就是「要去哪間餐廳?」、「義大利麵怎麼做?」等等。
根據這些資料集,我們可以訓練出初版的語言模型。
第二步:訓練獎勵模型
同一個提示初版語言模型會有不同的輸出。舉例來說如果提示是「吃飯」,那麼初版語言模型的輸出可能會是A:要去哪間餐廳、B:牛肉麵的歷史、以及C:台北市有哪些好吃的餐廳。
接著,我們透過人工的方式將 ABC 三個輸出結果給予評分,越高分代表約接近人類想要的結果。
那麼我們評分的結果可能會是 A > C > B。我們接著將這些評分資訊拿去訓練一個獎勵模型,讓這個模型知道怎樣的輸出應該給予幾分。
第三步:優化初版語言模型
將兩個模型串接,使用來自資料集的新的提示,讓初版語言模型輸出結果,並將此結果輸入到獎勵模型並產生分數。
產生出來的分數會用來訓練優化初版語言模型,使得語言模型能產生得分更高的輸出結果。經過幾千萬次的優化後,我們就可以得到 ChatGPT 了!
應用場景
ChatGPT 不只能和使用者進行簡單的對談,它還有更多意想不到的功能,比如說:
- 創作兒童故事書:網路上有很多人使用 ChatGPT 撰寫兒童故事,並搭配 Midjourney 這個網站來產生圖片,最後出版成實體故事書販售。
- 創建程式代碼:我們可以提供一段敘述給ChatGPT 讓他幫我們產生程式碼,比如說「請幫我寫出預測股價的程式」。
- 求解數學方程式:給予一個數學題目,ChatGPT 會提供我們詳細的求解過程,並解出最後答案。從簡單的加減乘除到困難的微積分都可以。
- 各類文章總整理:我們可以提供一大段文章,並讓 ChatGPT 幫我們重點整理,這省下了我們大量的閱讀時間。我常常用這個功能來快速閱讀早上新聞。
- 修改文法或程式碼錯誤:給予一段有文法錯誤的文章,或是有錯誤的程式碼,ChatGPT 都可以快速地告訴你哪裡有問題並提供修正。
缺點與局限性
合理性
訓練 ChatGPT 的資料很大一部分是來自網路,因此,當前最讓人們擔心的就是他會對所有文章進行學習,不論是友善的還是充滿惡意的,並進一步產生錯誤或是有惡意的回答。
OpenAI 也提到,這個模型是去產生聽起來最「合理」的結果,而不是去產生最「正確」的結果。
同時也說,要達到完全不會有惡意的回答也是非常困難的,因為如果要訓練 ChatGPT 更加謹慎可能會造成他拒絕回答一些他本來能回答正確的問題。
一至性
另外,ChatGPT 對於調整輸入或嘗試多次輸入相同問題非常敏感。例如,給定一個問題的某種提示,模型可能會聲稱不知道答案,但是給定一個稍微不同的提示,它就可以正確地回答問題。而這個問題 OpenAI 也聲稱這是他們目前遇到的瓶頸之一。
最理想的情況是,當使用者提供一個含糊不清的問題或是當模型不理解時,模型應該提出澄清問題。但是,目前的模型只能做到猜測使用者的意圖。
未來展望
據 富比世報導,GPT-4 很快就要到來了。他所擁有的訓練參數也將高出現在 ChatGPT 模型的一百倍,而OpenAI也宣稱,這個模型將做到和人類無區別。
但是,當中也提到 GPT-4 並不會有能力產生圖像,反而更重視的是程式碼的質量與回答的更為人性。
ChatGPT 的問世也可以為公司帶來非常大的成本削減。許多公司現在已經在規劃將 ChatGPT 的模型導入到客服部門,讓客戶可以有更人性化的體驗以及全年無休的客服。
目前,運行這個模型的成本大約是每次搜尋 1 美分。但是,方舟投資 (ARK Invest) 和產業界也推估到了 2030 年,搜尋和訓練 ChatGPT 所需的成本也將大幅下降。
因此在這方面,我對未來 ChatGPT 這類產品被應用在各個產業的客服抱有很高的信心與期待。
除了以上方面,ChatGPT 也對搜尋引擎比如說 Google 造成了不小的影響。現在有許多人開始臆測當有了 ChatGPT 後,會不會讓人們對 Google 的黏著度大幅下降。
雖然目前 ChatGPT 還沒有真正對 Google 造成影響,但是 Google 也做出了相對的回應。
在今年 2/07,Google 也推出了自家的聊天機器人 Bard。但是,Bard 卻在發表會上出包,要展示的手機當下也找不到,造成當天 Google 的股價大跌。
而微軟也將自家搜尋引擎 Bing結合ChatGPT,來擴充自家搜尋引擎的表現能力。
因此,由微軟和 Google 的作為可見,業界對於聊天機器人的應用以及未來市場也是非常看好的!