為什麼 ChatGPT 不會算數?真的穩定可用嗎?– 解讀 ChatGPT 二三事 #2

全世界都在夯 ChatGPT 時,開始出現各種疑問:計算老是出錯?答案正確度堪憂?越近期的資訊越常錯….?到底這是不是一個可靠的技術呢?真的可以商業使用嗎?讓宇鯨帶你解讀原因及告訴你解決方法。

重要原理 1:ChatGPT 的本質是「理解語言」的模型

ChatGPT 是由 OpenAI 於2022年底推出的 LLM(大型語言模型)。顧名思義,擅長解決過往機器理解複雜的人類自然語言時,經常「理解不準確」的問題。就如同人類使用語言時,最基本的要求是「聽正確、理解正確」,接著才能「回覆對的內容」、「執行正確的指令」….

ChatGPT 是「語言模型」,而不是「計算機」。「使用語言」和「進行計算」是兩種不同能力。數字對它而言是符號的一種,跟文字無異,基於過往資料訓練結果的「機率」,判斷後面要跟哪個數字,而非規則式的邏輯判斷。

以人類學習語言為例:還在學習說話的小小孩,不僅不懂1+1=2的計算,可能在數數時會是1、2、5、8。而非 1-10的標準順序。在這階段,因為學習的是語言,而不是計算。怎麼唸數字,就跟語言一樣,沒有標準答案的。

所以當你清楚 ChatGPT 是什麼、不是什麼後,就能理解它不是萬能許願池。

他真正厲害、技術突破的是「理解人類語言」的精準度大幅上升。除此之外的,都還需要靠其他用戶體驗設計、軟體技術、AI 模型….來補足,才能在解決目標商業問題時,達成預期的效果。這些要補足的面向,在本文內容後續會介紹到。

重要原理 2:AI 模型都是依靠「機率」回答

不只 ChatGPT,只要是 AI 模型,都是基於大量資料訓練後,機器基於學習結果,提出「最有可能」=「正確機率最高」的答案。依靠「機率」回答,代表要達到非常高的準確度,需要非常大量的正確數據訓練。準確度與數據量大小,大致是正相關的關係。也就是準確率越高的模型,需要投入的訓練資源越高,而每次進行機率計算的算力成本也越高。所以這些「回答」的成本是高昂的。

該如何解決?

其實有2個問題值得思考:

  • 1. 待解決的問題,所需要的準確度,有多高?必須99.99%準確?還是70%-80%的準確度已經足夠使用?
  • 2. 傳統的 rule-base 系統,並不需要使用 AI 模型,卻可以輕易達成99.99%的精準度,是否可能混用?

所以其實宇鯨認為,更符合實際商業應用的情況下(考量服務穩定性及正確性),不應該只用 ChatGPT 單一強大卻昂貴的 AI 模型來處理所有需求,而是基於需求的不同,而選擇不同的 AI 模型(例如:準確度足夠但成本較低的他種 AI 模型)、軟體工具(例如:無 AI 元素的軟體工程方法)、用戶體驗設計…整體規劃搭配,來提供體驗好、準確度高、低成本的解決方案,才能真正成為商業需求的有力助手。

結論:

經過上面的解釋,相信您更了解如何規劃,能兼顧創造價值、平衡成本的 ChatGPT 導入方式。而宇鯨正是能協助的最佳合作夥伴。如果希望進一步討論評估您的需求,歡迎聯繫宇鯨智能:hello@yujing.io

延伸閱讀:身為企業主,怎麼用 ChatGPT?– 解讀 ChatGPT 二三事#1

總結

宇鯨的團隊非常看好大型語言模型這波浪潮,技術上的成熟度已經非常接近可商用,如果你本身已有產業經驗,非常容易就能透過 AI 工具來加速工作事務,甚至開始組建屬於自己企業的解決方案。OpenAI 在 2023/11 有一億個週活躍用戶, AI 工具在未來是必修課,現在不開始嘗試,以後將無法其他企業競爭。若想了解真實落地場景,歡迎找宇鯨聊聊!宇鯨在電商、法律、醫療的 AI 與自動化經驗,一定能讓你建立未來 10 年的競爭優勢!

關於宇鯨

提供全方位的 AI 解決方案:

  • 專案型技術開發合作:用戶與商品貼標、光學文字辨識 OCR、自然語言處理 NLP、音訊分析 SED、語音合成 TTS、產品概念驗證 POC
  • 宇鯨產品:CS Tagging 顧客分群貼標、LegalTech 智能書狀生成