企業 發展 AI LLM (大型語言模型) 現況考慮方向
"沒有人會否認生成式 AI 帶來的好處,但是「企業」要導入 AI 卻很不容易,最大的問題是難以監測 AI 生成內容的正確性。"
https://technews.tw/2023/10/28/tidalflow-helps-any-software-play-nice-with-chatgpt-and-other-llm-ecosystems/
企業發展 AI LLM (大型語言模型)會有幾個 有幾個方向需要考慮:
1. 技術資源和風險成本:
根據前面文章內容可以發現,的確,開發企業用的LLM(大型語言模型) 對中小企業來說技術資源風險成本太高。
畢竟自己四年前就曾經花了一年的時間找人找技術找資源,由於投入資金過高(三千萬),而且這僅僅是得到一個不確定的結果,最後只能選擇放棄。
不過現在看來慶幸當初沒有堅持下去,因為後來出現了 ChatGPT。
2. 資料品質 (GIGO) 的挑戰
ChatGPT的出現讓沉寂已久的計畫出現曙光,於是花了不少時間研究如何提高輸出品質,畢竟在LLM的應用上,具備輸出品質的資料才有價值基礎。
GIGO(垃圾進,垃圾出)是資料科學普遍的概念,也就是只有確保訓練資料的品質,輸出才有品質,但是對於大型語言模型來說,這一塊難度在不同情況下變得更複雜而難以控制。
因此如何在海量的數位資料中,不被垃圾資料影響而達到想要的輸出資料品質,為了解決這個問題,於是便開啟了使用端的挑戰之路。
3. 模型訓練與使用階段的策略
改善GIGO有不少方向,目前分享兩種方向。
一種是在模型訓練階段的做法,這些做法包括
訓練資料清理和預先處理以維持資料品質,或是
使用不同來源的資料確保模型可以學習多樣化的內容和表達方式,或是
針對資料提供準確的標記和註釋讓模型學到正確的模式和關係,或是
應用偏見緩解算法來減少模型偏見,或是
持續監控和更新設計模型的反饋循環已持續優化資料和模型效能等等。
4. 使用者教育和反饋
另一種是模型使用階段的作法,也就是以使用端輸入的做法,
例如
使用者提供準確明確的輸出提供足夠的明確提示讓模型可以提高輸出準確率,或是
持續對使用者輸入進行驗證與修改以確保輸出資料的準確性和關聯性,或是
使用者對模型輸出提供反饋以優化模型表現,或是
利用教育指導的方式幫使用者理解如何以更好的輸入方式利用模型產生高品質輸出內容等。
5. ChatGPT (GPT-4)的應用訓練
這一塊,在經過半年的研究後,在ChatGPT(GPT-4)的基礎下,結合方法論、提示工程技巧、技術分析方法等組合,成功從使用端建立穩定的輸出品質,而有了突破性的實質進展。
雖然ChatGPT有潛在的隱私問題,但在執行層面上的具體應用流程和操作細節控制,已經可以解決這個部分的問題。
心得:
看到這些成果受到企業肯定,給了莫大的信心,未來持續努力,期待能開發出更方便且高價值應用方式。
2023©汪周禮@智合創新
#CHATGPT
#GIGO
#AI
#LLM
如有任何需求,歡迎企業來信詢問。
service@iiiinnovation.com
沒有留言:
張貼留言