搜尋此網誌

2025年1月31日 星期五

AIaaE-開源LLMs生態系的崛起 - EPISODE 0 - DEEPSEEK的衝擊

EPISODE 0 -  DEEPSEEK 的衝擊


2025.01.31 汪周禮

在 AI 技術的快速演進下,AI整體市場格局正在發生重大變化。從開源與閉源的競爭,到小模型挑戰大模型,再到算力需求的變革,這些趨勢不僅影響技術發展,也將重塑全球 AI 產業格局。

DeepSeek的出現所造成的影響意義深遠,本文嘗試從四個點切入探討未來 AI 市場可能的變化及其對企業的影響。

(針對近期DEEPSEEK對市場網路新聞資訊變化,整理收集網路資訊並與ChatGPT對話整理與修改及補充後,探討目前觀察到的資訊,經過整理補充與修改的內容仍可能有誤,請謹慎閱讀參考。)


1. DeepSeek 綜合資訊

2. DeepSeek-V3 訓練與優化流程總覽

3. 未來市場的變化趨勢

4. 哪些企業會最先適應 DeepSeek 帶來的 AI 變局?


關鍵字:DEEPSEEK, AI, AI黃金三角, AI FUTURE TREND, AIaaE, AI as an Ecosystem, open source, LLM


1. DeepSeek 綜合資訊

DEEPSEEK是一種AI LLM技術,於2025年1月20日首度發表。

從目前收集到的資訊經過整理後,首先從類型、特色以及重點摘要三個層面,分別從術創新與模型架構、訓練與優化流程、進行梳理。

A. 技術創新與模型架構





DeepSeek 以創新架構、高效資源運用、完全開源、低成本訓練策略,挑戰美國主導的 AI 模型市場。其技術與市場影響力不僅正在改變產業標準,更在算力競爭、中文 AI 發展、與 AI 商業模式上帶來顛覆性變化,讓開源環境更具競爭力。


B. DeepSeek-V3 訓練優化流程總覽


流程圖解讀
    1. DeepSeek-V3 Base 作為基礎,透過少量冷啟動 CoT 數據進行 SFT(監督微調)。
    2. 接著透過 推理導向強化學習(GRPO + CoT 語言一致性獎勵) 進一步優化模型。
    3. 推理與非推理數據經過過濾與拒絕抽樣,確保數據品質,形成 DeepSeek-V3 SFT 訓練數據集。
    4. 使用 Qwen 2.5、Llama 系列數據,再進行 2 輪 SFT 訓練(共 80 萬筆樣本),進一步提升模型能力。
    5. 透過蒸餾技術 產生 DeepSeek-R1-Distill 版本,以降低計算成本並保持推理能力。
    6. 經過強化學習(RL),利用偏好獎勵與多樣化提示詞進行微調,最終獲得 DeepSeek-R1。

關鍵亮點
    1. 分段穩定訓練:先進行 SFT,再透過 RL 提升推理能力,確保模型穩定成長。
    2. 數據品質篩選機制:透過推理提示詞與拒絕抽樣,確保數據高品質,避免模型學習低質量輸入。
    3. 多模型蒸餾泛化:結合 Qwen 2.5 & Llama 版本 進行知識提取,提升模型的泛化能力。
    4. 低成本高效輸出:使用 SFT + RL 策略,提升效能同時控制成本,使模型具備競爭力。

總結
DeepSeek 採用 分階段穩定訓練 策略,先以 少量 CoT 數據進行 SFT 微調,再透過 GRPO 強化學習與語言一致性獎勵 提升推理能力,並利用 數據篩選機制 確保訓練品質。
  此外,融合 Qwen 2.5 和 Llama 進行 知識蒸餾,提升模型泛化能力,最終透過 蒸餾技術降低計算成本,確保 DeepSeek-R1 具備高效能與低成本優勢,在推理能力與市場競爭力上取得突破。

C. 未來市場可能的變化趨勢








未來AI 產業將從算力競爭轉向架構創新,開源 LLM、低成本 AI 方案和新型架構優化技術的興起,將挑戰封閉式技術與高端 GPU 市場布局型態,進一步加速 AI 技術的普惠化與市場技術轉型。


D. 哪些企業會最先適應 DeepSeek 帶來的 AI 變局?

“見情者獲,直往則違” 

最可能適應並突圍的企業類型

就是那些受益於 LLM 成本-效能脫鉤趨勢,有能力透過資料驅動獲得市場優勢,例如:

i.  擁有大量高質量專屬資料的企業

這些企業具備 專有數據 (Proprietary Data),而不是僅依賴公有網絡數據,能夠透過自有數據訓練客製化 LLM,形成 難以被競爭對手複製的 AI 生態

ii. 低算力 AI + 高資料應用場景的企業

DeepSeek 將不會是最夠一個,這也暗示了未來及類似技術的出現必定會朝向 降低算力成本門檻的方向前進,因此過去無法負擔 LLM 訓練的小型企業,也有能力透過 開源 AI + 企業私有數據 來打造專屬 AI 應用。

iii. AI 科技公司 (突破頂級算力封鎖圈 + 降低對高資本密集算力的 依賴)

DeepSeek 的成功展示相對較低算力創造出相對高效 AI 訓練的可行性,這對其他受技術封鎖影響的市場來說是一個重大機遇,畢竟這降低了對 AI GPU 的依賴程度,更幫 AI新創(AI Startups) 打開了一條全新的發展道路


---後記

正如同我過去所預測(2024完成8個企業AI技術開發專案輔導後的心得),AI建模能力仍舊將會是AI應用技術關鍵競爭核心,從技術趨勢預測分析模型的角度來看,目前在AI 建模領域,可以說是初期階段,未來仍有很大的競爭發展空間。

也因此,AI應用、AI應用系統架構設計、AI建模,這黃金三角組合會越來越明顯。

從產業生態系巨觀的整體視角來看,我認為關鍵在於DeepSeek 有多種不同的豐富開源版本,基於這種擁有媲美ChatGPT 的應用能力且可供商業化(MIT)的開源模型,這代表AI LLM 軟體領域開源將會開啓一個新的產業生態系的發展,可預見的影響力將會非常巨大深遠,可以說是AI LLM 發展分水嶺 (開源VS.閉源)也不為過!

軟體技術的商業模式穿透力非常強,從小範圍的產品技術開發,擴散到到市場商業模式設計,甚至可大到重塑產業鏈生態系。
透過AI技術,就有機會打造出非常有吸引力產業鏈生態系(AI as an Ecosystems, AIaaE),這也是軟體技術吸迷人的地方。



REF:
https://en.wikipedia.org/wiki/DeepSeek
https://x.com/markchen90/status/1884303237186216272
https://arxiv.org/search/cs?searchtype=author&query=DeepSeek-AI
https://x.com/SirrahChan/status/1881488738473357753
https://cyeninesky3.medium.com/deepseek-r1-論文解析-強化學習如何提升-ai-推理能力-9ddbc4ded9f6


2024年11月2日 星期六

AI輔助創新- 生成式AI 在軟體開發的應用層、架構層與核心層解析與成功專案心得 (生成式AI加速產業技能典範移轉)

背景:
AI加速coding automation的發展,也因此軟體技能將開始出現典範移轉現象,這也是為什麼可以常看到大老們呼籲現在小朋友不要學寫程式,但我認為程式開發還是需要人來進行,CODING可以由AI幫忙。

前言:

2024年,今年,最令人震驚的就是諾貝爾物理獎和化學獎分別頒給了AI的科學家以及使用AI工具的科學家!從頂尖領域來看,這說明了AI不僅是輔助工具,更是推動科學突破的重要力量。學習如何利用AI來輔助創新,已成為當前迫在眉睫的需求。掌握好應用AI的技能,將使我們得以在各領域的創新中保持競爭力,迎接充滿未知的未來挑戰。

隨著 AI 技術的重要性刺激AI巨頭們的競爭而飛快加速了全球AI的技術發展,無疑地,生成式 AI 在軟體開發中的應用逐步拓展,根據筆者目前的成功專案經驗,發現生成式AI尤其在提升效率和縮短技術應用開發週期方面成效顯著。然而,不同層次的開發需求對 AI 的依賴程度也有所不同。

關鍵字:AI, 生成式AI, GAI, 創新, 技術應用開發, TRIZ, 動態系統分析, 軟體技能, 典範移轉


根據筆者參與軟體產品開發10多年的經驗,我們可以將軟體技術應用開發粗分為三大類:

應用層、架構層和核心層。

後面將分別針對應用層、架構層和核心層三大領域進行說明,根據實際的專案成果,介紹生成式 AI (GAI)在軟體開發中的潛力與挑戰。


1. 應用層:
這一層主要包括前端和後端的業務邏輯實施呈現,如網頁開發、應用程式的功能實現、以及簡單的API串接等。
這裡面的工作通常包括許多標準化、重複性的程式撰寫任務,也因此GAI的應用較為成熟。例如,GitHub Copilot、Tabnine等AI輔助程式設計工具已經能根據提示或現有的程式碼片段,生成具體的程式碼。這不僅提高了應用程式的開發效率,還能減少程式撰寫中的錯誤。

在應用層中,GAI具備逐步取代人類工程師的潛力,但這通常是針對一些簡單、重複性高的任務,#並非全面性替代

2. 架構層:
架構層涉及軟體技術系統的設計規劃,如微服務架構設計、資料庫結構選擇、伺服器配置,以及系統模組的整體執行步驟流程整合。
這些工作牽涉到較多的專業知識和判斷力,需要根據業務需求和具體場景來設計最佳的系統架構。例如,針對高流量應用,設計一個具備伸縮性的系統架構,而針對低延遲需求的應用,設計低延遲的數據處理流程。
目前GAI在這方面的應用目前仍受限,因為它很難理解複雜的不同情境的實際業務需求,因此很難也靈活地產生應對方案。
架構層的設計需要工程師根據經驗和業務需求進行決策,因此目前仍難以被GAI取代。
根據筆者目前輔導成功的最佳應用案例指出,GAI結合TRIZ動態系統分析工具應用,在輔助軟體技術系統應用架構設計開發時間,相對傳統系統架構設計開發,目前已經可以提高至 5倍(500%!!) 的效率,可以縮短將近一年半的時間!🎉

3. 核心層:
核心層涵蓋了底層技術的研發和系統的基礎架構支持,例如操作系統開發、資料處理引擎、人工智慧模型優化以及高效能計算等。
這一層次的工作具有高度的技術性和創新需求,往往涉及大量的專業知識和對新技術的探索。
例如,開發一個新的深度學習架構、設計高效能的處理算法,或是優化資料庫的查詢效率,甚至優化現有的預測模型,這些案例出現在筆者今年完成的GAI輔助創新的企業客製化專案中!

這些工作實際上需要深入理解相關技術和引入創造性思維與工具(TRIZ, 設計思考, 軟體產品開發流程等等)。然而,目前GAI技術難以在這些方面與人類專家相提並論,完全不同層次。

GAI已經無庸置疑可以輔助程式撰寫,但仍然需要專業技能與創新能力足夠的工程師進行檢視與改善。

總結而論,#生成式AI的應用效果隨工程師能力而指數提升,筆者今年企業輔導成功案例指出,在六個不同的專案中,分別至少可以縮短75%到500%的時間。
在AI持續猛進發展的基礎下,目前可以肯定的是應用層的程式撰寫,GAI的輔助比例越來越高,甚至在可預測的未來很有可能不排除會完全被GAI取代,而架構層和核心層,需要人類工程師根據情境需求設計!
—-

以上這些都是2024年筆者應用TRIZ系統創新工具結合生成式AI輔導的AI軟體開發專案輔導的成果心得,客戶學員們在10月成果發表的時候,確實獲得客戶高層領導主管們認可,也讓筆者對未來AI輔助創新的發展更有信心!

Jou-Li Wang 2024©汪周禮@智合創新
GAI輔助創新與技術應用開發
如有任何問題,歡迎與筆者聯絡:
service@iiiinnovation.com


2024年9月24日 星期二

負責任的人工智慧一致性:挑戰與未來發展趨勢

 負責任的人工智慧一致性(AI ALIGNMENT):挑戰與未來發展趨勢


#AI

#ALIGNMENT

#CHATGPT

#MSM

隨著人工智慧(AI)技術的飛速發展,AI已經深刻影響了各行各業,包括醫療、金融、教育、社交媒體和司法等關鍵領域。然而,技術的進步也帶來了新的挑戰和風險,尤其是AI系統在決策過程中可能存在的偏見、不透明性以及不公正問題。因此,負責任的人工智慧一致性研究正成為一個備受關注的領域,旨在將人類價值和倫理標準嵌入AI系統,確保其安全、透明、公平地運作。

什麼是AI一致性(ALIGNMENT)?

AI一致性是指在AI系統的開發和運作過程中,將人類價值進行編碼,從而減少系統可能帶來的風險和負面影響。這不僅包括技術層面的優化,還涵蓋了AI在倫理和社會層面的符合性。例如,在醫療保健領域,AI一致性可以幫助確保系統在診斷和治療過程中遵循醫學倫理標準,避免因數據或算法的偏見而導致患者受到不公平的對待。

AI一致性研究的目標是解決AI系統中潛在的偏見、透明度不足、決策不公以及其他可能帶來負面影響的問題。這對於保障技術的可信度和社會接受度至關重要,特別是在涉及高風險應用的領域,如醫療、金融和司法系統等。

AI一致性應用的影響

AI一致性的應用在許多領域中具有重要的社會和技術價值,尤其在促進社會公正、提升透明度和促進技術創新方面具有顯著影響。

  1. 社會公正與公平性:AI一致性最直接的影響就是推動社會公正。例如,在招聘、教育和金融服務中,通過減少AI系統中的數據偏見和算法偏見,確保系統做出的決策是基於客觀標準,而不是因性別、種族或經濟地位等無關因素導致的偏見決策。這將有助於減少歧視,促進社會公平。

  2. 提高信任與責任:透明性和可解釋性是AI一致性的另一大價值。當AI系統的決策過程對使用者和開發者透明時,系統的可解釋性和信任度將大大增強。這對於醫療、金融等涉及個人生活的重要領域尤為重要。AI一致性可以幫助這些領域建立更加透明的決策流程,從而提高用戶對技術的信心。

  3. 促進技術創新與商業競爭力:AI一致性並非只是一種防範風險的手段,它還可以促進技術創新。通過結合倫理和技術標準,企業可以在滿足道德和合規要求的同時,利用AI系統提升產品的競爭力,增強商業優勢。例如,負責任的AI系統在醫療診斷、智能製造等領域的應用,能夠幫助企業開發更具市場吸引力且合乎倫理的產品。

  4. 減少風險與損害:AI系統的不當決策可能對社會造成重大風險,特別是在高風險應用中,如醫療誤診、司法判決不公等。AI一致性通過持續監控和修正機制,降低了系統出現錯誤決策的風險,確保AI系統的行為穩定可控。

AI一致性應用的限制

儘管AI一致性研究具有重要意義,但其應用也面臨著一些挑戰和限制。

  1. 技術複雜性與透明度困難:深度學習等複雜AI技術的內部運作過於復雜,這使得系統的可解釋性和透明度大打折扣。AI一致性要求系統能夠解釋其決策邏輯,但在某些高複雜度的AI模型中,這一目標很難實現。

  2. 數據偏見與質量問題:AI系統依賴於大量數據進行訓練,而這些數據往往存在偏見或不完整的問題。如果訓練數據中包含有偏見的樣本,AI系統在實際應用中會擴大這些偏見,導致決策結果不公正。即使開發者試圖消除偏見,找到完全公平的數據集仍然是一個巨大挑戰。

  3. 監控和維護成本高昂:要保持AI系統的可解釋性和一致性,持續的監控和維護是必要的,但這會帶來高昂的成本。許多中小型企業缺乏資金和技術資源,難以有效地實現持續的系統監控和風險管理。

  4. 全球法規差異:不同國家和地區在AI監管和倫理標準上的要求各不相同,這增加了跨國企業在全球市場中實施AI一致性的難度。企業需要為不同市場設計不同的AI系統,這加大了合規成本和技術開發的複雜性。

AI一致性的未來發展趨勢

隨著AI技術的不斷發展,AI一致性研究也將朝著更深入和多樣化的方向發展。

  1. 強化AI系統的可解釋性與透明度:未來,AI系統的可解釋性將變得更加重要,特別是在高風險應用中,如醫療診斷和金融決策領域。開發可視化工具和更透明的算法,將幫助使用者和監管機構更好地理解AI系統的決策過程。

  2. 增強多方利害關係人的協作:AI開發與應用將更加依賴多方利害關係人的協作,包括開發者、監管機構、用戶和倫理專家等。跨學科和跨領域的合作將幫助確保AI系統在不同應用場景中的一致性和責任分擔。

  3. AI政策與法律監管的國際化:隨著AI技術的全球化應用,各國政府將更加重視制定國際化的AI政策和法律監管。全球性的AI一致性框架將幫助企業在跨國市場中進行合規性調整,減少監管分歧帶來的挑戰。

  4. 融合倫理標準與技術發展:未來的AI技術將更加強調與倫理標準的融合,技術開發者將更頻繁地在系統設計中融入倫理原則,確保AI技術符合社會價值和道德要求。

  5. 自動化監控和修正機制的發展:隨著AI系統變得更加自主化,未來將出現更多的自動化監控與修正機制,這些技術將能夠即時識別和修正系統中的風險和偏差。

結論

負責任的人工智慧一致性不僅是技術安全性和效率的問題,更涉及到如何確保AI系統的公平性、透明性和倫理合規。儘管面臨技術複雜性、數據偏見和監控成本等挑戰,AI一致性研究仍然是一個至關重要的領域,對社會公正、技術創新和全球政策制定產生深遠影響。隨著未來技術的發展,AI一致性將成為確保人工智慧技術安全落地、造福社會的核心保障。





---- 以上內容由汪周禮(WANG, JOULI)引導輸入九個不同問題,最後CHATGPT創作生成與後續修改,花費時間:2024.09.24 10:46-11:11,不到30分鐘


REFERENCE:

https://www.orfonline.org/expert-speak/ai-alignment-as-responsible-innovation

Further study:
AI Alignment: A Comprehensive Survey  133 cited(google scholar)
https://arxiv.org/abs/2310.19852

SW-TRIZ × FAP Model - 適用於開放式技術系統架構的TRIZ系統分析工具

  SW-TRIZ × FAP Model 作者:汪周禮(Jeffrey Jou-li Wang) 為軟體與 AI 產品開發而生的 TRIZ 系統分析方法 SW-TRIZ (TRIZ for Software) 與 TRIZ FAP(Function–Action–Paramet...