2025年被視為AI產業從「技術狂熱」轉向「商業理性」的關鍵一年。這一年,業界經歷了DeepSeek帶來的成本衝擊、推理模型的崛起,以及企業對投資回報率(ROI)的極度重視。隨著燒錢追逐夢想的時代過去,企業存活的關鍵不再僅僅是模型參數,而是優化整體擁有成本(TCO)的能力。
從橫向時間軸來看,AI的發展可追溯至2012年深度學習在影像辨識領域的突破,到2017年Transformer架構的出現,再到2022年底ChatGPT的誕生,展示了AI的「泛化能力」。2024至2025年間,最重要的技術進展是「推理模型」的成熟,使AI能夠處理更複雜的邏輯思考。從縱向供應鏈結構來看,AI不僅僅是單一模型,而是一個龐大的生態系統,包括晶圓代工、IC設計、硬體伺服器、雲端服務商(CSP)以及大語言模型和基於模型的應用。2025年的一個關鍵收斂點是,業界確認了大模型的能力,並開始在生態系統的上下游尋找最佳解決方案。
2025年最大的轉變是,業界不再只關注「能力」,而開始關注損益表(P&L)和TCO。隨著Transformer技術架構在未來三到五年內確立,產業必然會走向極致的「成本最佳化」。企業現在考慮的不是模型有多聰明,而是「我是否用得起」。這催生了「電力戰爭」的元年。電力限制已取代晶片,成為數據中心擴張的真正瓶頸。雲端服務商(CSP)紛紛自研TPU或ASIC晶片,以擺脫對高價GPU的依賴。NVIDIA以200億美元併購Groq,正是對此趨勢的強烈回應。Groq以LPU(語言處理單元)聞名,專攻推理端的極致效率。NVIDIA此舉旨在應對市場對GPU在執行推理任務時的效率質疑,確保自己在營運成本戰中保持不敗之地。
寫程式(Coding)是目前獲利最清晰的領域。全球有一半的Token被用於編寫程式碼。即使是對資料最敏感的IC設計公司,現在也在大規模使用AI工具來加速晶片設計。台灣與矽谷的IC設計大廠,今年都大幅擴張AI團隊並投入GPU Server,進行設計流程的最佳化。AI可負責處理「定義明確」的重複性工作,而工程師的角色則趨向於理解客戶需求,並將商業邏輯「翻譯」給AI。研究顯示,這種人機協作模式能讓開發速度提升1.5倍到3倍。
2026年的關鍵字將是「Chat to Action」。AI不再只是「給建議」,而是轉向執行「動作」。在企業內部,這會體現為Agent(代理)。隨著AI Token的成本像當年Internet封包一樣指數型下降,將會看到混合雲與邊緣運算(Edge AI)的崛起,以及更多關於資料治理、安全與可靠性的解決方案。2026年,AI將不再只是一個對話框,而是整合在服務場域中的「解決方案」。重點在於如何利用便宜的Token,在特定產業的垂直領域中創造出不可替代的創意與價值。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容