
隨著邁向通用人工智慧(AGI)的競賽日益激烈,全球金融與技術界正將關注焦點從單純的計算規模轉向根本性的結構改進。高盛(Goldman Sachs)在最近的一份專有分析報告中,指出了當代生成式 AI(Generative AI)的一個關鍵瓶頸:缺乏強大的「世界模型」。雖然大型語言模型(LLM)已展現出以統計精度預測下一個 Token 的驚人能力,但它們在因果關係、物理真實性及邏輯一致性方面往往面臨困難。
根據 高盛 研究人員的說法,這一缺失環節代表了「隨機鸚鵡」與能夠駕馭物理及經濟世界複雜性的真正智慧體之間的界限。在 Creati.ai,我們密切關注這一論述,因為它與頂尖 AI 研究人員之間日益加深的一項共識不謀而合,即若不在模型內化現實的方式上進行範式轉移,僅靠參數擴展可能會面臨邊際效益遞減。
「世界模型」指的是一種環境的內部表示,它使系統能夠預測未來狀態、理解因果關係,並基於對環境的理解而非僅僅是模式匹配來規劃行動。
當前的 深度學習 架構極度依賴龐大的數據集來識別相關性。然而,正如高盛報告中所指出的,當系統遇到分佈外(out-of-distribution)場景或需要多步驟物理推理的任務時,這些相關性往往會失效。下表突顯了當前基於 Transformer 的模型與擬議的世界模型框架之間的根本區別:
| 功能比較 | 當前生成式 AI | 整合世界模型的 AI |
|---|---|---|
| 核心機制 | 概率性 Token 預測 | 因果推理與模擬 |
| 數據依賴 | 海量文本/視覺語料庫 | 感測器融合與互動回饋 |
| 物理推理 | 有限/易產生幻覺 | 植根於物理現實 |
| 泛化能力 | 受限於分佈偏移 | 對新環境具有高度適應性 |
研究人員認定,核心問題在於目前的 AI 架構本質上是作為高級壓縮演算法運作的。透過預測序列中的下一個元素,這些模型映射了人類語言的結構,卻未能映射語言背後的現實世界結構。
高盛認為,企業級 AI 若要超越創意輔助,進入自主工業決策領域,就必須採用基於模擬的環境。這些環境將迫使模型做到:
向世界模型轉型的趨勢表明,下一波 AI 投資浪潮可能會從單純的 GPU 計算量轉向架構創新。成功跨越這一鴻溝的公司將有能力重新定義從自動駕駛物流到金融服務預測性風險管理等各個領域。
對於在 Creati.ai 觀察這些趨勢的利益相關者而言,其意義包含三個方面:
##邁向智慧的新基準
儘管將正式的世界模型整合到現有的生成式框架的道路在技術上仍然艱鉅,但來自高盛的背書標誌著金融業預計這些技術將在未來幾年內整合完成。這一轉變代表了一種認識:只要「人工智慧」還只是作為歷史文本的鏡像,而不是客觀現實的鏡像,它就將受到限制。
在 Creati.ai,我們認為因果建模與物理模擬的整合不僅僅是一個增量更新,它是下一階段更重要的 AI 發展的先決條件。隨著模型從簡單的文本生成器轉向主動推理者,我們預計對「就業末日」的擔憂將大幅減少,前提是 AI 能夠展現出只有真正的世界模型才能提供的那種細膩、以安全為導向的決策能力。
隨著產業不斷前進,對於任何尋求將 AI 作為超越新奇工具來利用的組織而言,跟蹤這些系統的發展將至關重要。從預測 Token 轉變為理解系統,是下一個偉大的前沿。