AI News

架構前沿:高盛挑戰當前的 AI 範式

隨著邁向通用人工智慧(AGI)的競賽日益激烈,全球金融與技術界正將關注焦點從單純的計算規模轉向根本性的結構改進。高盛(Goldman Sachs)在最近的一份專有分析報告中,指出了當代生成式 AI(Generative AI)的一個關鍵瓶頸:缺乏強大的「世界模型」。雖然大型語言模型(LLM)已展現出以統計精度預測下一個 Token 的驚人能力,但它們在因果關係、物理真實性及邏輯一致性方面往往面臨困難。

根據 高盛 研究人員的說法,這一缺失環節代表了「隨機鸚鵡」與能夠駕馭物理及經濟世界複雜性的真正智慧體之間的界限。在 Creati.ai,我們密切關注這一論述,因為它與頂尖 AI 研究人員之間日益加深的一項共識不謀而合,即若不在模型內化現實的方式上進行範式轉移,僅靠參數擴展可能會面臨邊際效益遞減。

理解世界模型缺口

世界模型」指的是一種環境的內部表示,它使系統能夠預測未來狀態、理解因果關係,並基於對環境的理解而非僅僅是模式匹配來規劃行動。

當前的 深度學習 架構極度依賴龐大的數據集來識別相關性。然而,正如高盛報告中所指出的,當系統遇到分佈外(out-of-distribution)場景或需要多步驟物理推理的任務時,這些相關性往往會失效。下表突顯了當前基於 Transformer 的模型與擬議的世界模型框架之間的根本區別:

功能比較 當前生成式 AI 整合世界模型的 AI
核心機制 概率性 Token 預測 因果推理與模擬
數據依賴 海量文本/視覺語料庫 感測器融合與互動回饋
物理推理 有限/易產生幻覺 植根於物理現實
泛化能力 受限於分佈偏移 對新環境具有高度適應性

為何預測建模仍是核心挑戰

研究人員認定,核心問題在於目前的 AI 架構本質上是作為高級壓縮演算法運作的。透過預測序列中的下一個元素,這些模型映射了人類語言的結構,卻未能映射語言背後的現實世界結構。

高盛認為,企業級 AI 若要超越創意輔助,進入自主工業決策領域,就必須採用基於模擬的環境。這些環境將迫使模型做到:

  • 預測後果: 在建議行動之前,模擬行動的結果。
  • 維持狀態: 隨著時間推移,保持對動態環境的一致性理解。
  • 識別因果: 區分單純的相關性(同時發生什麼)與因果關係(是什麼導致了什麼)。

對產業與投資的啟示

向世界模型轉型的趨勢表明,下一波 AI 投資浪潮可能會從單純的 GPU 計算量轉向架構創新。成功跨越這一鴻溝的公司將有能力重新定義從自動駕駛物流到金融服務預測性風險管理等各個領域。

對於在 Creati.ai 觀察這些趨勢的利益相關者而言,其意義包含三個方面:

  1. 研發重點轉移: 投資正從單純的性能基準(如 MMLU 分數)轉向真實世界部署的穩健性。
  2. 提高能源效率: 擁有內部世界視角的模型最終可能需要較少的訓練數據就能達到更高程度的推理,因為它們學習的是環境的「規律」,而不僅僅是暴力破解各項關係。
  3. 風險緩解: 透過解決推理缺口,開發者可以減少 AI 幻覺的發生,使系統在高度專業的應用中更加值得信賴。

##邁向智慧的新基準

儘管將正式的世界模型整合到現有的生成式框架的道路在技術上仍然艱鉅,但來自高盛的背書標誌著金融業預計這些技術將在未來幾年內整合完成。這一轉變代表了一種認識:只要「人工智慧」還只是作為歷史文本的鏡像,而不是客觀現實的鏡像,它就將受到限制。

在 Creati.ai,我們認為因果建模與物理模擬的整合不僅僅是一個增量更新,它是下一階段更重要的 AI 發展的先決條件。隨著模型從簡單的文本生成器轉向主動推理者,我們預計對「就業末日」的擔憂將大幅減少,前提是 AI 能夠展現出只有真正的世界模型才能提供的那種細膩、以安全為導向的決策能力。

隨著產業不斷前進,對於任何尋求將 AI 作為超越新奇工具來利用的組織而言,跟蹤這些系統的發展將至關重要。從預測 Token 轉變為理解系統,是下一個偉大的前沿。

精選
GPT Image 2 Online
一款具備寫實效果、精準文字渲染與強大提示詞遵循能力的 AI 圖像生成與編輯器。
Gptimg2 AI
一站式 AI 工作室,可透過文字、圖片或參考素材創建圖像與影片。
Free GPT Image 2
一款免費的 GPT Image 2 生成器,可用來建立海報、廣告、漫畫和 UI 模擬稿,並具備準確的排版效果。
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
EaseMate AI
一站式 AI 助理,將聊天、寫作、學習輔助、圖片創作與影片生成整合於同一個基於瀏覽器的平台。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
Claude API
Claude API for Everyone
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。

高盛將「世界模型」視為 AI 缺失的關鍵環節

高盛研究人員解釋了為什麼當前的 AI 系統缺乏一個基礎性的「世界模型」,以及解決這一缺口如何重塑整個 AI 產業。