AI News

DeepMind 執行長 挑戰 OpenAI 的策略,倡議「世界模型(World Models)」

在人工智慧產業的一個決定性時刻,Google DeepMind 執行長 Demis Hassabis 公開質疑大型語言模型(Large Language Models,LLMs)所主導的現行路徑,認為像 OpenAI 這類競爭者偏好的方法不足以達到真正的通用人工智能(Artificial General Intelligence,AGI)。在 2026 年 1 月 19 日接受 CNBC 節目 "The Tech Download" 訪談時,Hassabis 闡述了向「世界模型(World Models)」的策略轉向——這類系統能夠模擬物理現實並理解因果關係,而不僅僅是基於統計關聯來預測文字。

這項批評標誌著世界主要 AI 實驗室在哲學與技術路線上的重大分歧。雖然由 Sam Altman 領導的 OpenAI 歷來堅持擴展法則(scale laws)——即增加運算與資料量必然帶來更高智慧的想法——Hassabis 則表示,這種做法在科學發明與從第一原理推理方面已經碰到「基本的瓶頸」。

以文本為主的擴展的侷限性

Hassabis 的論點核心在於資訊處理與物理理解之間的區別。大型語言模型(LLMs)擅長解析大量人類生成的文字以發現模式。然而,Hassabis 主張這些模型「並不真正理解因果」。它們可以根據訓練資料中的描述來描寫一顆掉落的蘋果,但卻無法在一個新穎環境中模擬重力物理以預測之前未見過的結果。

「當今的大型語言模型在模式辨識方面非常出色,」Hassabis 在訪談中表示。「但它們其實不真的知道為什麼 A 會導致 B。它們只是預測下一個詞元。」

對於 Creati.ai 的讀者來說,這個區別至關重要。這意味著雖然大型語言模型會繼續在對話介面與程式輔助方面改進,但它們可能仍無法達成像 AlphaGo 等級的那種解決複雜科學問題的突破,例如發現新材料或治療疾病。Hassabis 估計 AGI 還需要 5 到 10 年才可能實現,而且會需要超越當前基於 Transformer 的範式(transformer-based paradigm)的架構。

定義「世界模型」

DeepMind 的替代願景專注於建立能夠構築物理世界內部表示的 AI。這些「世界模型」不像圖書館,反而更像遊戲引擎。它們可以進行「思考實驗」、在 3D 空間中模擬結果,並以一套一致的物理定律來檢驗假說。

DeepMind 已經開始展示這種方法的可行性。Hassabis 指出 Genie 3(於 2025 年 8 月發表),該系統可從文字提示生成互動式 3D 環境,以及 SIMA 2,用以訓練 AI 代理在這些模擬世界中導航並執行任務。早期研究顯示,這類結合語言理解與空間推理的混合系統,在複雜推理任務上比純粹的大型語言模型好 20–30%,並且在基本物理相關的幻覺(hallucinations)方面顯著減少。

策略分歧:Google vs. OpenAI

這番言論的時機並非巧合。AI 產業目前正處於高度波動期。在 2025 年底 Google 推出 Gemini 3 之後,有報導指出 OpenAI 內部出現所謂的「紅色代碼(Code Red)」,原因是擔憂其擴展策略出現邊際報酬遞減。透過公開闡述僅靠大型語言模型的路徑之限制,Hassabis 將 Google 定位為不僅僅是競爭者,而是下一代 AI 架構飛躍的先驅。

這種轉變既是操作上的也是哲學上的。Hassabis 揭露他現在每日與 Alphabet 執行長 Sundar Pichai 保持聯繫,這個改變突顯了 DeepMind 作為 Google AI 工作室唯一「引擎室」的提升地位。這個精簡的組織架構旨在加速將研究突破轉化為消費產品,直接回應外界對 Google 過去行動過慢的批評。

地緣政治脈絡:中國正在縮小差距

除了技術辯論之外,Hassabis 對全球 AI 版圖也做出冷靜的評估。當被問及國際競爭時,他指出中國的 AI 模型正在迅速縮小與西方同業的性能差距。

「這是幾個月的差距,而不是幾年,」Hassabis 就美國與中國前沿模型之間的落差評論道。他引用像 Alibaba 這樣的公司以及像 Moonshot AI 這類新創的快速進展。然而,他也做出細膩的區分:中國的實驗室善於快速跟進與工程實作,但 Hassabis 對於中國現有生態是否培養出從零到一科學突破所需的特定「思維模式」持保留意見,例如最初由 Google 研究人員發明 Transformer 架構的案例。

比較分析:大型語言模型(LLMs) vs. 世界模型

為了理解此一架構辯論的利害,對比目前爭奪資源的兩種主要方法的能力與限制會很有幫助。

Comparison of Large Language Models and World Models

Feature Large Language Models (LLMs) World Models
Core Mechanism Statistical pattern recognition and token prediction Simulation of physical reality and causality
Primary Data Source Text, code, and static images from the internet 3D environments, physics engines, and video data
Reasoning Capability Correlative (associative logic) Causal (first-principles reasoning)
Key Limitation Hallucinations and lack of spatial awareness High computational cost for real-time simulation
Ideal Use Case Creative writing, coding, summarization Robotics, scientific discovery, autonomous agents
Example Systems GPT-4, Claude 3, Llama 3 Genie 3, SIMA 2, AlphaFold

(註:表格標題與內容維持原英文表述以保留專有系統名稱與技術細節。)

對 AI 產業的影響

Hassabis 對世界模型的倡議預示著產業朝向「神經符號(neuro-symbolic)」或混合型 AI 系統的一般性趨勢。對於開發者與企業領導者來說,這意味著單靠文字模型的提示工程(prompt engineering)時代可能正逐步過渡到空間運算(spatial computing)與模擬成為 AI 堆疊關鍵組件的階段。

如果 DeepMind 的假設被證明正確,下一代 AI 將不僅能談論世界——它將能夠在世界中導航。這種能力對於釋放物理經濟的潛力至關重要,包括先進的機器人技術與自主科學實驗。當 OpenAI 繼續透過語言精進 AI 的「大腦」時,DeepMind 似乎專注於賦予那個大腦一具身體與一個可以居住的世界。

隨著 2026 年展開,產業很可能看到模型開發的分岔:一條路優化語言流暢性,另一條路則優化物理智慧。對於 Creati.ai,我們將密切關注這些世界模型如何與現有的生成式工具整合,可能會催生一類新的應用,將創意生成與科學準確性結合起來。

精選
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
InstantChapters
即時生成吸引人的書籍章節。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊

DeepMind 執行長質疑 OpenAI 的策略,主張「世界模型」

Google DeepMind 執行長 Demis Hassabis 主張,像 ChatGPT 這類大型語言模型不足以實現真正的科學突破,而「世界模型」才是 AI 的未來。