AI News

機器預知(Machine Prescience)的分水嶺時刻

在預測分析領域發生重大轉變的標誌性進展中,AI 預測引擎 Mantic 在享譽盛名的 Metaculus 秋季盃(Metaculus Fall Cup) 中奪得破紀錄的第 4 名。這項成就標誌著人工智能系統在大型通用預測競賽中獲得的有史以來最高排名,使其穩居人類平均水平之上,並超越了 99% 的人類競爭者,其中包括許多資深的「超級預測員(superforecasters)」。

於 2026 年 1 月結束的秋季盃結果,有力地驗證了 AI 預測(AI forecasting) 的飛速進展。雖然大型語言模型(LLMs)已在創意寫作和程式碼編寫方面展現出實力,但它們對複雜且不斷變化的現實世界事件(從地緣政治轉移到經濟波動)的推理能力,此前仍是一個充滿爭議的前沿領域。Mantic 的表現表明,人類直覺與機器綜合資訊之間的差距正在以超出預期的速度縮小。

「這不僅僅是關於高分;而是關於合成推理(synthetic reasoning)的可信度,」Creati.ai 資深分析師 Elena Vance 博士表示。「對於一個 AI 來說,能持續在充滿雜訊的全球新聞中穿梭,並在長達數月的錦標賽中提取準確的概率信號,證明了我們正從 生成式 AI(generative AI) 邁向洞察型 AI。」

錦標賽:不確定性的熔爐

Metaculus 平台被廣泛視為群眾外包預測的金標準。其錦標賽吸引了數千名參與者,從情報分析師、經濟學家到業餘預測愛好者不等。秋季盃(Fall Cup) 要求參賽者在三個月的時間內,對各種多變的事件結果進行預測。問題範圍從美國國會特定立法草案通過的可能性,到大宗商品價格的波動,以及國際外交峰會的結果。

與靜態基準測試不同,現場預測競賽將 AI 系統置於「戰爭迷霧」之中。模型無法背誦答案,因為事件尚未發生。它們必須攝取實時數據,權衡相互矛盾的報告,並隨著新資訊的出現更新其概率——這是一個在歷史上一直由人類主導的認知閉環。

Mantic 獲得第 4 名的成績尤為引人注目,因為它與 539 名活躍的人類參與者同場競技。在之前的夏季盃中,Mantic 曾以第 8 名的成績進入前 10 名而登上頭條。這次躍升至第 4 名不僅展示了穩定性,還體現了其底層架構改進速度的加快。

表現拆解

Mantic 的成功並非源於單次幸運的猜測,而是源於在廣泛問題組合中的精準校準。對錦標賽數據的分析揭示了該 AI 方法的幾個關鍵優勢:

  • 抵禦過度炒作: 對於人類預測員因煽動性新聞標題而湧向極端概率的問題,Mantic 通常能保持更為保守、以基準率(base-rate)為依據的估計。
  • 資訊綜合能力: 該系統展現出關聯隱晦數據點的能力,例如監管文件或地方語言新聞報告,而人類預測員可能會因為語言障礙或時間限制而忽略這些資訊。
  • 更新頻率: 人類預測員可能每週更新一次預測,而 Mantic 則能隨著變量的變化近乎實時地調整其概率,比其生物競爭對手更快地捕捉到突發新聞中的「阿爾法(alpha)」機會。

幕後解析:Mantic 如何預測未來

Mantic 是一家由 Toby Shevlane 與 Ben Day 共同創立的英國初創公司,其構建的系統與標準聊天機器人有顯著不同。它的功能更像是一家數位研究機構,而非孤獨的神諭。當面臨一個預測問題時,系統會啟動多個 AI 代理,每個代理都被分配特定的角色:尋找歷史類比、檢索當前新聞,以及挑戰系統自身初步得出的結論。

根據 Shevlane 的說法,該系統旨在成為「群體思維(groupthink)的解藥」。在許多預測社群中,人類參與者可能會受到共識觀點(「群眾智慧」)的影響,導致從眾行為。然而,Mantic 根據基本原理和數據攝取推導預測,使其能夠在有證據支持時採取反向立場。

一個體現 Mantic 近期記錄的實例涉及金磚國家(BRICS)聯盟的擴張。當 Metaculus 上的人類共識認為在特定峰會期間邀請新成員的可能性約為 70% 時,Mantic 的自動化研究標記了關鍵主辦國缺乏外交信號,以及歷史上官僚流程緩慢的先例。在整個期間,Mantic 始終保持較低的概率(約 20%)。當最終沒有新成員受邀時,人類群體被扣分,而 Mantic 的分數則大幅飆升。

預見的架構

Mantic 的架構利用了一種稱為「檢索增強推理(retrieval-augmented reasoning)」的方法。它不會簡單地憑空構想答案;它會查詢實時搜索索引,閱讀數百份文件,然後使用 LLM 將這些資訊綜合成概率判斷。

Mantic 引擎的關鍵組件:

  1. 分解(Decomposition): 將複雜問題(例如「X 公司會破產嗎?」)拆解為子問題(例如「X 公司目前的債務負擔是多少?」、「是否有待決訴訟?」、「信用評級趨勢如何?」)。
  2. 廣譜檢索(Broad-Spectrum Retrieval): 掃描全球媒體、財務報告和多種語言的社會情緒。
  3. 基準率分析(Base Rate Analysis): 將當前情況與歷史上類似事件的數據庫進行比較(參考類別預測)。
  4. 對抗性審查(Adversarial Review): 一個代理提出預測,另一個代理進行批判定,迫使系統在最終確定數字前為其邏輯辯護。

人類與機器:比較優勢

機器學習(machine learning) 在預測領域的崛起,不可避免地引發了關於人類分析師是否會過時的問題。然而,秋季盃的結果指向了一個更為微妙的未來:一種混合模式,由 AI 處理規模和數據運算,而人類則為缺乏歷史先例的「黑天鵝」事件提供高層級的語境。

下表概述了人類超級預測員與 Mantic 等 AI 系統之間的結構性差異:

比較分析:人類預測員 vs. AI 代理

指標 人類超級預測員 AI 預測引擎 (Mantic)
處理速度 緩慢(每次更新需數分鐘至數小時) 即時(每次更新僅需數秒)
數據攝取 有限(每個主題 10-50 份文件) 海量(數千份文件)
偏見易感性 高(認知偏見、情感依附) 低(算法化,儘管存在訓練數據偏見)
每次預測成本 高(薪資/時間密集型) 低(計算成本持續下降)
推理透明度 高(能透過敘事解釋「直覺」) 中(有思維鏈日誌,但存在「黑箱」邏輯)
語境細微差別 優異(理解文化/政治細微差別) 進步中(在處理諷刺或潛規則方面較吃力)

對決策情報的影響

Mantic 在第 4 名的勝利,其影響遠超錦標賽的排行榜。企業、對沖基金和政府機構正越來越多地尋求 決策情報(decision-making intelligence) 來應對動盪的世界。

目前,戰略決策通常基於高管的主觀信心或小型董事會的共識。企業級版本的 Mantic 可以針對關鍵問題(如供應鏈中斷、選舉結果或競爭對手動向)提供客觀、基於概率的「第二意見」。

「如果你是一位決定是否進入動盪市場的 CEO,你想要的不再僅僅是『是』或『否』的建議,」Vance 博士解釋道。「你想要的是從每個可用數據點推導出的概率分佈。Mantic 已經證明,AI 能夠比平均水平的專家更好地提供這種嚴謹的量化分析。」

「回溯預測」(Pastcasting)驗證

為了確保這些結果並非僥倖,研究人員還對 AI 模型進行了「回溯預測(pastcasting)」——這項技術是給予 AI 一個過去的問題(例如 2022 年),並僅允許其訪問截至該日期的新聞和數據。Mantic 和類似系統在這些回測中展現了最先進的表現,進一步驗證了其預測能力。這種嚴謹的測試方法確保了 AI 沒有通過訪問未來知識來「作弊」,確認了推理過程是健全的。

AI 預測的下一步?

隨著我們邁入 2026 年,人類與機器預測員之間的競爭預計將會加劇。Metaculus 及其他平台正在設計難度日益增加的問題,旨在「難倒」AI 模型——這些問題需要深層次的因果推理、多步邏輯或對人類心理的理解。

對於 Mantic 而言,目標很可能是奪取冠軍寶座。縮小從第 4 名到第 1 名的差距將需要克服 AI 剩餘的局限性:無法捕捉到「軟」信號,例如外交官說話的語氣,或尚未被新聞報導記錄下來的聯盟微妙轉移。

然而,隨著秋季盃結果的揭曉,問題已從「AI 能預測未來嗎?」轉變為「AI 還要多久能比我們預測得更好?」目前,Mantic 站在金字塔頂端,如同一個世界終於開始相信的數位卡珊德拉(Cassandra)。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
InstantChapters
即時生成吸引人的書籍章節。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
Claude API
Claude API for Everyone
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

AI 預測引擎 Mantic 在 Metaculus 預測錦標賽創下紀錄性的第4名

Mantic 的 AI 預測引擎在 Metaculus Fall Cup 中超越了人類預測者的平均水準,標誌著 AI 在預測現實世界事件能力上的突破。