AI News

Google 隨著 Gemini 3.1 Pro 的推出重奪 AI 霸主地位

Google 已正式透過發布 Gemini 3.1 Pro,重新確立了其在生成式 AI(Generative AI)領域的領先地位。該模型象徵著在抽象推理和科學問題解決方面的跨世代飛躍。這款新模型於 2026 年 2 月 19 日星期四亮相,正值「AI 軍備競賽」的關鍵時刻,其交付的性能指標果斷地超越了包括 OpenAI 的 GPT-5.2 和 Anthropic 的 Claude Opus 4.6 在內的主要競爭對手。

對於 Creati.ai 的編輯團隊而言,這次發布最引人注目的方面不僅僅是標準語言任務的漸進式增益,而是打破了抽象推理能力的上限。經早期獨立測試證實,Google 的內部數據顯示 Gemini 3.1 Pro 在著名的 ARC-AGI-2 基準測試中獲得了 77.1% 的分數。該測試旨在透過新穎的視覺謎題而非機械式記憶來衡量通用智能。這一數字代表了對先前最先進模型的巨大改進,並表明我們正逐步接近具備真正「核心推理」能力的系統。

抽象推理與科學知識的新標準

Gemini 3.1 Pro 的核心特色無疑是其推理引擎。近幾個月來,AI 行業已從以參數數量衡量成功,轉向評估「測試時運算(test-time compute)」和推理深度。Google 在 3.1 版本中的方法似乎加倍奉還了這一理念。

性能差距在 ARC-AGI-2 基準測試中表現得最為明顯。從歷史上看,大型語言模型(LLMs)一直難以應對這項測試,因為它需要解決沒有明確先前訓練數據的新穎模式匹配問題。雖然 GPT-5.2 獲得了不錯的 52.9%,而最近更新的 Claude Opus 4.6 則達到了 68.8%,但 Gemini 3.1 Pro 的 77.1% 分數建立了一個新的行業標竿。預計這種能力將直接轉化為更可靠的自主代理和能夠適應未見場景的複雜決策系統。

此外,在硬科學領域,Gemini 3.1 Pro 繼續保持領先。在 GPQA Diamond 測試(評估生物、物理和化學方面的專家級知識)中,該模型達到了 94.3% 的準確率。這略微領先於 GPT-5.2 (92.4%) 和 Claude Opus 4.6 (91.3%),鞏固了 Google 在學術和研究導向應用中的地位。

競爭性能分析

下表總結了發布會期間發布的關鍵基準測試結果。這些數字突出了 Google 成功擴大與其主要競爭對手差距的特定領域。

指標|Gemini 3.1 Pro|GPT-5.2|Claude Opus 4.6
---|---|---
ARC-AGI-2 (抽象推理)|77.1%|52.9%|68.8%
GPQA Diamond (科學知識)|94.3%|92.4%|91.3%
贏得的主要基準測試總數|19 項中的 12 項|N/A|N/A
可用性狀態|現已推出|已推出|已推出

創意編程與多模態能力

除了原始數據之外,Google 還展示了利用 Gemini 3.1 Pro 增強的多模態理解能力的實際應用。本次週期引入的一項關鍵創新是「原生 SVG 動畫生成」。與以往經常難以處理可縮放向量圖形(SVG)所需座標精確度的模型不同,Gemini 3.1 Pro 可以生成可直接用於網頁部署的乾淨、動畫化 SVG 代碼。

在發布演示中,Google 透過為《咆哮山莊》(Wuthering Heights)中的虛構人物生成一個功能齊全的個人作品集網站,展示了該模型的「創意編程」能力。該模型不僅編寫了 HTML 和 CSS,還構思了美學方向,生成了與要求語調相匹配的代碼化視覺效果。

另一個突出的例子涉及交互式設計。該模型被要求創建一個「3D 交互式椋鳥群飛(starling murmuration)」——一種鳥群飛行的複雜模擬。Gemini 3.1 Pro 成功生成了控制鳥群運動的邏輯,並將其與能對用戶鼠標交互做出動態反應的生成式聲景相結合。這向開發者和設計師發出了一個信號,他們現在可以將該模型作為複雜、交互式前端工程任務的協作夥伴。

代理間隔:待改進領域

儘管發布會基調充滿慶賀感,但 Google 的技術論文也坦誠地審視了模型的局限性。雖然 Gemini 3.1 Pro 在推理和知識檢索方面表現卓越,但據報導在特定的「代理式(agentic)」編程工作流中落後於競爭對手。

在 SWE-Bench Verified 評估(測試 AI 自主解決現實世界 GitHub 問題的能力)中,Gemini 3.1 Pro 略微落後於基於 Claude Opus 4.6 構建的專業編程代理。這表明,雖然 Google 的模型是一位卓越的思考者和架構師,但在無人干預的情況下執行長期的軟件工程任務時,可能仍需要人類監督或專用工具。

Google 高管在新聞簡報中談到了這一點,指出「代理間隔(agentic gap)」是即將到來的 Gemini 3.5 更新週期的主要焦點。目前,鼓勵透過 API 使用該模型的開發者採用「思維鏈(chain-of-thought)」提示,以在執行前最大化模型的規劃能力。

部署與可用性:從 NotebookLM 到 Antigravity

Google 正不遺餘力地在其生態系統中部署 Gemini 3.1 Pro。該模型立即開放給 Gemini Advanced 和 AI Ultra 計劃的訂閱者。

  • 針對消費者: 該模型已整合到標準 Gemini 應用中。用戶可以切換「Pro」模式以使用高級數學和編程功能。
  • 針對研究人員: NotebookLM(Google 的 AI 驅動研究助手)現在為付費用戶運行 Gemini 3.1 Pro。預計此次升級將顯著提高該工具綜合複雜文檔的能力,並生成具有更高事實準確性的播客風格音頻摘要。
  • 針對開發者: 可透過 Google AI Studio 和企業級 Vertex AI 平台訪問 API。有趣的是,Google 還預告了與「Antigravity」的新整合,這是一個尚未完全揭曉細節的產品套件,旨在面向創意專業人士,很可能利用了新的 SVG 和交互式設計能力。

市場影響:2026 年 AI 格局

Gemini 3.1 Pro 的發布正值 AI 行業動盪之際。就在幾天前,Anthropic 發布了其 Claude 系列的更新版本 Sonnet 4.6,因其計算機使用能力而受到讚譽。與此同時,OpenAI 對於 GPT-5.2 的繼任者保持相對沈默,儘管有傳言稱「GPT-6」的公告可能定於 2026 年底。

對於企業客戶而言,Google 在 ARC-AGI-2 基準測試中的勝利是最重要的指標。隨著企業從簡單的聊天機器人轉向複雜的決策代理,推理新穎問題的能力至關重要。77.1% 的得分表明,Gemini 3.1 Pro 目前是需要高風險問題解決行業(如法律取證、藥物研究和金融預測)最可行的選擇。

Creati.ai 將在未來幾週內對 Gemini 3.1 Pro 進行廣泛測試,特別關注其創意寫作的細微差別和長上下文保留能力。然而,目前基準測試數據已說明了一切:Google 已成功奪回領先地位,挑戰其競爭對手對人工智能新標準做出回應。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
InstantChapters
即時生成吸引人的書籍章節。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
Claude API
Claude API for Everyone
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

Google 發布 Gemini 3.1 Pro,在關鍵基準測試中優於 GPT-5.2 與 Claude Opus 4.6

Google 揭曉了最新的人工智慧模型 Gemini 3.1 Pro,其在 ARC-AGI-2 上的抽象推理表現提高了一倍,在 19 個主要基準測試中有 12 項超越了競爭對手 GPT-5.2 與 Claude Opus 4.6。