AI News

OpenAI 透過 GPT-5.2 整合提升研究能力

OpenAI 已正式為 ChatGPT 中的深度研究(Deep Research)功能推出了重大升級,現在由高度先進的 GPT-5.2 模型驅動該系統。這項策略性增強標誌著人工智慧處理複雜資訊檢索與綜合方式的關鍵轉變,從簡單的查詢響應轉向完全自主的代理式研究工作流(agentic research workflows)。此次更新引入了一系列期待已久的功能,最顯著的是在特定網站進行定向搜尋、與第三方應用程式整合,以及即時追蹤研究進度的能力。

對於依賴 AI 進行數據綜合的專業人士和學者來說,這次更新解決了先前版本中的幾個關鍵痛點。透過將底層架構從 o3 和 o4 mini 模型遷移到更強大的 GPT-5.2,OpenAI 旨在提高其研究代理的推理能力和上下文理解。此舉標誌著 OpenAI 持續致力於將 ChatGPT 從聊天機器人演變為一個全面的問題解決平台,能夠在極少的人為干預下執行多階段任務。

引入 特定網站搜尋(website-specific search) 功能對於法律研究、醫學分析和技術盡職調查等專業領域尤其具有變革性,在這些領域,資訊的出處與資訊本身同樣重要。用戶現在可以將 AI 的注意力引導至信任的網域,顯著減少通常與開放網路抓取相關的雜訊。

以 GPT-5.2 驅動深度研究

此次升級的核心在於 GPT-5.2 的整合,該模型代表了 OpenAI 生成式能力(Generative AI)的最新前沿。此前,於 2025 年推出的深度研究(Deep Research)依賴於 o3 和 o4 mini 模型。雖然這些模型效率很高,但有時缺乏處理深度複雜、多層次研究任務所需的細微推理。轉向 GPT-5.2 不僅僅是性能提升;這是一次根本性的架構升級,旨在增強系統的「代理(agentic)」行為。

GPT-5.2 為研究過程帶來了卓越的上下文保留和邏輯演繹。當用戶啟動 深度研究(Deep Research) 工作階段時,模型不只是尋找答案;它會制定研究策略。它將用戶的提示詞分解為子查詢,識別必要的資訊缺口,並執行多步驟計劃來收集數據。新模型的改進推理引擎使其能夠更好地評估來源的可信度,並將衝突的資訊綜合成連貫的敘述。

這一轉變也解決了深度研究中的「深度」問題。之前的模型可能會停留在表面層級的摘要,而 GPT-5.2 旨在更嚴謹地追蹤調查線索,遵循引用並交叉引用數據點以建立一份全面的報告。這種能力使 ChatGPT 不僅僅是一個對話夥伴,更是一個不知疲倦的研究助手,能夠將數小時的手動調查壓縮成幾分鐘的處理時間。

細粒度控制:特定網站搜尋

權力用戶社群最期待的功能之一終於到來:定向網站搜尋(Targeted Website Search)。過去, AI 網路瀏覽通常是一個「黑箱」過程——用戶可以要求資訊,但對 AI 在哪裡尋找幾乎沒有控制權,導致結果容易被低質量的 SEO 內容農場或不相關的部落格稀釋。

隨著這次更新,OpenAI 將控制權交還給了用戶。研究人員現在可以指示 ChatGPT 將其搜尋限制在特定的網域或 URL。這種細粒度的控制水平對於各種專業使用場景來說都是遊戲規則的改變者:

  • 學術研究: 將搜尋限制在 .edu 網域或特定的存儲庫網站,如 arXiv 或 JSTOR(如果可以存取)。
  • 市場分析: 專注於競爭對手網站或特定的財經新聞門戶,以收集原始數據,避免第三方聚合器的渲染。
  • 技術文件: 引導 AI 僅在特定軟體版本的官方文件中進行搜尋,避免過時的論壇建議。

這項功能將深度研究從通用工具轉變為精密儀器。透過限制搜尋空間,用戶可以大幅提高輸出的相關性和可靠性。它有效地彌合了廣闊的網際網路與內部知識庫精選安全性之間的差距。

增強的工作流與互動性

除了模型升級和搜尋控制外,OpenAI 還顯著優化了深度研究(Deep Research)的使用者體驗(UX),以支援動態、專業的工作流。以往 AI 搜尋工具靜態的「等待並觀察」方式已被透明、互動的過程所取代。

即時進度追蹤

用戶現在可以查看正在展開的研究過程。界面會即時顯示 AI 的「思考過程」,顯示其正在執行哪些查詢、正在造訪哪些網站以及正在提取哪些數據。這種透明度對於建立對系統輸出的信任至關重要。如果用戶看到 AI 陷入不相關的無底洞,可以立即介入。

中斷與引導

新系統支援「人機協同(human-in-the-loop)」的互動性。用戶不再是被動的觀察者;他們可以中斷研究進度以詢問澄清問題、細化原始提示,或手動注入 AI 可能遺漏的新來源。這種協作方式模仿了與人類初級分析師的合作,其中糾偏是自然工作流的一部分。

全螢幕報告

複雜輸出只能顯示在狹窄聊天氣泡的日子已不復返。更新後的深度研究可以生成全螢幕、格式化的報告。這些報告旨在提高可讀性和直接效用,類似於專業簡報而非聊天記錄。它們通常包含引用、數據表和結構化摘要,可以輕鬆導出或共享。

深度研究能力對比

下表概述了上一代深度研究與全新 GPT-5.2 驅動版本之間的主要差異:

功能 舊版深度研究 (2025) 新版深度研究 (GPT-5.2)
底層模型 o3 / o4 mini GPT-5.2
搜尋範圍 一般開放網路 定向 / 特定網站
用戶控制 被動(輸入並等待) 互動(中斷與引導)
輸出格式 標準聊天響應 全螢幕結構化報告
應用程式整合 有限 / 無 支援 已連線的應用程式(Connected Apps)
透明度 黑箱處理 即時進度追蹤

AI 代理的興起

OpenAI 明確將此次更新定位為「AI 代理(AI agents)」部署邁出的重要一步。與對單一提示給出單一答案的標準聊天機器人不同,代理的定義在於其感知、推理、行動和迭代以達成複雜目標的能力。

在 GPT-5.2 上運行的深度研究體現了這種代理理念。它根據用戶的初始查詢獨立啟動 多階段網路搜尋(multi-stage web searches)。它會判斷何時已有足夠資訊回答問題,以及何時需要深入挖掘。這種自主性正是「帶有 AI 的搜尋引擎」與真正的「AI 研究員」之間的區別。

連接外部應用程式的能力進一步放大了這種代理潛力。雖然所有相容應用程式的具體細節仍在演變,但該架構暗示了一個未來:深度研究不僅可以讀取網頁,還可以與內部企業數據、專案管理工具和文件存儲庫對接。這創造了一個整體的研究環境,使 AI 能夠將公共網路數據與專有的內部知識結合起來。

局限性與現實檢查

儘管各項能力有了令人印象深刻的飛躍,但對該技術的局限性保持現實的看法至關重要。OpenAI 對以下事實保持透明:雖然網路搜尋顯著降低了幻覺(hallucination)率,但並未完全消除。

錯誤的風險隨著生成文本的長度和複雜度而增加。即使是 GPT-5.2 也可能誤解一項複雜的研究,混淆兩個聽起來相似的來源,或根據有缺陷的數據提出令人信服的論點。大語言模型(LLMs)的「隨機鸚鵡(stochastic parrot)」性質,雖然透過即時網路搜尋的落地(grounding)得到了極大緩解,但仍是該技術的一個基本特徵。

因此,用戶必須繼續驗證關鍵資訊。新功能有助於這一驗證過程——透過允許特定網站搜尋並顯示研究路徑——但它們並不能取代人類判斷的需求。深度研究是一個強大的加速器,但準確性的最終責任仍落在人類用戶身上。

結論

OpenAI 深度研究升級至 GPT-5.2 不僅僅是版本號的增加;它是用戶與 AI 進行資訊探索互動方式的重構。透過將 GPT-5.2 的原始推理能力與特定網站搜尋和即時追蹤等精密控制相結合,OpenAI 打造了一款直接吸引對準確性和透明度要求更高的知識工作者的工具。

隨著 AI 代理(AI agent) 領域的競爭日益激烈——競爭對手如 Anthropic 憑藉 Claude Opus 4.6 挑戰極限——OpenAI 專注於將深度的、自主的研究能力直接整合到聊天界面中,確保其仍是現代數位工作流中的核心工具。對於 Creati.ai 的讀者來說,這次更新代表了一種可以利用的強大新能力,前提是在使用時配備適當程度的監督與驗證。

精選
ThumbnailCreator.com
利用人工智慧快速輕鬆創建驚艷且專業的YouTube縮圖工具。
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai 可從文字提示生成高品質的 AI 音樂曲目,支援風格與情緒自訂,並能匯出分軌(stems)。
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
InstantChapters
即時生成吸引人的書籍章節。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊

OpenAI 將 Deep Research 升級至 GPT-5.2,具備網站特定搜尋功能

OpenAI 在 ChatGPT 中強化其 Deep Research 功能,採用新的 GPT-5.2 模型,推出針對特定網站的搜尋功能、即時進度追蹤,以及整合已連結應用程式的能力,以提供更全面的研究功能。