AI News

OpenAI 與 Cerebras 簽署 $10 Billion 合作,開創新局

OpenAI 已正式與 AI 晶片製造商 Cerebras Systems 簽署一項具有里程碑意義的協議,承諾投入約 $10 billion 以在 2028 年前部署 750 兆瓦的計算能力。此一策略性舉措標誌著 OpenAI 擺脫對 Nvidia 幾近獨家的依賴,並顯示出更廣泛的多元化策略,旨在確保下一代人工智慧(AI)所需的硬體。

該交易於 2026 年 1 月中旬定案,代表迄今為止非 GPU AI 加速器領域中最大型的採購合約之一。透過整合 Cerebras 的 晶圓級技術(wafer-scale technology),OpenAI 旨在解決先進「推理」模型(reasoning models)部署中的關鍵瓶頸:推論(inference)延遲。儘管 Nvidia 的 GPU 仍然是訓練(training)大型基礎模型(foundation models)的業界標準,Cerebras 的架構在即時處理方面,對於日益複雜的 AI 代理(agents)有其獨特優勢。

The Strategic Pivot: Diversifying the Supply Chain

多年來,AI 產業一直以「Nvidia 優先」的範式運作,H100 與 Blackwell 系列晶片成為模型訓練的命脈。然而,計算需求呈指數成長,再加上供應鏈限制與成本飆升,已迫使 OpenAI 培養多供應商的生態系統。

與 Cerebras 的這項協議不是孤立事件,而是精心規劃的三方硬體策略的一部分。它補足了 OpenAI 現有的路線圖,其中包括來自 Nvidia 的大規模 10 吉瓦(Gigawatts, GW)基礎設施承諾,以及與 AMD 的 6 吉瓦部署合作。透過分散硬體依賴,OpenAI 有效對沖供應短缺風險,同時利用不同供應商在特定工作負載上的架構優勢。

Unpacking the Deal Structure

這筆價值 $10 billion 的承諾採取「產能換股權(capacity-for-equity)」與服務模式構成。OpenAI 並非單純購買硬體,而是簽訂長期合約,由 Cerebras 負責在專屬資料中心部署其系統。部署將分階段進行,首批實質產能預計在 2026 年底上線,並在 2028 年前擴增至完整的 750 兆瓦。

關鍵在於,這項夥伴關係高度聚焦於 推論(inference)——即執行線上模型以生成回應的過程,而非訓練。隨著 OpenAI 從訓練 GPT-5 轉向部署「推理」模型(例如 o-series),推論的成本與速度已成為關鍵。Cerebras 的架構透過消除晶片間緩慢的資料移動,理論上能提供這些「思考」模型所需的超低延遲。

Technical Deep Dive: The Wafer-Scale Advantage

要理解為何 OpenAI 會在一個挑戰者品牌上押注 $10 billion,必須看出架構上的根本差異。傳統 GPU 叢集依賴數千顆小型晶片,透過纜線與交換器互連。資料必須在這些晶片間不斷移動,導致延遲懲罰,進而拖慢模型回應時間。

Cerebras 採取激進的方式,其 Wafer-Scale Engine(WSE-3)便是例證。Cerebras 並非將矽晶圓切割成數百顆個別晶片,而是保留晶圓完整,打造一顆如同餐盤般大小的單一處理器。

WSE-3 vs. Traditional Architectures

WSE-3 是一顆整塊的強力處理器。它在同一矽晶片基底上整合記憶與運算,提供遠超傳統 GPU 的頻寬。這使得整個模型(或其龐大層級)可以駐留於晶片上,讓「腦規模」AI 模型以過去難以企及的速度運行。

關鍵技術差異:

  • 零複製記憶(Zero-Copy Memory): 資料不需在外部記憶體與處理器之間移動,顯著降低延遲。
  • SRAM 優勢(SRAM Dominance): 該晶片使用 44GB 的片上 SRAM,速度比 GPU 使用的 HBM(High Bandwidth Memory)快數個量級。
  • 高度互連密度(Interconnect Density): 由於核心位於同一晶圓上,核心間的通訊幾乎是即時的,繞過了 PCIe 或 Ethernet 纜線的瓶頸。

The Hardware Wars: A Comparative Analysis

OpenAI 的硬體組合如今包含三大主要供應商,各自扮演明確的策略角色。以下比較說明了 Cerebras 在與 Nvidia 及 AMD 並存的更廣生態系中的定位。

Comparative Analysis of OpenAI's Hardware Partnerships

Vendor Commitment Scale Primary Workload Focus Strategic Value Proposition
Nvidia 10 Gigawatts (GW)
~$100B Investment
Training & General Inference
The backbone of GPT-5 and Stargate.
Proven Ecosystem: CUDA software stack dominance and established reliability for massive training runs.
AMD 6 Gigawatts (GW) Cost-Effective Inference
Mid-tier model deployment.
Leverage & Cost: Provides leverage in pricing negotiations and a secondary supply for high-volume, standard workloads.
Cerebras 750 Megawatts (MW)
~$10B Deal
Low-Latency Inference
Reasoning models & Agents.
Speed: Unmatched latency for "thinking" models where response time is the critical user metric.

Market Implications

此項交易向半導體市場投下震撼彈,驗證了未來 AI 硬體將走向異構化(heterogeneous)的論點。對 Cerebras 而言,這是一場定義公司地位的勝利。繼 2024 年撤回的 IPO 嘗試以及外界對其對單一中東客戶(G42)依賴的質疑後,OpenAI 的背書實質上鞏固了其頂級廠商的地位。分析師預期此交易將為 Cerebras 在 2026 年中順利上市鋪路。

對 Nvidia 而言,雖然 750MW 的交易只是其 10GW 管線的一小部分,但這代表其在高端 AI 運算上的壟斷出現首個裂縫。此舉表明超大規模雲端服務商願意為了在推論方面獲得特定性能優勢而繞過 CUDA 的護城河——而推論市場預計最終在價值上會超越訓練。

The Shift to Inference Economics

當 AI 模型從研究實驗室走向消費產品時,經濟重心將從「訓練成本」轉向「每 token 成本」與「每 token 時間」。推理模型可能在回答前「思考」數秒或數分鐘,這要求在互動瞬間投入巨量算力。Cerebras 能比 GPU 叢集更快地交付這些 token,使 OpenAI 能改善其最高階產品的使用者體驗,並可能為需要即時複雜分析的企業用戶合理化更高的訂閱價格。

Future Outlook: The Road to Stargate

OpenAI 的路線圖指向名為「Stargate」的假設性 1000 億美元超級電腦計畫。雖然預期 Nvidia 將為 Stargate 的核心訓練叢集提供動力,但引入 Cerebras 表明該設施很可能會是混合型環境。

我們可以預見未來一個 AI 請求將被動態路由的情境:廣泛且具創意的查詢可能導向 Nvidia H200 叢集;標準處理分配給 AMD MI450s;而複雜、重邏輯的推理任務則交由 Cerebras WSE-3 節點處理。這種「專用運算」的做法類似 CPU 市場的演進,不同核心各司其職,確保 OpenAI 在每瓦與每美元的效率上達到最大化。

透過現在就確保 750MW 的專用推論算力,OpenAI 正在確保當下一代推理代理準備好面向世界時,基礎設施也已到位,能讓它們以即時的速度進行思考。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Claude API
Claude API for Everyone
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
InstantChapters
即時生成吸引人的書籍章節。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

OpenAI 與 Cerebras 達成 100 億美元的 AI 晶片協議,擴大供應來源以降低對 Nvidia 的依賴

OpenAI 宣布與晶片製造商 Cerebras 簽訂了一項具有里程碑意義的 100 億美元協議,計劃在 2028 年前部署 750 兆瓦的 AI 計算能力,這將大幅擴展其硬體基礎設施並減少對 Nvidia 的依賴。