AI News

NVIDIA Blackwell 平台將 AI Token 成本較 Hopper 削減 10 倍

人工智能(Artificial Intelligence)的經濟效益正在經歷一場劇烈的變革。NVIDIA 已正式證明其 Blackwell 平台,特別是 GB200 NVL72 系統,與上一代 Hopper 架構相比,將每個 Token 的成本降低了多達 10 倍。對於 AI 行業而言——推論成本(inference costs)已成為擴展規模的主要瓶頸——這一進展標誌著一個關鍵的轉折點。

在 Creati.ai,我們密切關注大型語言模型(Large Language Model,LLM)基礎設施的發展軌跡。從以訓練為核心的價值主張向以推論為核心的效率轉型,現已成為主導敘事。NVIDIA 的最新數據證實,通過極致的硬體與軟體協同設計(hardware-software codesign),Blackwell 平台不僅速度更快,而且正在從根本上重寫醫療保健、遊戲和客戶服務領域 AI 供應商的利潤空間。

GB200 NVL72:工程化效率的突破

這項效率飛躍的核心是 NVIDIA GB200 NVL72,這是一個作為單個巨大 GPU 運行的機櫃級系統(rack-scale system)。與在離散晶片之間存在延遲瓶頸的傳統設置不同,NVL72 通過第五代 NVLink 連接了 72 個 Blackwell GPU 和 36 個 Grace CPU。

該架構提供 30TB 的統一快速記憶體,允許即使是最大的兆級參數模型也能完全駐留在單個相干記憶體域中。這消除了通常困擾多節點推論的通信開銷,直接轉化為更高的吞吐量和更低的每個生成 Token 能耗。

效率的提升通過引入 NVFP4 得到進一步放大,這是一種由 Blackwell Tensor 核心原生支持的低精度數據格式。通過在不損害模型準確性的情況下以 4 位浮點精度處理數據,該系統與 8 位格式相比有效地將吞吐量翻倍,並將每個 Token 所需的記憶體頻寬減半。

現實世界的影響:早期採用者報告巨額節省

雖然理論指標充滿前景,但現實世界的部署數據驗證了「10 倍」的說法。領先的推論服務供應商已經將基於 Blackwell 的集群整合到他們的技術棧中,並報告了營運成本和延遲的顯著降低。

下表詳細說明了特定行業參與者如何利用 Blackwell 平台轉型其經濟模式:

表 1:各行業的 Blackwell 性能與成本影響

合作夥伴 行業 關鍵應用 性能指標 成本影響
Baseten (Sully.ai) 醫療保健 醫療筆記生成 回應速度提升 65% 與專有模型相比,成本降低 90% (10x)
DeepInfra 遊戲 AI 地下城 (Latitude) 低延遲敘事生成 每百萬 Token 成本從 $0.20 降至 $0.05 (4x)
Together AI 客戶服務 Decagon 語音代理 回應時間低於 400ms 與閉源模型相比,每次查詢成本降低 6x
Fireworks AI 代理式 AI Sentient 聊天 多代理編排 與 Hopper 相比,成本效率提升 25-50%

技術三位一體:硬體、軟體與精度

10 倍的成本降低不僅僅是原始矽晶片算力的結果。它源於 NVIDIA 所謂的「極致協同設計」——三個不同層級的緊密整合:

  1. 架構: GB200 的領域特定架構針對混合專家模型(Mixture-of-Experts,MoE)進行了優化。MoE 模型在每個 Token 僅激活其一小部分參數,需要高速互連來在專家之間有效地路由數據。NVL72 的 NVLink 交換矩陣毫不費力地處理這種非線性通信量。
  2. 軟體優化: NVIDIA TensorRT-LLM 庫的廣泛採用使得供應商能夠最大限度地利用 Blackwell GPU。這個開源庫通過比通用框架更有效地管理內核執行和記憶體分配,優化了推論性能。
  3. 數據精度:NVFP4 的轉變是推論領域的遊戲規則改變者。對於 DeepInfra 來說,從 Hopper 遷移到 Blackwell 最初使成本減半,但啟用 NVFP4 後再次使成本減半,最終實現每百萬 Token 僅 5 美分的成本。這種負擔能力水平對於遊戲中的非玩家角色(Non-Player Characters,NPCs)或持續語音助手等「始終在線」的應用至關重要。

「前沿級」智能的民主化

這種成本降低的一個重要意義在於高智能模型的民主化。此前,運行大規模前沿模型對於許多初創公司來說成本高昂,迫使他們依賴較小、能力較弱的模型,或向專有巨頭支付昂貴的 API 調用費用。

藉助 Blackwell 平台,像 Together AIBaseten 這樣的供應商正在託管開源前沿模型,其性能可與專有巨頭媲美,但推論成本僅為其一小部分。例如,Sully.ai 利用 Baseten 的 Blackwell 基礎設施部署了高保真醫療 AI 「員工」,為醫生節省了超過 3,000 萬分鐘的行政工作。Blackwell 的成本結構使這成為可能,與 H100 (Hopper) 代相比,它提供了 2.5 倍的每美元吞吐量

展望未來:通往 Rubin 平台之路

儘管 Blackwell 的發布意義重大,但 NVIDIA 已經表示這只是效率持續提升節奏的一部分。該公司已經預告了即將推出的 Rubin 平台,其目標是將六款新晶片整合到單個 AI 超級電腦中。NVIDIA 預計 Rubin 將在 Blackwell 的基礎上再提供 10 倍的性能飛躍和 10 倍的 Token 成本降低

然而,在不久的將來,GB200 NVL72 將成為行業標準。對於 AI 原生公司來說,信息很明確:高昂的「智能稅」時代即將結束。通過先進的基礎設施優化 Token 經濟學,企業現在可以將焦點從管理雲端帳單轉向擴展其 AI 應用的能力和覆蓋範圍。

Creati.ai 觀點: Token 成本降低一個數量級不僅僅是硬體規格的升級;這是一次經濟解鎖。它將 AI 從高溢價的奢侈品轉變為商品化的公用事業,使以前因成本過高而無法擴展的複雜代理式工作流(agentic workflows)和實時互動成為可能。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Claude API
Claude API for Everyone
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
InstantChapters
即時生成吸引人的書籍章節。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

NVIDIA Blackwell 平台將 AI 代幣成本較 Hopper 降低 10 倍

NVIDIA 的 Blackwell GB200 NVL72 的代幣經濟性比 Hopper 高出 10 倍。領先的 AI 服務商採用 72 晶片配置。