AI News

在 Creati.ai,我們持續關注人工智慧(Artificial Intelligence, AI)的演進,而 NVIDIA 的最新發佈標誌著自主系統的一個定義性時刻。2026 年 3 月 11 日,NVIDIA 正式推出了 Nemotron 3 Super,這是一個開放權重(Open-weights)、混合 Mamba-Transformer 專家混合(Mixture-of-Experts, MoE)模型,專為驅動複雜的代理推理(Agentic reasoning)任務而設計。為了減輕通常與多代理工作流相關的高昂運算成本和上下文限制,這個擁有 1200 億參數的強大模型——每個標記(Token)僅需 120 億個激活參數即可運行——有望重新定義企業級 AI 應用程式的構建與部署方式。

核心挑戰:解決上下文爆炸與思考稅

隨著企業級 AI 從簡單的聊天機器人界面轉向複雜的多代理協作,開發者面臨著兩個關鍵瓶頸。第一是業界專家所稱的「上下文爆炸(Context explosion)」。多代理工作流(Multi-agent workflows)產生的標記數量通常比標準對話式 AI 多出 15 倍。這是因為代理必須在每一步不斷交換完整的歷史記錄、中間推理步驟和工具輸出。在處理長時間任務時,這種海量的數據湧入往往會導致「目標偏離(Goal drift)」,即 AI 逐漸失去與其原始目標的一致性。

第二個瓶頸是「思考稅(Thinking tax)」。要求一個巨大的、稠密的語言模型去執行自主工作流中的每一個微小副任務,在計算上是過於昂貴的,且對於實際的現實應用來說速度慢得令人痛苦。透過利用高度優化的架構,Nemotron 3 Super 直接解決了這些限制。它提供的吞吐量是前一代 Nemotron Super 的五倍以上,使自主代理能夠在不耗盡運算預算的情況下持續大規模運行。

架構突破:混合 Mamba-Transformer MoE

Nemotron 3 Super 不僅僅是早期模型(如 Nemotron 3 Nano)的放大版;它引入了深刻的架構創新,重新定義了高容量推理引擎的效率與準確度範式。

Mamba-2 與 Transformer 注意力機制結合

該模型的骨幹網絡優雅地交織了兩種不同的層類型,以實現效能最大化。Mamba-2 層負責處理大部分序列處理工作。作為狀態空間模型(State Space Models, SSMs),它們提供相對於序列長度的線性時間複雜度。這種效率正是將巨大的 100 萬標記上下文窗口從理論概念轉化為高度實用工具的關鍵。交織在其中的是 Transformer 注意力層(Transformer attention layers),它們被策略性地放置在關鍵深度,以驅動複雜編碼、數學和多步邏輯任務所需的高級、細粒度推理。

潛在專家混合(Latent MoE)與多標記預測(MTP)

NVIDIA 進一步利用兩項尖端技術增強了這一混合基礎:

  • 潛在專家混合(Latent Mixture-of-Experts, MoE): 與標準 MoE 架構不同,潛在專家混合(Latent MoE)在標記到達專家層之前對其進行壓縮。這一架構飛躍允許模型以傳統上僅能支持一名專家的推理成本,激活四名專家專家。其結果是更細粒度的專業化、訓練期間更強的推理能力,以及大幅提高的每 FLOP 準確度。
  • 多標記預測(Multi-Token Prediction, MTP): 擺脫傳統的下一個標記生成模式,MTP 使模型能夠在單次前向傳遞中預測多個未來標記。這極大地降低了長序列的生成延遲,並啟用了內建的投機解碼(Speculative decoding),與目前領先的開源模型相比,提供了高度加速的標記生成速度。

嚴格訓練與基準測試主導地位

構建一個具備自主推理能力的模型不僅需要創新的架構;它還需要一個細緻且龐大的訓練流水線。NVIDIA 分三個連續階段訓練了 Nemotron 3 Super。首先,預訓練(Pretraining)使用 10 兆個精選標記建立了廣泛的世界知識,總計訓練了超過 25 兆個已見標記,此外還有專注於推理的 100 億個標記和 1500 萬個編碼問題。其次,監督式微調(Supervised fine-tuning, SFT)塑造了模型在各種代理任務類型中的行為。最後,多環境強化學習(Reinforcement learning, RL)針對可驗證的結果優化了這些行為,以保證高準確度的工具調用(Tool calling)和執行。

在獨立評估中,這種嚴格的訓練獲得了巨大的回報。在 Artificial Analysis 排行榜上,Nemotron 3 Super 在效率和開放性方面奪得榜首。在直接對比中,它表現出比 gpt-oss-120b 等同類模型更高的智慧,且每台 NVIDIA B200 GPU 的吞吐量高出多達 11%。與 Qwen3.5-122B 相比,Nemotron 3 Super 在長上下文任務中實現了不相上下或更優的準確度,同時提供了大幅提高的推理吞吐量。

技術規格概覽

為了更好地理解其能力的飛躍,我們編製了 Nemotron 3 Super 模型的核心規格。

功能 細節 優勢
架構 混合 Mamba-Transformer MoE 結合了高效的線性時間序列處理與先進的推理能力。
針對多代理系統進行了優化。
參數數量 總計 120B
激活 12B
大幅降低推理成本和「思考稅」,同時保持巨量模型的智慧。
上下文窗口 100 萬個標記 在記憶體中保留完整的工作流狀態,防止在長時間自主任務中出現目標偏離。
關鍵創新 潛在 MoE
多標記預測 (MTP)
以相同的運算成本調用 4 倍以上的專家。
透過內建的投機解碼加速生成。
精度 NVFP4 預訓練 確保在下一代 NVIDIA GPU 上實現高吞吐量和最佳硬體利用率。

前所未有的開放性與企業整合

在 Creati.ai,我們堅信開源可用性是 AI 快速創新的主要催化劑。NVIDIA 分享這一理念,以前所未有的透明度發佈了 Nemotron 3 Super。該模型具有完全開放的權重、食譜(Recipes),最值得注意的是,還有開放數據集。這些數據集經過激進的去重和質量過濾,以最大限度地提高信噪比,為開發者提供了構建代理 AI 的可重複構件。

廣泛的生態系統可用性

Nemotron 3 Super 的生態系統支援非常廣泛。該模型可在領先的推理平台上使用,並封裝為 NVIDIA NIM 微服務,這意味著它可以部署在從本地企業工作站到全球雲環境的任何地方。開發者可以透過 Hugging Face 直接訪問權重,使用 Unsloth 等平台對其進行微調,或透過 Together AI、Oracle Cloud Infrastructure (OCI) Generative AI、Perplexity、Lightning AI 和 DeepInfra 等託管服務部署模型。值得注意的是,其優化的腳印允許在 NVIDIA H200 或 H100 硬體上進行單 GPU 部署,大幅降低了小型工程團隊的進入門檻。

賦能下一代代理工作流

Nemotron 3 Super 的實際應用非常廣泛,特別是在需要深度技術問題解決和自主編排的行業中。

  • 軟體工程與開發: 由 Nemotron 3 Super 驅動的編碼代理可以將整個企業代碼庫加載到其 100 萬標記的上下文窗口中。這允許進行端到端的代碼生成、無縫調試和全面的重構,而無需容易出錯的文件分段或碎片化的檢索增強生成(Retrieval-augmented generation, RAG)流水線。
  • 網路安全分級: 在高風險的安全環境中,自主代理必須快速處理數千個日誌和系統狀態。模型的高準確度工具調用確保了這些代理可以可靠地導航龐大的功能庫,在即時分級威脅時防止執行錯誤。
  • 金融與科學研究: 對於深度文獻檢索或分子理解,代理可以同時將數千頁的財務報告或科學論文加載到記憶體中。這消除了在碎片化對話中重新推理的需求,指數級地提高了研究效率,並實現了全面的多步推理。

Creati.ai 的最終裁定:開放 AI 的新時代

當我們展望企業級 AI 的未來時,顯而易見的是,單純擴大稠密模型的規模已不再是多代理系統的可行路徑。NVIDIA 的 Nemotron 3 Super 代表了向高效智慧的轉型。透過將 Mamba 的長上下文能力與 Transformer 的推理實力無縫融合,並透過潛在 MoE 和多標記預測對其進行全面優化,NVIDIA 為開源 AI 社群設定了新的基準。

對於旨在構建強大、可擴展且自主的 AI 代理的開發者、研究人員和企業組織來說,Nemotron 3 Super 不僅僅是一個增量升級——它是將驅動下一代代理推理(agentic reasoning)的基礎引擎。我們 Creati.ai 將繼續密切關注開源社群如何利用這些前所未有的工具來構建未來的自主工作流。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Claude API
Claude API for Everyone
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
InstantChapters
即時生成吸引人的書籍章節。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

NVIDIA 推出 Nemotron 3 Super:用於代理推理的開放混合 Mamba-Transformer MoE

NVIDIA 發布了 Nemotron 3 Super,一款針對代理推理任務優化的開放混合型 Mamba-Transformer Mixture-of-Experts(MoE)模型,在降低推理成本的同時提供強大的性能。