
В Creati.ai мы постоянно следим за эволюцией искусственного интеллекта, и последний релиз от NVIDIA знаменует собой определяющий момент для автономных систем. 11 марта 2026 года NVIDIA официально представила Nemotron 3 Super — модель с открытыми весами (open-weights), представляющую собой гибридную архитектуру Mamba-Transformer со смесью экспертов (Mixture-of-Experts, MoE), специально разработанную для решения сложных задач агентных рассуждений (agentic reasoning). Созданная для снижения непомерных вычислительных затрат и ограничений контекста, обычно связанных с мультиагентными рабочими процессами, эта мощная модель со 120 миллиардами параметров (из которых только 12 миллиардов активны на один токен) обещает переосмыслить способы создания и развертывания корпоративных приложений ИИ.
По мере того как корпоративный ИИ выходит за рамки простых интерфейсов чат-ботов к сложной мультиагентной оркестрации, разработчики сталкиваются с двумя критическими «узкими местами». Первое — это то, что отраслевые эксперты называют «взрывом контекста» (context explosion). Мультиагентные рабочие процессы (multi-agent workflows) часто генерируют в 15 раз больше токенов, чем стандартный диалоговый ИИ. Это происходит потому, что агенты должны постоянно обмениваться полной историей, промежуточными этапами рассуждений и результатами работы инструментов на каждом шаге. При выполнении длительных задач этот массивный приток данных часто приводит к «дрейфу целей» (goal drift), когда ИИ постепенно теряет согласованность со своей первоначальной целью.
Вторым «узким местом» является «налог на размышление» (thinking tax). Требование использования массивной плотной языковой модели для выполнения каждой незначительной подзадачи в автономном рабочем процессе является непомерно дорогим с точки зрения вычислений и мучительно медленным для практических реальных приложений. Используя высокооптимизированную архитектуру, Nemotron 3 Super напрямую устраняет эти ограничения. Она обеспечивает более чем пятикратную пропускную способность по сравнению с предыдущей итерацией Nemotron Super, позволяя автономным агентам работать непрерывно в масштабе без истощения вычислительных бюджетов.
Nemotron 3 Super — это не просто масштабированная версия ранних моделей, таких как Nemotron 3 Nano; она вводит глубокие архитектурные инновации, которые переопределяют парадигму эффективности и точности для высокопроизводительных механизмов рассуждения.
Основа модели элегантно чередует два различных типа слоев для максимизации производительности. Слои Mamba-2 справляются с основной частью обработки последовательностей. Являясь моделями пространства состояний (State Space Models, SSM), они обеспечивают линейную временную сложность относительно длины последовательности. Именно эта эффективность превращает массивное окно контекста в 1 миллион токенов из теоретической концепции в высокопрактичный инструмент. В них вкраплены слои внимания Transformer (Transformer attention layers), которые стратегически размещены на ключевых глубинах для обеспечения продвинутых, детальных рассуждений, необходимых для сложных задач по программированию, математике и многошаговой логике.
NVIDIA дополнительно усилила этот гибридный фундамент двумя передовыми методами:
Создание модели, способной к автономным рассуждениям, требует большего, чем просто инновационная архитектура; это требует тщательного и обширного конвейера обучения. NVIDIA обучала Nemotron 3 Super в три последовательных этапа. Во-первых, предварительное обучение (pretraining) сформировало широкие знания о мире с использованием 10 триллионов отобранных токенов (всего в процессе обучения было обработано 25 триллионов токенов), наряду с дополнительными 10 миллиардами токенов, специально ориентированными на рассуждения, и 15 миллионами задач по программированию. Во-вторых, контролируемое дообучение (Supervised Fine-Tuning, SFT) сформировало поведение модели в различных типах агентных задач. Наконец, обучение с подкреплением в различных средах (Reinforcement Learning, RL) уточнило это поведение в соответствии с проверяемыми результатами, чтобы гарантировать высокую точность вызова инструментов и их выполнения.
В независимых оценках это тщательное обучение принесло огромные дивиденды. В рейтингах Artificial Analysis модель Nemotron 3 Super заняла первое место по эффективности и открытости. В прямых сравнениях она продемонстрировала более высокий интеллект и до 11% более высокую пропускную способность на один GPU NVIDIA B200, чем сопоставимые модели, такие как gpt-oss-120b. По сравнению с Qwen3.5-122B, Nemotron 3 Super достигает аналогичной или превосходной точности, обеспечивая при этом значительно более высокую пропускную способность логического вывода для задач с длинным контекстом.
Чтобы лучше понять скачок в возможностях, мы составили таблицу основных характеристик модели Nemotron 3 Super.
| Функция | Детали | Преимущество |
|---|---|---|
| Архитектура | Гибридная модель Mamba-Transformer MoE | Сочетает эффективную обработку последовательностей за линейное время с расширенными возможностями рассуждения. Оптимизирована для мультиагентных систем. |
| Количество параметров | 120 млрд всего 12 млрд активных |
Радикально снижает затраты на логический вывод и «налог на размышление», сохраняя при этом интеллект массивной модели. |
| Окно контекста | 1 миллион токенов | Удерживает полное состояние рабочего процесса в памяти, предотвращая дрейф целей в длительных автономных задачах. |
| Ключевые инновации | Latent MoE Многотокенное предсказание (MTP) |
Задействует в 4 раза больше экспертов при тех же затратах на вычисления. Ускоряет генерацию за счет встроенного спекулятивного декодирования. |
| Точность | Предварительное обучение в NVFP4 | Обеспечивает высокую пропускную способность и оптимальное использование оборудования на графических процессорах NVIDIA следующего поколения. |
В Creati.ai мы твердо верим, что доступность открытого исходного кода является основным катализатором быстрых инноваций в области ИИ. NVIDIA разделяет эту философию, выпуская Nemotron 3 Super с беспрецедентным уровнем прозрачности. Модель характеризуется полностью открытыми весами, рецептами и, что наиболее примечательно, открытыми наборами данных. Эти наборы данных были подвергнуты агрессивной дедупликации и фильтрации по качеству для максимизации соотношения сигнал/шум, что дает разработчикам воспроизводимые строительные блоки для агентного ИИ.
Поддержка экосистемы для Nemotron 3 Super обширна. Модель доступна на ведущих платформах логического вывода и упакована в виде микросервиса NVIDIA NIM, что означает, что ее можно развернуть где угодно: от локальных корпоративных рабочих станций до глобальных облачных сред. Разработчики могут получить доступ к весам напрямую через Hugging Face, дообучить их с помощью таких платформ, как Unsloth, или развернуть модель через управляемые сервисы, такие как Together AI, Oracle Cloud Infrastructure (OCI) Generative AI, Perplexity, Lightning AI и DeepInfra. Примечательно, что ее оптимизированный размер позволяет выполнять развертывание на одном GPU на оборудовании NVIDIA H200 или H100, что значительно снижает порог входа для небольших инженерных команд.
Практические применения Nemotron 3 Super обширны, особенно в отраслях, требующих глубокого решения технических проблем и автономной оркестрации.
Глядя в будущее корпоративного ИИ, становится ясно, что простое масштабирование плотных моделей больше не является жизнеспособным путем для мультиагентных систем. Nemotron 3 Super от NVIDIA представляет собой мастерский поворот в сторону эффективного интеллекта. Плавно объединяя возможности длинного контекста Mamba с мощью рассуждений Transformers и оптимизируя все это с помощью Latent MoE и многотокенного предсказания (Multi-Token Prediction), NVIDIA установила новый стандарт для сообщества ИИ с открытым исходным кодом.
Для разработчиков, исследователей и корпоративных организаций, стремящихся создавать надежных, масштабируемых и автономных ИИ-агентов, Nemotron 3 Super — это не просто постепенное обновление, это базовый механизм, который будет приводить в действие следующее поколение агентных рассуждений (agentic reasoning). Мы в Creati.ai продолжим внимательно следить за тем, как сообщество разработчиков открытого ПО использует эти беспрецедентные инструменты для создания автономных рабочих процессов завтрашнего дня.