AI News

В Creati.ai мы постоянно следим за эволюцией искусственного интеллекта, и последний релиз от NVIDIA знаменует собой определяющий момент для автономных систем. 11 марта 2026 года NVIDIA официально представила Nemotron 3 Super — модель с открытыми весами (open-weights), представляющую собой гибридную архитектуру Mamba-Transformer со смесью экспертов (Mixture-of-Experts, MoE), специально разработанную для решения сложных задач агентных рассуждений (agentic reasoning). Созданная для снижения непомерных вычислительных затрат и ограничений контекста, обычно связанных с мультиагентными рабочими процессами, эта мощная модель со 120 миллиардами параметров (из которых только 12 миллиардов активны на один токен) обещает переосмыслить способы создания и развертывания корпоративных приложений ИИ.

Основная проблема: решение проблемы взрыва контекста и «налога на размышление»

По мере того как корпоративный ИИ выходит за рамки простых интерфейсов чат-ботов к сложной мультиагентной оркестрации, разработчики сталкиваются с двумя критическими «узкими местами». Первое — это то, что отраслевые эксперты называют «взрывом контекста» (context explosion). Мультиагентные рабочие процессы (multi-agent workflows) часто генерируют в 15 раз больше токенов, чем стандартный диалоговый ИИ. Это происходит потому, что агенты должны постоянно обмениваться полной историей, промежуточными этапами рассуждений и результатами работы инструментов на каждом шаге. При выполнении длительных задач этот массивный приток данных часто приводит к «дрейфу целей» (goal drift), когда ИИ постепенно теряет согласованность со своей первоначальной целью.

Вторым «узким местом» является «налог на размышление» (thinking tax). Требование использования массивной плотной языковой модели для выполнения каждой незначительной подзадачи в автономном рабочем процессе является непомерно дорогим с точки зрения вычислений и мучительно медленным для практических реальных приложений. Используя высокооптимизированную архитектуру, Nemotron 3 Super напрямую устраняет эти ограничения. Она обеспечивает более чем пятикратную пропускную способность по сравнению с предыдущей итерацией Nemotron Super, позволяя автономным агентам работать непрерывно в масштабе без истощения вычислительных бюджетов.

Архитектурные прорывы: гибридная модель Mamba-Transformer MoE

Nemotron 3 Super — это не просто масштабированная версия ранних моделей, таких как Nemotron 3 Nano; она вводит глубокие архитектурные инновации, которые переопределяют парадигму эффективности и точности для высокопроизводительных механизмов рассуждения.

Mamba-2 встречается с механизмом внимания Transformer

Основа модели элегантно чередует два различных типа слоев для максимизации производительности. Слои Mamba-2 справляются с основной частью обработки последовательностей. Являясь моделями пространства состояний (State Space Models, SSM), они обеспечивают линейную временную сложность относительно длины последовательности. Именно эта эффективность превращает массивное окно контекста в 1 миллион токенов из теоретической концепции в высокопрактичный инструмент. В них вкраплены слои внимания Transformer (Transformer attention layers), которые стратегически размещены на ключевых глубинах для обеспечения продвинутых, детальных рассуждений, необходимых для сложных задач по программированию, математике и многошаговой логике.

Latent MoE и многотокенное предсказание (Multi-Token Prediction, MTP)

NVIDIA дополнительно усилила этот гибридный фундамент двумя передовыми методами:

  • Latent Mixture-of-Experts (MoE): В отличие от стандартных архитектур MoE, Latent MoE сжимает токены до того, как они достигнут экспертных слоев. Этот архитектурный скачок позволяет модели активировать четырех экспертов-специалистов при затратах на логический вывод (inference), традиционно требуемых только для одного. Результатом является более тонкая специализация, более сильные рассуждения во время обучения и существенно более высокая точность на один FLOP.
  • Multi-Token Prediction (MTP): Отойдя от традиционной генерации следующего токена, MTP позволяет модели предсказывать несколько будущих токенов за один прямой проход. Это радикально снижает задержку генерации для длинных последовательностей и обеспечивает встроенное спекулятивное декодирование (speculative decoding), обеспечивая значительно ускоренную генерацию токенов по сравнению с текущими ведущими открытыми моделями.

Тщательное обучение и доминирование в бенчмарках

Создание модели, способной к автономным рассуждениям, требует большего, чем просто инновационная архитектура; это требует тщательного и обширного конвейера обучения. NVIDIA обучала Nemotron 3 Super в три последовательных этапа. Во-первых, предварительное обучение (pretraining) сформировало широкие знания о мире с использованием 10 триллионов отобранных токенов (всего в процессе обучения было обработано 25 триллионов токенов), наряду с дополнительными 10 миллиардами токенов, специально ориентированными на рассуждения, и 15 миллионами задач по программированию. Во-вторых, контролируемое дообучение (Supervised Fine-Tuning, SFT) сформировало поведение модели в различных типах агентных задач. Наконец, обучение с подкреплением в различных средах (Reinforcement Learning, RL) уточнило это поведение в соответствии с проверяемыми результатами, чтобы гарантировать высокую точность вызова инструментов и их выполнения.

В независимых оценках это тщательное обучение принесло огромные дивиденды. В рейтингах Artificial Analysis модель Nemotron 3 Super заняла первое место по эффективности и открытости. В прямых сравнениях она продемонстрировала более высокий интеллект и до 11% более высокую пропускную способность на один GPU NVIDIA B200, чем сопоставимые модели, такие как gpt-oss-120b. По сравнению с Qwen3.5-122B, Nemotron 3 Super достигает аналогичной или превосходной точности, обеспечивая при этом значительно более высокую пропускную способность логического вывода для задач с длинным контекстом.

Краткие технические характеристики

Чтобы лучше понять скачок в возможностях, мы составили таблицу основных характеристик модели Nemotron 3 Super.

Функция Детали Преимущество
Архитектура Гибридная модель Mamba-Transformer MoE Сочетает эффективную обработку последовательностей за линейное время с расширенными возможностями рассуждения.
Оптимизирована для мультиагентных систем.
Количество параметров 120 млрд всего
12 млрд активных
Радикально снижает затраты на логический вывод и «налог на размышление», сохраняя при этом интеллект массивной модели.
Окно контекста 1 миллион токенов Удерживает полное состояние рабочего процесса в памяти, предотвращая дрейф целей в длительных автономных задачах.
Ключевые инновации Latent MoE
Многотокенное предсказание (MTP)
Задействует в 4 раза больше экспертов при тех же затратах на вычисления.
Ускоряет генерацию за счет встроенного спекулятивного декодирования.
Точность Предварительное обучение в NVFP4 Обеспечивает высокую пропускную способность и оптимальное использование оборудования на графических процессорах NVIDIA следующего поколения.

Беспрецедентная открытость и корпоративная интеграция

В Creati.ai мы твердо верим, что доступность открытого исходного кода является основным катализатором быстрых инноваций в области ИИ. NVIDIA разделяет эту философию, выпуская Nemotron 3 Super с беспрецедентным уровнем прозрачности. Модель характеризуется полностью открытыми весами, рецептами и, что наиболее примечательно, открытыми наборами данных. Эти наборы данных были подвергнуты агрессивной дедупликации и фильтрации по качеству для максимизации соотношения сигнал/шум, что дает разработчикам воспроизводимые строительные блоки для агентного ИИ.

Широкая доступность экосистемы

Поддержка экосистемы для Nemotron 3 Super обширна. Модель доступна на ведущих платформах логического вывода и упакована в виде микросервиса NVIDIA NIM, что означает, что ее можно развернуть где угодно: от локальных корпоративных рабочих станций до глобальных облачных сред. Разработчики могут получить доступ к весам напрямую через Hugging Face, дообучить их с помощью таких платформ, как Unsloth, или развернуть модель через управляемые сервисы, такие как Together AI, Oracle Cloud Infrastructure (OCI) Generative AI, Perplexity, Lightning AI и DeepInfra. Примечательно, что ее оптимизированный размер позволяет выполнять развертывание на одном GPU на оборудовании NVIDIA H200 или H100, что значительно снижает порог входа для небольших инженерных команд.

Расширение возможностей агентных рабочих процессов следующего поколения

Практические применения Nemotron 3 Super обширны, особенно в отраслях, требующих глубокого решения технических проблем и автономной оркестрации.

  • Разработка программного обеспечения: Агент по программированию на базе Nemotron 3 Super может загрузить всю кодовую базу предприятия в свое контекстное окно объемом 1 миллион токенов. Это позволяет осуществлять сквозную генерацию кода, бесшовную отладку и комплексный рефакторинг без необходимости в подверженной ошибкам сегментации документов или фрагментированных конвейерах генерации, дополненной поиском (Retrieval-Augmented Generation, RAG).
  • Сортировка киберугроз: В средах безопасности с высокими ставками автономные агенты должны быстро обрабатывать тысячи логов и состояний системы. Высокая точность вызова инструментов в этой модели гарантирует, что эти агенты могут надежно ориентироваться в массивных библиотеках функций, предотвращая ошибки выполнения при сортировке угроз в режиме реального времени.
  • Финансовые и научные исследования: Для глубокого поиска литературы или понимания молекул агенты могут одновременно загружать в память тысячи страниц финансовых отчетов или научных статей. Это устраняет необходимость в повторных рассуждениях по фрагментированным диалогам, экспоненциально повышая эффективность исследований и обеспечивая комплексные многошаговые рассуждения.

Окончательный вердикт Creati.ai: Новая эра для открытого ИИ

Глядя в будущее корпоративного ИИ, становится ясно, что простое масштабирование плотных моделей больше не является жизнеспособным путем для мультиагентных систем. Nemotron 3 Super от NVIDIA представляет собой мастерский поворот в сторону эффективного интеллекта. Плавно объединяя возможности длинного контекста Mamba с мощью рассуждений Transformers и оптимизируя все это с помощью Latent MoE и многотокенного предсказания (Multi-Token Prediction), NVIDIA установила новый стандарт для сообщества ИИ с открытым исходным кодом.

Для разработчиков, исследователей и корпоративных организаций, стремящихся создавать надежных, масштабируемых и автономных ИИ-агентов, Nemotron 3 Super — это не просто постепенное обновление, это базовый механизм, который будет приводить в действие следующее поколение агентных рассуждений (agentic reasoning). Мы в Creati.ai продолжим внимательно следить за тем, как сообщество разработчиков открытого ПО использует эти беспрецедентные инструменты для создания автономных рабочих процессов завтрашнего дня.

Рекомендуемые
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
Claude API
Claude API for Everyone
Image to Video AI without Login
Бесплатный AI-инструмент «из изображения в видео», мгновенно превращающий фотографии в плавные, высококачественные анимационные видео без водяных знаков.
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
Anijam AI
Anijam — это нативная для ИИ анимационная платформа, которая превращает идеи в отточенные истории с помощью агентного создания видео.
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.

NVIDIA представляет Nemotron 3 Super: открытая гибридная Mamba-Transformer MoE для агентного рассуждения

NVIDIA выпустила Nemotron 3 Super — открытую гибридную модель Mamba-Transformer с Mixture-of-Experts (MoE), оптимизированную для задач агентного рассуждения, обеспечивающую высокую производительность при сниженных затратах на инференс.