AI News

MIT CSAIL переопределяет надежность агентов с помощью EnCompass

В результате значительного шага вперед в области автономных систем исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) в сотрудничестве с Asari AI и Калифорнийским технологическим институтом представили EnCompass — инновационный фреймворк, предназначенный для решения одной из самых стойких проблем генеративного ИИ: неспособности агентов эффективно исправлять собственные ошибки.

Выпущенный сегодня фреймворк знаменует собой смену парадигмы в том, как разработчики создают агентов на базе больших языковых моделей (LLM), позволяя системам «возвращаться назад» и оптимизировать свои пути рассуждения без необходимости использования сложной инфраструктуры с кастомным кодом. Первые тесты показывают, что EnCompass может обеспечить рост точности на 15–40% для сложных задач, сокращая при этом необходимую кодовую базу на 82%, что значительно снижает порог входа для создания надежных ИИ-приложений.

Проблема «тумана в мозгах» в ИИ-агентах

По мере того как ИИ-агенты превращаются из простых чат-ботов в автономные системы, способные выполнять многоэтапные рабочие процессы — такие как помощники по программированию или аналитики данных — они сталкиваются с критическим узким местом в плане надежности. Стандартные агенты обычно обрабатывают задачи линейно. Если агент совершает незначительную ошибку на третьем этапе десятиэтапного процесса, эта ошибка накапливается, что часто приводит к полному провалу на финальном этапе. Это явление, описываемое исследователями как «туман в мозгах ИИ», приводит к тому, что агенты теряют контекст или галлюцинируют, пытаясь оправиться от ранних промахов.

Традиционно для исправления этой ситуации разработчикам приходилось вручную прописывать сложные циклы и логику обработки ошибок для каждой потенциальной точки отказа. Этот «сантехнический» код часто скрывает реальную логику агента, делая системы хрупкими и трудными в обслуживании. Современным LLM, как правило, не хватает врожденной кнопки «отмены» для процесса рассуждения, что заставляет их придерживаться ошибочного пути, даже когда они обнаруживают ошибку.

Обеспечение «путешествий во времени» для алгоритмов

EnCompass решает эту проблему путем принципиального разделения логики рабочего процесса агента и его стратегии поиска. Вместо линейной модели выполнения EnCompass позволяет рассматривать программу агента как пространство поиска.

Используя декоратор Python (@encompass.compile), разработчики могут преобразовать стандартную функцию в дерево возможностей с навигацией. Это позволяет ИИ:

  • Возвращаться назад (Backtrack): Вернуться к предыдущему состоянию, когда текущий путь дает плохие результаты.
  • Разветвлять выполнение (Fork Execution): Изучать несколько стратегий рассуждения параллельно, чтобы найти оптимальный результат.
  • Оптимизировать: Применять продвинутые алгоритмы поиска (такие как лучевой поиск или best-of-N) к рабочему процессу агента без переписывания основной логики приложения.

Эта возможность фактически дает ИИ-агентам форму «путешествия во времени», позволяя им пересматривать решения и выбирать лучший путь, подобно тому как человек пересматривает стратегию, когда понимает, что зашел в тупик.

Технический разбор: Модель PAN

Внутри EnCompass реализует модель программирования, известную как Вероятностный ангельский недетерминизм (Probabilistic Angelic Nondeterminism, PAN). Это позволяет фреймворку отделить то, что агент пытается сделать (цель), от того, как он справляется с неопределенностью выходных данных LLM (поиск). Стандартизируя это взаимодействие, EnCompass устраняет необходимость в специализированном коде для коррекции ошибок, автоматически управляя сложными состояниями.

Прорывы в производительности и эффективности

Влияние этого фреймворка на продуктивность разработчиков и производительность агентов весьма значительно. Автоматизируя компонент «поиска» в поведении агента, EnCompass позволяет разработчикам сосредоточиться исключительно на инструкциях задачи.

Следующее сравнение подчеркивает прирост эффективности, наблюдаемый в тематических исследованиях исследовательской группы:

Сравнение: стандартная разработка и фреймворк EnCompass

Характеристика Стандартная разработка агентов Фреймворк EnCompass
Обработка ошибок Ручные, жесткие циклы try/except Автоматический возврат назад и поиск пути
Объем кода Высокий (большие накладные расходы на шаблонный код) Низкий (сокращение на 82% структурного кода)
Точность Снижается с увеличением длины задачи Рост на 15–40% за счет масштабирования во время вывода
Гибкость Трудно менять стратегии Смена стратегии путем изменения одного параметра
Модель выполнения Линейная (Single Shot) На основе дерева (исследование нескольких путей)

В практических тестах, связанных со сложными задачами рассуждения, агенты, созданные с помощью EnCompass, последовательно превосходили свои стандартные аналоги. Возможность исследовать различные пути выполнения означала, что даже если базовая LLM не была идеальной, система все равно могла прийти к правильному ответу, отфильтровывая неверные цепочки рассуждений.

Последствия для индустрии ИИ

Для индустрии ИИ EnCompass представляет собой этап зрелости агентских рабочих процессов. «Масштабирование во время вывода» (inference-time scaling) — идея о том, что ИИ может «думать дольше» для получения лучших результатов — была основным направлением деятельности таких лабораторий, как OpenAI и Google DeepMind. Однако EnCompass демократизирует эту возможность, предоставляя универсальный инструмент, который любой Python-разработчик может использовать для добавления сложного поиска рассуждений в свои приложения.

Этот сдвиг имеет глубокие последствия:

  • Надежность: Теперь агентам можно доверять более длительные и последовательные задачи (например, сложное проектирование программного обеспечения или юридический анализ), где точность имеет первостепенное значение.
  • Доступность для разработчиков: Снижение сложности кода более чем на 80% означает, что небольшие команды могут создавать «умных» агентов, не обладая глубокими знаниями в алгоритмах поиска.
  • Модульность: Поскольку стратегия поиска отделена от логики, разработчики могут обновлять «процесс мышления» своего агента (например, переходя от жадного поиска к поиску по дереву Монте-Карло), не затрагивая логику промптов.

Взгляд в будущее

По мере того как MIT CSAIL и Asari AI открывают этот фреймворк для широкого сообщества, мы ожидаем волну появления на рынке «самокорректирующихся» агентов. Хотя современные LLM впечатляют, их полезность была ограничена хрупкостью в многоэтапных задачах. EnCompass обеспечивает структурную целостность, необходимую для создания следующего поколения автономного программного обеспечения — агентов, которые не просто угадывают, а думают, возвращаются назад и проверяют, пока не выполнят работу правильно.

Рекомендуемые
ThumbnailCreator.com
Инструмент с искусственным интеллектом для быстрого и легкого создания впечатляющих профессиональных миниатюр YouTube.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
Image to Video AI without Login
Бесплатный AI-инструмент «из изображения в видео», мгновенно превращающий фотографии в плавные, высококачественные анимационные видео без водяных знаков.
Anijam AI
Anijam — это нативная для ИИ анимационная платформа, которая превращает идеи в отточенные истории с помощью агентного создания видео.
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации

MIT представил фреймворк EnCompass для оптимизации AI-агентов

MIT CSAIL представляет фреймворк EnCompass, позволяющий AI-агентам откатываться и оптимизировать выводы LLM, обеспечивая прирост точности на 15–40% при снижении объема кода на 82%.