AI News

Автономные агенты (Autonomous Agents) и будущее программной инженерии

В ходе масштабной демонстрации возможностей автономного ИИ исследователи Anthropic успешно использовали команду из 16 параллельных ИИ-агентов для создания функционального компилятора C с нуля. Используя недавно выпущенную модель Claude Opus 4.6, этот эксперимент знаменует собой переход от традиционной парадигмы «ИИ как помощник в написании кода» к новой эре — «ИИ как команда разработчиков». Проект, результатом которого стал написанный на Rust компилятор объемом 100 000 строк, способный скомпилировать ядро Linux 6.9, дает наглядное представление о потенциале и текущих ограничениях многоагентной программной инженерии (multi-agent software engineering).

Эксперимент под руководством исследователя Anthropic Николаса Карлини был разработан для стресс-тестирования возможностей «Команд агентов» (Agent Teams) модели Opus 4.6. В отличие от стандартных помощников по кодингу, которые требуют постоянных подсказок от человека, эти агенты работали автономно в течение почти 2 000 сеансов выполнения. Они брали задачи в работу, писали код, запускали тесты и итерировали решения при ошибках с минимальным вмешательством человека, при этом стоимость использования API составила около $20 000.

Эксперимент: Создание компилятора с нуля

Цель была амбициозной: создать на Rust компилятор C, который мог бы успешно скомпилировать ядро Linux 6.9 для архитектур x86, ARM и RISC-V. Эта задача требует высокоточной логики, глубокого понимания системных архитектур и строгого соблюдения стандартов — областей, в которых большие языковые модели (LLM) исторически испытывали трудности с последовательностью на длительных интервалах.

Исследовательская группа развернула 16 агентов Claude Opus 4.6, работающих параллельно. Чтобы управлять этой распределенной рабочей силой, они спроектировали среду совместной работы, в которой агенты действовали в независимых контейнерах Docker. Система использовала механизм lock-файлов для резервирования задач и Git для контроля версий, имитируя рабочий процесс элементарной человеческой команды разработчиков.

Ключевые показатели проекта

Метрика Значение Описание
Используемая модель Claude Opus 4.6 Новейшая передовая модель Anthropic, предназначенная для долгосрочных задач
Размер команды 16 параллельных агентов Автономные экземпляры, работающие одновременно
Всего сессий ~2 000 Количество автономных циклов выполнения
Общая стоимость ~$20 000 Расчетные затраты на API для всего проекта
Объем кода ~100 000 строк Размер результирующего компилятора на базе Rust
Критерий успеха Ядро Linux 6.9 Успешно скомпилированные загрузочные ядра для x86, ARM, RISC-V

Инженерия автономности: Валидация как способ контроля

Важнейшим выводом этого эксперимента является смещение механизмов контроля. В традиционной разработке программного обеспечения менеджеры-люди координируют задачи и проверяют код. В этом агентном рабочем процессе валидация стала основной плоскостью управления. Агенты в значительной степени полагались на надежные наборы тестов и «заведомо верные оракулы» (known-good oracles) для проверки своего прогресса.

Когда агенты сталкивались с препятствиями, такими как огромная сложность компиляции всего ядра Linux, система использовала стратегию дифференциального тестирования. Сравнивая вывод своего компилятора с установленным компилятором GCC (служащим оракулом), агенты могли изолировать несоответствия и самокорректироваться. Эта стратегия «декомпозиции» позволила агентам разбить монолитную задачу компиляции ядра на более мелкие, проверяемые единицы, что обеспечило устойчивое параллельное выполнение без постоянной поддержки со стороны человека.

Возможности и «правда» о командах агентов

Успешная компиляция ядра Linux, наряду с другими сложными проектами с открытым исходным кодом, такими как QEMU, FFmpeg, SQLite и Redis, подчеркивает несколько «истин» о текущем состоянии автономного ИИ:

  • Длительное выполнение возможно: При правильной поддержке ИИ-агенты могут сохранять контекст и продвигать прогресс в течение недель, а не минут. Система выносила состояние вовне — в кодовую базу и логи сборки, что позволяло агентам непрерывно продолжать работу.
  • Параллелизм требует независимости: Агенты работали эффективно, когда задачи можно было разделить. Использование стандартных протоколов (например, lock-файлов) позволяло им работать одновременно, хотя они часто сталкивались с конфликтами слияния — весьма человеческой проблемой в программной инженерии.
  • Чистовая реализация (Clean-Room Implementation): Компилятор создавался без прямого доступа к интернету во время разработки, опираясь исключительно на стандартную библиотеку Rust и обучающие данные модели, что продемонстрировало усвоенные моделью знания теории компиляторов и семантики C.

«Вызов»: Ограничения и инженерные реалии

Несмотря на громкий успех, проект выявил значительные ограничения, которые определяют «вызов» (dare) для будущих разработок. Результат, хотя и был функциональным, не являлся коммерчески жизнеспособным кодом.

  • Эффективность и оптимизация: Сгенерированный код был заметно неэффективным. Даже с включенными оптимизациями результат работы ИИ-компилятора был медленнее, чем результат GCC с отключенными оптимизациями. Агенты отдавали приоритет корректности (прохождению тестов), а не производительности.
  • Архитектурные пробелы: Агенты испытывали трудности с компонентами системы на «последней миле». Им не удалось реализовать 16-битный бэкенд x86, необходимый для загрузки Linux, что потребовало возврата к GCC для этого конкретного компонента. Аналогично, компоненты ассемблера и линковщика содержали ошибки и были неполными.
  • Авторитет человека: «Автономия» была ограниченной. Исследователям-людям по-прежнему приходилось определять архитектуру, устанавливать рамки и вмешиваться, когда агенты заходили в тупик (например, проблема с 16-битным компилятором). Высокоуровневое проектирование системы оставалось исключительно обязанностью человека.

Анализ сдвига: от помощника к члену команды

Этот эксперимент представляет собой фундаментальный сдвиг в том, как мы рассматриваем ИИ в жизненном цикле разработки ПО (SDLC). Мы переходим от модели «копилота» (copilot), где ИИ предлагает варианты в режиме реального времени, к «агентной» модели, где ИИ получает задачу и возвращает готовый запрос на слияние (merge request).

Сравнение моделей разработки с ИИ

Характеристика Модель Copilot / Помощник Модель команды агентов
Взаимодействие Синхронное (человек в цикле) Асинхронное (человек над циклом)
Масштаб Уровень функции/фрагмента Уровень модуля/проекта
Контекст Текущий файл/открытые вкладки Весь репозиторий и логи сборки
Контроль Проверка каждой строки человеком Автоматические тесты и конвейеры CI/CD
Основное узкое место Концентрация внимания человека Качество набора тестов и декомпозиция

Путь вперед

Для разработчиков и технических директоров (CTO) последствия очевидны, но имеют свои нюансы. Технологии для полной замены разработчиков-людей не существует; отсутствие архитектурного предвидения и возможностей оптимизации в компиляторе, созданном агентами, доказывает это. Однако возможность переложить «рутину» (toil) — повторяющуюся реализацию четко определенных спецификаций — становится реальностью.

Успех эксперимента Anthropic в значительной степени опирался на инженерию валидации (validation engineering). Агенты были ровно настолько эффективны, насколько эффективны были тесты, которые ими руководили. Это говорит о том, что будущая роль старшего инженера по программному обеспечению будет все больше смещаться в сторону проектирования этих «каркасов» — архитектурных границ, наборов тестов и критериев успеха, которые позволяют автономным агентам безопасно выполнять тяжелую работу.

Как отмечают аналитики The Futurum Group, хотя эти результаты основаны на внутренних экспериментах создателей модели в «чистых условиях», они создают доказательство концепции (proof-of-concept) для промышленного масштаба агентного ИИ. Теперь задача переходит из плоскости «может ли ИИ писать код?» в плоскость «можем ли мы проектировать системы, которые позволяют ИИ писать код безопасно?».

Эра автономных программных агентов еще не наступила в полной мере, но с компиляцией ядра Linux она определенно «загрузилась».

Рекомендуемые
ThumbnailCreator.com
Инструмент с искусственным интеллектом для быстрого и легкого создания впечатляющих профессиональных миниатюр YouTube.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
Telegram Group Bot
TGDesk — универсальный бот для групп в Telegram, позволяющий собирать лиды, повышать вовлечённость и развивать сообщества.

Команды агентов Claude компании Anthropic успешно автономно создали рабочий компилятор C

Исследователи Anthropic продемонстрировали, что 16 параллельных агентов Claude Opus 4.6, работающих автономно, создали компилятор C на базе Rust, способный скомпилировать ядро Linux 6.9 за более чем 2 000 запусков, что выявило как потенциал, так и ограничения многоагентных ИИ-систем в разработке сложного программного обеспечения.