AI News

Новый стандарт для «глубокой работы» (Deep Work)

Ландшафт искусственного интеллекта снова изменился, ознаменовав решающий момент для корпоративных и профессиональных приложений ИИ. Anthropic официально выпустила Claude Opus 4.6, модель, которая не только бросает вызов, но и фактически свергает с престола Gemini 3 Flash от Google в области сложной, высокоответственной профессиональной работы. В то время как Google провела начало 2026 года, доминируя в повестке дня благодаря скорости и мультимодальной плавности, последний релиз Anthropic делает ставку на то, что важнее всего для разработчиков и предприятий: глубину рассуждений, надежность и агентные возможности (agentic capability).

В течение последних нескольких месяцев индустрия ИИ характеризовалась «перетягиванием каната» между экосистемой Gemini от Google и серией GPT от OpenAI, при этом Gemini 3 Flash недавно заняла первое место благодаря сочетанию скорости и обработки огромного контекста. Однако выпуск Claude Opus 4.6 меняет расчеты для организаций, полагающихся на ИИ в сфере когнитивного труда.

Отчеты первых пользователей и сравнительный анализ подтверждают, что, хотя Gemini 3 Flash остается чудом скорости и мультимодальной интеграции — обрабатывая видео и аудио с беспрецедентной легкостью — Claude Opus 4.6 завоевала корону в области «глубокой работы» (deep work). Различие критически важно: там, где Gemini действует как высокоскоростной помощник, Opus 4.6 функционирует как способный младший инженер или аналитик, демонстрируя упорную способность планировать, выполнять и корректировать свои действия на длительных временных отрезках.

Реакция индустрии была мгновенной. «Opus 4.6 — это Клод из серии „просто сделай это“», — отметила команда PromptLayer в своем подробном обзоре. Это мнение разделяют и в сообществе разработчиков, где способность модели справляться с разросшимися кодовыми базами и запутанными юридическими документами, не «теряя нити», установила новый стандарт полезности.

Бенчмарки: где Opus 4.6 оставляет Gemini позади

Самый убедительный аргумент в пользу Claude Opus 4.6 заключается в необработанных данных о производительности, особенно в бенчмарках, которые имитируют реальное использование компьютера (computer use) и задачи по программированию, а не абстрактные ответы на вопросы.

Выделяются два конкретных бенчмарка: Terminal-Bench 2.0 и OSWorld. Terminal-Bench измеряет способность ИИ работать со сложными средами программирования и интерфейсами командной строки — по сути, насколько хорошо он может исполнять роль инженера-программиста. OSWorld тестирует способность модели управлять операционной системой компьютера для выполнения задач.

В обеих сферах Opus 4.6 заняла лидирующие позиции. В Terminal-Bench 2.0 модель набрала 65,4%, что является значительным скачком по сравнению с ее предшественницей и явным преимуществом перед конкурирующими моделями, такими как Gemini 3 Flash. Еще более впечатляющим является результат 72,7% в OSWorld, что указывает на то, что Anthropic добилась огромных успехов в «использовании компьютера» — способности ИИ автономно перемещаться по интерфейсам, нажимать кнопки и управлять приложениями.

Ниже приведено сравнительное описание того, как Claude Opus 4.6 соотносится с текущими передовыми моделями по ключевым показателям:

Сравнительные показатели производительности (февраль 2026 г.)
| Бенчмарк / Метрика | Claude Opus 4.6 | Gemini 3 Flash | GPT-5.2 | Claude Opus 4.5 |
|---|---|---|---|
| Terminal-Bench 2.0 (Агент для кодинга) | 65.4% | ~58% | 59.8% | 59.8% |
| OSWorld (Использование компьютера) | 72.7% | <70% | N/A | <60% |
| GDPval-AA (Эло в экономических задачах) | 1606 | N/A | 1462 | 1416 |
| ARC-AGI v2 (Рассуждение) | 68.8% | N/A | N/A | 37.6% |
| MRCR v2 (Извлечение из длинного контекста) | 76% | High | High | 18.5% |

Данные выявляют четкую тенденцию: в задачах, требующих «агентности» (agency) — способности предпринимать самостоятельные действия для решения проблемы — Opus 4.6 в настоящее время не имеет равных. Огромный скачок в показателе ARC-AGI v2, увеличившийся с 37,6% в предыдущей версии до 68,8%, свидетельствует о качественном сдвиге в том, как модель справляется с новыми, многошаговыми задачами на рассуждение, которых она не встречала в своих обучающих данных.

Больше, чем просто токены: архитектура последовательности

Одним из наиболее значимых технических достижений Claude Opus 4.6 является не только размер его контекстного окна, но и то, как он управляет этим контекстом. И Gemini 3 Flash, и Opus 4.6 могут похвастаться контекстным окном в 1 миллион токенов, что теоретически позволяет им поглощать огромные объемы данных. Однако чистая емкость часто приводит к феномену «потери в середине», когда модели забывают детали, погребенные глубоко в тексте.

Anthropic представила функцию, известную как Сжатие контекста (Context Compaction). Этот механизм автоматически суммирует старую историю разговоров для поддержания связности в ходе длительных сессий. Вместо того чтобы просто рассматривать контекстное окно как необработанный буфер, модель активно управляет своей памятью, гарантируя, что критические инструкции, данные в начале долгой сессии кодинга или юридического анализа, не исчезнут в виде галлюцинаций к тому моменту, когда пользователь достигнет отметки в 500 000 токенов.

Внутренние тесты, о которых сообщил PromptLayer, показали, что в тесте извлечения MRCR v2 Opus 4.6 достиг точности 76%, что является ошеломляющим улучшением по сравнению с 18,5% у Opus 4.5. Такая надежность делает окно в 1 миллион токенов практически применимым для корпоративных задач, таких как аудит финансовых отчетов или рефакторинг устаревших кодовых баз — задач, где единственная пропущенная деталь может стать катастрофической.

Агентные возможности: от чат-бота к коллеге

Выпуск Opus 4.6 совпадает с более широким сдвигом в том, как разработчики взаимодействуют с LLM. Мы переходим от «промпт-инжиниринга» к «оркестрации агентов», и Anthropic настроила эту модель специально для такого будущего.

Ключевым нововведением является внедрение Команд агентов (Agent Teams). Эта функция позволяет ведущему ИИ-агенту разбивать сложный проект — например, создание полнофункционального веб-приложения — и делегировать подзадачи другим экземплярам модели, работающим параллельно. В отличие от предыдущих итераций, где одна модель пыталась линейно жонглировать всеми аспектами задачи, Agent Teams имитирует человеческий рабочий процесс, где менеджер координирует специализированных работников.

Эта возможность поддерживается Режимом адаптивного мышления (Adaptive Thinking Mode), который заменяет старую функцию «Расширенного мышления». Теперь пользователи могут регулировать интенсивность рассуждений от «минимума» до «максимума». На простые запросы модель отвечает мгновенно. Для принятия сложных архитектурных решений она может сделать паузу, «подумать» глубже и составить более надежный план, прежде чем написать хотя бы одну строку кода.

Разработчики, использующие модель, сообщают, что Opus 4.6 гораздо более проактивен, чем его конкуренты. Вместо того чтобы ждать следующего промпта, он определяет необходимые подзадачи, задает уточняющие вопросы и доводит проекты до завершения. Один из ранних тестеров отметил, что модель решила 87,5% его задач по кодингу с первой попытки по сравнению с 62,5% в предыдущей версии.

Корпоративная и девелоперская экосистема

Внедрение модели произошло быстро среди крупных технологических игроков, которым требуется высокая надежность ИИ. Notion, GitHub и Replit были в числе партнеров по запуску, интегрировав Opus 4.6 в свои основные продукты.

  • Notion использует его для работы помощника, который ведет себя «меньше как инструмент и больше как коллега».
  • GitHub Copilot использует модель для сложной многошаговой генерации кода, где знание контекста имеет первостепенное значение.
  • Replit использует возможности агентного планирования, чтобы помочь пользователям создавать программное обеспечение в облачной среде IDE.

Помимо кодинга, Anthropic активно нацеливается на общие бизнес-процессы. Обновление включает в себя значительные улучшения в Claude в Excel, позволяя генерировать таблицы на естественном языке и проводить сложный анализ данных, не уступающий человеческому аналитику. Более того, предварительная версия Claude в PowerPoint демонстрирует способность модели создавать структуру слайдов и предлагать визуализации, напрямую атакуя позиции Microsoft Copilot в офисной продуктивности.

Специалисты по безопасности также нашли в Opus 4.6 мощного союзника. В демонстрации своих возможностей аудита команда Anthropic использовала модель для сканирования репозиториев с открытым исходным кодом, успешно выявив более 500 ранее неизвестных уязвимостей высокой степени серьезности. Одна эта возможность оправдывает стоимость модели для многих фирм по кибербезопасности.

Цены и доступность

Несмотря на скачок производительности, Anthropic сохранила конкурентоспособные цены на API для стандартного уровня:

  • Вход (Input): $5 за миллион токенов
  • Выход (Output): $25 за миллион токенов

Однако пользователи, использующие расширенные возможности контекста свыше 200 тысяч токенов, столкнутся с премиальными тарифами ($10/$37,50), что отражает вычислительную интенсивность управления массивной активной памятью. Для индивидуального пользователя «Pro» подписка остается на уровне $20 в месяц, хотя активные пользователи новых функций рассуждения могут быстрее достигать лимитов сообщений из-за увеличенного потребления вычислений на токен в этой модели.

Компромиссы: скорость против глубины

Хотя Claude Opus 4.6 является триумфом для профессиональных задач, он не лишен компромиссов. Основная критика в ранних обзорах касается регресса в стиле творческого письма. Методы обучения с подкреплением, использованные для оттачивания логики и навыков программирования модели, похоже, притупили ее прозу.

Пользователи, ищущие «причудливые истории» или высокостилизованный творческий контент, могут счесть ответы Opus 4.6 «более сухими и деловыми» по сравнению с яркими результатами Claude 4.5 или Gemini. Для писателей старая модель или конкурент все еще могут быть лучшим выбором.

Кроме того, существует фактор скорости. Gemini 3 Flash оправдывает свое название, предлагая ответы практически в реальном времени и нативную обработку видео, с чем Opus 4.6 не пытается сравниться. Если сценарий использования требует анализа живого видеопотока или общения с низкой задержкой, Google остается предпочтительным вариантом.

Заключение: бифуркация рынка

Выпуск Claude Opus 4.6 сигнализирует о созревании рынка ИИ и его разделении на четкие специализации. Мы больше не ищем «одну модель, чтобы править всеми». Вместо этого мы видим бифуркацию: Google Gemini доминирует в высокоскоростном мультимодальном потребительском пространстве, в то время как Claude от Anthropic прочно утвердился в качестве предпочтительного движка для глубокой, когнитивной и профессиональной работы.

Для читателей Creati.ai — разработчиков, инженеров и корпоративных лидеров — выбор становится все более ясным. Если ваш рабочий процесс включает решение сложных проблем, крупномасштабное программирование или глубокий анализ данных, Claude Opus 4.6 становится новым незаменимым инструментом в вашем стеке. Возможно, он не напишет самое поэтичное стихотворение, но он, скорее всего, напишет код, на котором будет работать платформа, где это стихотворение будет опубликовано.

Рекомендуемые
ThumbnailCreator.com
Инструмент с искусственным интеллектом для быстрого и легкого создания впечатляющих профессиональных миниатюр YouTube.
Video Watermark Remover
AI Video Watermark Remover – Clean Sora 2 & Any Video Watermarks!
AirMusic
AirMusic.ai генерирует качественные музыкальные треки с помощью ИИ по текстовым подсказкам с настройкой стиля и настроения и экспортом стемов.
AdsCreator.com
Мгновенно создавайте отполированные рекламные креативы в фирменном стиле из любого URL сайта для Meta, Google и Stories.
Refly.ai
Refly.AI даёт нетехническим создателям возможность автоматизировать рабочие процессы с помощью естественного языка и визуального полотна.
BGRemover
Легко удаляйте фоны изображений онлайн с помощью SharkFoto BGRemover.
VoxDeck
Создатель презентаций с ИИ, ведущий визуальную революцию
FineVoice
Преобразуйте текст в эмоции — Клонируйте, создавайте и настраивайте выразительные AI-голоса за считанные секунды.
Qoder
Qoder — это помощник по кодированию с искусственным интеллектом, автоматизирующий планирование, кодирование и тестирование программных проектов.
Skywork.ai
Skywork AI - это инновационный инструмент для повышения производительности с использованием ИИ.
Flowith
это агентное рабочее пространство на основе холста, которое предлагает бесплатно 🍌Nano Banana Pro и другие эффективные м
FixArt AI
FixArt AI предлагает бесплатные, безограниченные AI-инструменты для генерации изображений и видео без регистрации.
Elser AI
Универсальная веб‑студия, превращающая текст и изображения в аниме‑арт, персонажей, голоса и короткометражные фильмы.
Pippit
Поднимите создание контента с помощью мощных инструментов искусственного интеллекта Pippit!
SharkFoto
SharkFoto — это универсальная платформа с поддержкой ИИ для эффективного создания и редактирования видео, изображений и музыки.
Funy AI
Оживите свои фантазии! Создавайте ИИ-видео с поцелуями и бикини из изображений или текста. Попробуйте смену одежды. Бесп
KiloClaw
Хостинг OpenClaw-агента: развертывание в один клик, более 500 моделей, защищённая инфраструктура и автоматизированное управление агентами для команд и разработчиков.
Diagrimo
Diagrimo мгновенно преобразует текст в настраиваемые диаграммы и визуализации, созданные искусственным интеллектом.
SuperMaker AI Video Generator
Создавайте потрясающие видео, музыку и изображения без усилий с SuperMaker.
AI Clothes Changer by SharkFoto
AI Clothes Changer от SharkFoto позволяет мгновенно виртуально примерять наряды с реалистичной посадкой, текстурой и освещением.
Yollo AI
Общайтесь и творите с ИИ-партнером. Превращение фото в видео, генератор ИИ-изображений.
AnimeShorts
Создавайте потрясающие аниме-ролики без усилий с помощью передовых технологий ИИ.
Anijam AI
Anijam — это нативная для ИИ анимационная платформа, которая превращает идеи в отточенные истории с помощью агентного создания видео.
HappyHorseAIStudio
Браузерный генератор видео на базе ИИ для текста, изображений, референсов и видеомонтажа.
InstantChapters
Создавайте захватывающие главы книг мгновенно с Instant Chapters.
NerdyTips
Платформа прогнозов на футбол на базе ИИ, предоставляющая основанные на данных советы по матчам в лигах по всему миру.
happy horse AI
Open-source AI-генератор видео, создающий синхронизированные видео и аудио из текста или изображений.
WhatsApp AI Sales
WABot — это AI-«копилот» продаж для WhatsApp, который предоставляет скрипты в реальном времени, переводы и определение намерений.
insmelo AI Music Generator
Генератор музыки на базе ИИ, который превращает подсказки, тексты или загруженные файлы в отточенные, не требующие выплат авторских отчислений песни примерно за минуту.
AI Video API: Seedance 2.0 Here
Унифицированный AI API для видео, предлагающий топовые модели генерации через один ключ по более низкой цене.
wan 2.7-image
Управляемый генератор изображений на базе ИИ для точных лиц, палитр, текста и визуальной непрерывности.
Kirkify
Kirkify AI мгновенно создает вирусные мемы с заменой лиц и фирменной неон-«глитч» эстетикой для создателей мемов.
BeatMV
Веб-ориентированная платформа ИИ, которая превращает песни в кинематографические музыкальные видеоклипы и создаёт музыку с помощью ИИ.
Text to Music
Преобразуйте текст или слова в полноценные песни студийного качества с вокалом, сгенерированным ИИ, инструментами и многодорожечным экспортом.
UNI-1 AI
UNI-1 — это унифицированная модель генерации изображений, сочетающая визуальное рассуждение с высококачественным синтезом изображений.
Wan 2.7
Профессиональная модель AI для видео с точным управлением движением и согласованностью между видами.
Iara Chat
Iara Chat: Ассистент по производительности и коммуникации на основе ИИ.
Tome AI PPT
Генератор презентаций на базе ИИ, который создает, улучшает и экспортирует профессиональные слайды за считанные минуты.
Lyria3 AI
Генератор музыки на базе ИИ, который мгновенно создает высококачественные полностью продюсированные песни по текстовым подсказкам, стихам и стилям.
kinovi - Seedance 2.0 - Real Man AI Video
Бесплатный AI-генератор видео с реалистичными людьми на выходе, без водяных знаков и с полными правами для коммерческого использования.
Video Sora 2
Sora 2 AI превращает текст или изображения в короткие социальные и eCommerce-видео с физически корректным движением за считанные минуты.
Atoms
Платформа с поддержкой ИИ, которая с помощью мультиагентной автоматизации за считанные минуты создает полнофункциональные приложения и сайты без необходимости кодирования.
AI Pet Video Generator
Создавайте вирусные, легко распространяемые видео о питомцах из фотографий с помощью шаблонов на базе ИИ и мгновенного экспорта в HD для социальных платформ.
Paper Banana
Инструмент на базе ИИ для мгновенного преобразования академического текста в готовые к публикации методологические схемы и точные статистические графики.
Ampere.SH
Бесплатный управляемый хостинг OpenClaw. Разверните AI‑агентов за 60 секунд с кредитами Claude на $500.
Hitem3D
Hitem3D преобразует одно изображение в высокоразрешённые, готовые к производству 3D-модели с помощью ИИ.
HookTide
Платформа роста в LinkedIn на базе ИИ, которая изучает ваш голос, чтобы создавать контент, взаимодействовать и анализировать эффективность.
Create WhatsApp Link
Бесплатный генератор ссылок и QR для WhatsApp с аналитикой, брендированными ссылками, маршрутизацией и функциями многопользовательского чата.
GenPPT.AI
Генератор PPT на базе ИИ, который за считанные минуты создаёт, улучшает и экспортирует профессиональные презентации PowerPoint с заметками докладчика и диаграммами.
Palix AI
Универсальная AI‑платформа для создателей, позволяющая генерировать изображения, видео и музыку с использованием единой системы кредитов.
Gobii
Gobii позволяет командам создавать автономных цифровых работников 24/7 для автоматизации веб-исследований и рутинных задач.
Seedance 20 Video
Seedance 2 — это мультимодальный генератор видео с ИИ, обеспечивающий согласованных персонажей, многокадровое повествование и нативный звук в 2K.
Veemo - AI Video Generator
Veemo AI — это универсальная платформа, которая быстро создаёт видеоролики и изображения высокого качества на основе текста или изображений.
AI FIRST
Разговорный ИИ‑ассистент, автоматизирующий исследовательские задачи, работу в браузере, веб‑скрейпинг и управление файлами с помощью естественного языка.
WhatsApp Warmup Tool
Инструмент прогрева WhatsApp на базе ИИ автоматизирует массовую рассылку и предотвращает блокировку аккаунтов.
GLM Image
GLM Image сочетает гибридные авторегрессионные и диффузионные модели для генерации высококачественных AI-изображений с выдающейся отрисовкой текста.
Manga Translator AI
AI Manga Translator мгновенно переводит изображения манги на несколько языков онлайн.
TextToHuman
Бесплатный AI-очеловечиватель, который мгновенно переписывает AI-текст в естественный, похожий на человеческий стиль. Регистрация не требуется.
ainanobanana2
Nano Banana 2 генерирует изображения 4K профессионального качества за 4–6 секунд с точной отрисовкой текста и согласованностью объектов.
Remy - Newsletter Summarizer
Remy автоматизирует управление новостными рассылками, резюмируя письма в удобные для восприятия сводки.
Free AI Video Maker & Generator
Бесплатный AI создатель и генератор видео – безлимитный, без регистрации

Claude Opus 4.6 от Anthropic превосходит Google Gemini в профессиональных задачах ИИ

Claude Opus 4.6 демонстрирует прорывные результаты: 65.4% в Terminal-Bench и 72.7% в OSWorld, превосходя Gemini 3 Flash в реальных рабочих приложениях.