Пользователи Anthropic сообщают о снижении производительности моделей ИИ Claude

Нарастающий шторм: Anthropic сталкивается с недовольством пользователей из-за производительности моделей Claude

В последние недели сообщество ИИ охвачено растущим чувством разочарования среди опытных пользователей и разработчиков, полагающихся на флагманские модели Anthropic. На таких платформах, как X, Reddit и различных форумах разработчиков, участились сообщения о том, что производительность Claude Opus и недавно представленного Claude Code значительно снизилась. Эти пользователи, которые часто платят высокие абонентские взносы за доступ к премиум-уровню, ставят под сомнение последовательность и прозрачность обновлений моделей от ИИ-гиганта.

В Creati.ai мы внимательно следим за этой дискуссией. То, что начиналось как отдельные слухи, переросло в широкую дискуссию о «нерфе моделей» (model nerfing) — подозрении, что ИИ-компании намеренно снижают возможности своих моделей, чтобы сэкономить на вычислительных мощностях, минимизировать задержки или направить поведение моделей в сторону более ограниченных результатов.

Суть обвинений

Жалобы не ограничиваются одной узкой нишей. Напротив, они представляют собой многогранный вызов репутации Anthropic как компании, создающей «наиболее человекоподобный» и способный ИИ. Разработчики указывают на несколько ключевых областей, в которых, по их мнению, Claude Opus работает хуже, чем предыдущие версии.

Ключевые области, вызывающие обеспокоенность опытных пользователей:

Эффективность программирования: Разработчики сообщают, что Claude Code, который ранее хвалили за способность справляться со сложным рефакторингом, теперь генерирует больше синтаксических ошибок и испытывает трудности с архитектурным анализом нескольких файлов одновременно.
Способности к рассуждению: Пользователи, решающие сложные логические задачи или занимающиеся написанием длинных академических текстов, отмечают, что модель стала «ленивее», часто предоставляя поверхностные ответы там, где раньше предлагала итеративные и продуманные решения.
Следование инструкциям: Растет консенсус в том, что модель стала менее внимательной к пользовательским системным промптам, часто игнорируя негативные ограничения или выходя из роли во время задач, требующих глубокого отыгрыша (ролеплея).

Влияние на рабочие процессы: сравнительный анализ

Чтобы понять масштаб этих опасений, мы классифицировали отзывы сообщества относительно предполагаемых изменений в поведении моделей.

Аспект производительности	Наблюдения до марта	Текущий пользовательский опыт
Завершение кода	Высокая точность при минимальном контексте	Частые галлюцинации и синтаксические ошибки
Логическое рассуждение	Глубокая цепочка рассуждений из нескольких шагов	Поверхностная и часто цикличная логика
Соблюдение промптов	Строгое следование заданным ограничениям	Частые «забывания» стилистических рамок
Пропускная способность задач	Стабильная производительность под нагрузкой	Вариативность качества ответов в пиковые часы

Тень «вычислительного кризиса»

В центре этого недовольства лежит теория «вычислительного кризиса» (compute crunch). Поскольку глобальный спрос на высокопроизводительные GPU — особенно NVIDIA H100 — остается на рекордном уровне, отраслевые аналитики предполагают, что такие компании, как Anthropic, находятся под огромным давлением, вынуждающим их оптимизировать затраты на инференс.

Критики утверждают, что для сохранения маржи без повышения цен на подписку провайдеры могут незаметно заменять «тяжелые» веса моделей на дистиллированные или квантованные версии. Хотя такие версии более экономичны и быстрее выполняются, они часто теряют те нюансы и надежность, от которых зависят опытные пользователи.

Однако техническая реальность редко бывает такой простой. Когда отраслевых экспертов спрашивают об этих проблемах, они часто подчеркивают, что ИИ-модели по своей природе «недетерминированы». Обновления базовой инфраструктуры, циклы обновления обучающих данных и даже незначительные изменения в реализации предохранительных барьеров безопасности могут непреднамеренно повлиять на «личность» и эффективность модели способами, которые разработчикам трудно количественно оценить.

Прозрачность и дефицит доверия

Основная проблема здесь может заключаться не в технических характеристиках, а в глубоком разрыве в корпоративных коммуникациях. Anthropic, которая исторически позиционировала себя как сторонник «Конституционного ИИ» (Constitutional AI) и безопасности, теперь сталкивается с вопросами о своей прозрачности.

Отсутствие контроля версий для конкретных «чекпоинтов» моделей означает, что у пользователей нет возможности вернуться к предыдущей версии модели, которая лучше работала для их конкретной задачи. Когда разработчик выстраивает конвейер (pipeline) вокруг поведения Claude Opus, он ожидает, что это поведение будет стабильным. Когда «черный ящик» меняется прямо под ногами, доверие, необходимое для внедрения на уровне предприятия, начинает разрушаться.

Взгляд в будущее: стабильность ИИ-моделей

По мере того как мы переходим к следующему поколению больших языковых моделей (LLM), этот эпизод становится критическим рубежом для всей отрасли. «Медовый месяц» ИИ, вероятно, закончился. Разработчики и опытные пользователи переходят от первоначального «вау-эффекта» к восприятию моделей как критически важных программных зависимостей.

Если Anthropic намерена сохранить свои лидерские позиции, она должна сбалансировать свою приверженность безопасности и экономической эффективности с практической потребностью в надежности. Независимо от того, является ли снижение производительности результатом технической оптимизации или изменения приоритетов безопасности, одно можно сказать наверняка: ИИ-сообщество больше не удовлетворяют обновления «черного ящика». Они требуют права голоса и ожидают, что инструменты, на которые они полагаются, будут поддерживать стандарты, на которых они были построены.

В Creati.ai мы продолжим отслеживать производительность этих моделей, предоставляя нашим читателям объективные данные, необходимые для того, чтобы отличить технический дрейф от намеренной оптимизации моделей. Следите за обновлениями, пока мы анализируем дальнейшие действия от Anthropic и их конкурентов в быстро меняющемся ландшафте фундаментальных моделей.