Goldman Sachs определяет «модель мира» как недостающее звено ИИ

Архитектурный рубеж: Goldman Sachs бросает вызов текущей парадигме ИИ

По мере того как гонка к созданию сильного искусственного интеллекта (AGI) набирает обороты, мировое финансовое и технологическое сообщество смещает фокус с простого масштабирования вычислительных мощностей на фундаментальные структурные улучшения. Goldman Sachs в недавнем проприетарном анализе выделил критический «узкий участок» в современном генеративном ИИ: отсутствие надежной «модели мира» (world model). Хотя большие языковые модели (LLM) продемонстрировали поразительную способность предсказывать следующий токен со статистической точностью, они зачастую испытывают трудности с причинно-следственными связями, физическим реализмом и логической связностью.

Согласно исследователям Goldman Sachs, это недостающее звено представляет собой границу между «стохастическими попугаями» и по-настоящему интеллектуальными агентами, способными ориентироваться в сложностях физического и экономического мира. В Creati.ai мы внимательно следим за этой дискуссией, поскольку она согласуется с формирующимся среди ведущих исследователей ИИ консенсусом о том, что одно лишь масштабирование параметров может привести к снижению отдачи, если не произойдет сдвиг парадигмы в том, как модели усваивают реальность.

Понимание разрыва в моделях мира

«Модель мира» относится к внутреннему представлению среды, которое позволяет системе предсказывать будущие состояния, понимать причинно-следственные связи и планировать действия, основываясь на понимании окружающей среды, а не на простом сопоставлении паттернов.

Текущие архитектуры глубокого обучения (deep learning) в значительной степени полагаются на обширные наборы данных для выявления корреляций. Однако, как отмечается в отчете Goldman Sachs, эти корреляции часто перестают работать, когда системы сталкиваются с нетипичными сценариями (out-of-distribution) или задачами, требующими многошаговых физических рассуждений. В следующей таблице представлены основные различия между текущими моделями на базе трансформеров и предлагаемой структурой модели мира:

Сравнение характеристик	Текущий генеративный ИИ	ИИ с интегрированной моделью мира
Основной механизм	Вероятностное предсказание токенов	Причинно-следственный вывод и симуляция
Зависимость от данных	Массивные текстовые/визуальные корпуса	Сенсорное слияние и интерактивная обратная связь
Физическое рассуждение	Ограничено/склонно к галлюцинациям	Основано на физической реальности
Обобщаемость	Подвержено сдвигам распределения	Высокая адаптивность к новым условиям

Почему прогнозное моделирование остается главной проблемой

Основная проблема, выявленная исследователями, заключается в том, что текущие архитектуры ИИ, по сути, функционируют как продвинутые алгоритмы сжатия. Предсказывая следующий элемент в последовательности, эти модели отображают структуру человеческого языка, но не отображают структуру мира, стоящего за этим языком.

Goldman Sachs утверждает, что для того, чтобы корпоративный ИИ вышел за рамки творческой помощи и перешел к автономному принятию промышленных решений, он должен использовать среды, основанные на моделировании. Эти среды заставят модели:

Предсказывать последствия: Симулировать результат действия перед тем, как предлагать его.
Поддерживать состояние: Сохранять последовательное понимание динамической среды с течением времени.
Определять причинность: Различать простую корреляцию (то, что происходит вместе) и причинность (что вызывает что).

Последствия для индустрии и инвестиций

Переход к моделям мира предполагает, что следующая волна инвестиций в ИИ, вероятно, сместится от объема вычислительных мощностей GPU в сторону архитектурных инноваций. Компании, которые успешно преодолеют этот разрыв, смогут изменить целые секторы: от автономной логистики до прогнозного управления рисками в финансовых услугах.

Для стейкхолдеров, наблюдающих за этими тенденциями в Creati.ai, последствия заключаются в следующем:

Смена фокуса НИОКР: Инвестиции смещаются от простых показателей производительности (таких как баллы MMLU) в сторону надежности развертывания в реальных условиях.
Повышение энергоэффективности: Модели, обладающие внутренним видением мира, со временем могут требовать меньше обучающих данных для достижения более высокого уровня рассуждений, поскольку они изучают «законы» среды, а не просто перебирают связи грубой силой.
Смягчение рисков: Решив проблему разрыва в рассуждениях, разработчики смогут уменьшить случаи «галлюцинаций» ИИ, делая системы более надежными для критически важных профессиональных приложений.

На пути к новому эталону интеллекта

Хотя путь к интеграции формальных моделей мира в существующие генеративные фреймворки остается технически сложным, поддержка со стороны Goldman Sachs сигнализирует о том, что финансовый сектор ожидает консолидации этих технологий в течение следующих нескольких лет. Этот сдвиг отражает осознание того, что «искусственный интеллект» будет оставаться ограниченным до тех пор, пока он функционирует как зеркало исторических текстов, а не как зеркало объективной реальности.

В Creati.ai мы считаем, что интеграция причинно-следственного моделирования и физической симуляции — это не просто инкрементальное обновление, а необходимое условие для следующей, более значимой фазы развития ИИ. По мере того как модели переходят от простых генераторов текста к активным субъектам рассуждения, мы ожидаем резкого снижения опасений по поводу «апокалипсиса рабочих мест», при условии, что ИИ сможет продемонстрировать нюансированное, ориентированное на безопасность принятие решений, которое может обеспечить только настоящая модель мира.

По мере развития индустрии отслеживание разработки этих систем станет обязательным для любой организации, стремящейся использовать ИИ как нечто большее, чем просто новинку. Переход от предсказания токенов к пониманию систем — это следующий великий рубеж.