Meta представляет расширенную стратегию собственных ИИ-чипов для обеспечения своих ИИ-нагрузок

Агрессивный переход Meta к собственным микросхемам

По мере ускорения гонки вооружений в области искусственного интеллекта (Artificial Intelligence, AI), требования к глобальной вычислительной инфраструктуре достигли беспрецедентного уровня. Сделав решительный шаг к обеспечению своего аппаратного будущего, Meta официально объявила о масштабном расширении программы по разработке собственных микросхем (Custom Silicon). Уделяя основное внимание проприетарному семейству ускорителей Meta Training and Inference Accelerator (MTIA), технологический гигант устанавливает новый стандарт управления нагрузками в центрах обработки данных для гиперскейлеров. Мы в Creati.ai рассматриваем этот переход как ключевой момент в эволюции инфраструктуры ИИ, сигнализирующий о широком отраслевом сдвиге от полной зависимости от сторонних поставщиков к высокооптимизированным, вертикально интегрированным аппаратным экосистемам.

Основная цель расширенной стратегии Meta в области микросхем двояка: радикально снизить операционные расходы, связанные с выполнением миллиардов ежедневных взаимодействий с ИИ, и обезопасить компанию от текущих проблем в цепочке поставок на рынке полупроводников. Хотя коммерческие графические процессоры (Graphics Processing Units, GPUs) остаются критически важными для обучения массивных базовых моделей, собственные ИИ-чипы Meta специально разработаны для решения конкретных высокообъемных задач инференса (Inference), которые обеспечивают работу рекомендательных систем и быстро расширяющихся приложений генеративного ИИ (Generative AI).

Дорожная карта MTIA: четыре поколения за 24 месяца

Анонс Meta намечает невероятно амбициозную дорожную карту продуктов, представляя четыре различных поколения чипов MTIA в течение сжатого 24-месячного окна. Это многоуровневое развертывание предназначено для систематического обновления вычислительной мощности во всей разветвленной сети дата-центров Meta, гарантируя, что аппаратные возможности компании идеально масштабируются вместе со сложностью её программных моделей.

Стратегия в значительной степени опирается на портфельный подход. Поддерживая спектр специализированных чипов, Meta гарантирует, что различные потребности в обработке — от легковесных алгоритмов ранжирования контента до вычислительно тяжелой генерации видео — будут удовлетворены с помощью самого эффективного доступного оборудования.

Поколение	Статус	Ключевой фокус	Сроки развертывания
MTIA 300	В производстве	Ранжирование и рекомендации Высокообъемный органический контент	Развернуто в настоящее время
MTIA 400	Тестирование завершено	Конфигурации плотных серверов Паритет производительности с коммерческими чипами	Конец 2026 г.
MTIA 450	В разработке	Инференс генеративного ИИ Удвоенная память с высокой пропускной способностью (HBM)	Начало 2027 г.
MTIA 500	В разработке	Продвинутые рабочие нагрузки GenAI Максимальная вычислительная мощность	Конец 2027 г.

Нарушение традиционных темпов индустрии

Исторически полупроводниковая индустрия работала в строгом 12–24-месячном цикле разработки от заморозки дизайна до массового производства. Meta полностью разрушает эту традицию, стремясь к ошеломляющему шестимесячному циклу выпуска своих новых ИИ-чипов. По словам инженерного руководства Meta, такая быстрая итерация стала возможной благодаря высокомодульным и многоразовым архитектурным решениям.

Стандартизируя форм-фактор и интерфейс процессоров MTIA, Meta может буквально внедрять новые поколения собственных микросхем (Custom Silicon) в существующие стоечные системы дата-центров. Эта модульность по принципу «plug-and-play» избавляет от необходимости полной модернизации инфраструктуры при каждом развертывании нового чипа, значительно сокращая как время простоя, так и капитальные затраты. Для организации, строящей дата-центры гигаваттного масштаба в нескольких регионах, такая операционная гибкость является критическим конкурентным преимуществом.

Стратегические последствия для инфраструктуры ИИ

Расширение программы MTIA — это не просто инженерное достижение; это фундаментальный пересмотр экономики инфраструктуры ИИ. По мере того как большие языковые модели становятся сложнее, стоимость их запуска — фаза инференса — грозит превысить доход, который они приносят.

Философия дизайна, ориентированная на инференс

Большинство коммерческих ускорителей ИИ проектируются с упором на предварительное обучение массивных моделей. Хотя чистая вычислительная мощность необходима для создания моделей, она часто оказывается крайне неэффективной и дорогостоящей для задач инференса, таких как генерация текстовых ответов, рендеринг синтетических изображений или предоставление персонализированных рекламных рекомендаций миллиардам пользователей. Meta выбирает противоположный подход, оптимизируя MTIA 450 и MTIA 500 в первую очередь для инференса генеративного ИИ.

Используя специфическую разреженность и матричные операции, присущие её проприетарным моделям, Meta достигает значительно более высокого соотношения производительности на ватт. Собственное полностековое решение, тесно интегрированное с программной платформой PyTorch с открытым исходным кодом, позволяет Meta достичь ведущей в отрасли экономической эффективности по сравнению с перепрофилированными чипами для обучения.

Баланс между собственными чипами и внешним партнерством

Несмотря на эти масштабные внутренние инвестиции, Meta не разрывает связи с традиционными лидерами полупроводниковой отрасли. Текущее расширение дата-центров компании требует огромных вычислительных мощностей уже сегодня, что привело к недавним многомиллиардным сделкам по закупкам с Nvidia и Advanced Micro Devices (AMD).

Долгосрочная стратегия Meta опирается на симбиотическую аппаратную экосистему. Коммерческие GPU высшего уровня будут по-прежнему выполнять тяжелые вычислительные задачи, необходимые для обучения моделей следующего поколения, таких как Llama 4. Тем временем чипы MTIA возьмут на себя предсказуемые высокообъемные нагрузки инференса, которые масштабируются напрямую с активностью пользователей в Facebook, Instagram и WhatsApp. Если собственное оборудование сможет успешно разгрузить хотя бы 30% этих ежедневных задач инференса в ближайшие годы, это сэкономит миллиарды долларов оптимизированных операционных расходов. Этот двухпутный подход гарантирует, что Meta избежит привязки к одному поставщику, сохраняя при этом гибкость в использовании абсолютно лучшего оборудования для любой конкретной задачи.

Технологические и производительные скачки

Технический скачок от ранних экспериментов Meta с собственными микросхемами до текущей дорожной карты MTIA значителен. Компания тесно сотрудничает с Taiwan Semiconductor Manufacturing Company (TSMC) для производства, используя передовые 5-нм техпроцессы для развернутого в данный момент MTIA 300. Это текущее поколение оснащено сеткой вычислительных элементов 8x8 и обладает высокоэффективным энергопотреблением в 90 Вт, что специально разработано с учетом жестких ограничений по мощности современных серверных стоек.

Масштабный рост пропускной способности и вычислительной мощности

По мере продвижения аппаратного развертывания к 2027 году показатели производительности будут агрессивно расти, чтобы соответствовать высоким требованиям современных нейронных сетей. Meta спроектировала значительные скачки между поколениями, чтобы их дата-центры не сталкивались с вычислительными узкими местами:

Беспрецедентный рост вычислений: Meta прогнозирует 25-кратное улучшение общих вычислительных FLOPS от MTIA 300 до передового MTIA 500.
Преодоление узких мест памяти: Ожидается, что пропускная способность памяти с высокой пропускной способностью (HBM), критический фактор для крупномасштабных развертываний, увеличится примерно в 4,5 раза в рамках дорожной карты развития.
Обновления ближайшего поколения: Только предстоящий MTIA 400 обеспечивает 400-процентное увеличение FP8 FLOPS и 51-процентный прирост пропускной способности HBM по сравнению со своим непосредственным предшественником.

Поскольку пропускная способность памяти часто является основным узким местом при инференсе больших языковых моделей, эти аппаратные улучшения напрямую трансформируются в более быструю генерацию токенов и меньшую задержку для конечных пользователей. Кроме того, интеграция со стандартной архитектурой Open Compute Project (OCP) позволяет Meta плотно упаковывать до 72 ускорителей в одну серверную стойку, оптимизируя как физическое пространство, так и управление тепловыделением в рамках расширяющейся инфраструктуры дата-центров.

Перспектива Creati.ai: изменение экосистемы аппаратного обеспечения ИИ

С нашей точки зрения в Creati.ai, агрессивное развертывание семейства MTIA компанией Meta является важным индикатором для всей индустрии искусственного интеллекта. Эпоха отношения к инфраструктуре ИИ как к простой покупке готовых GPU быстро подходит к концу для крупнейших мировых технологических конгломератов. Перенося проектирование микросхем непосредственно внутрь компании, гиперскейлеры получают полный контроль над своими технологическими возможностями и финансовой судьбой.

Если Meta успешно реализует этот напряженный шестимесячный цикл выпуска чипов и подтвердит экономическую эффективность своей стратегии, ориентированной на инференс, мы ожидаем массового эффекта домино во всем секторе. Успех программы MTIA доказывает, что глубоко интегрированные специализированные интегральные схемы (Application-Specific Integrated Circuits, ASICs) могут соответствовать темпам инноваций традиционных поставщиков полупроводников или даже превосходить их при наличии достаточного масштаба и инвестиций.

По мере того как генеративный ИИ продолжает переходить из фазы экспериментальных исследований в повсеместные повседневные потребительские приложения, истинным полем битвы в индустрии станет эффективность инференса. Благодаря своей значительно расширенной дорожной карте собственных микросхем и неустанному вниманию к оптимизации дата-центров, Meta прочно заняла позиции на переднем крае этой битвы, попутно переписывая правила разработки аппаратного обеспечения для ИИ.