
В эпоху, определяемую неуклонным расширением генеративного ИИ (Generative AI), «узким местом» для технологических гигантов становится уже не только блестящее программное обеспечение, но и суровая физическая мощность аппаратного обеспечения. Недавно появились сообщения о том, что Google ведет активные переговоры с Marvell Technology о совместной разработке специализированных ИИ-чипов. Этот шаг сигнализирует о значительном усилении внутренних усилий Google по оптимизации инфраструктуры своих центров обработки данных, направленных, в частности, на удовлетворение высоких энергетических потребностей при выполнении логического вывода (inference) больших языковых моделей (LLM).
Для тех, кто следит за «кремниевыми войнами», сотрудничество между гиперскейлером, таким как Google — который уже обладает, возможно, самой зрелой экосистемой ИИ-чипов благодаря своим тензорным процессорам (TPU), — и специалистом по проектированию чипов, таким как Marvell, имеет огромное значение. Заключая партнерство с Marvell, Google стремится ускорить разработку оборудования следующего поколения, способного справляться с возрастающей сложностью задач ИИ при одновременном снижении совокупной стоимости владения.
В основе этого партнерства лежат две различные, но дополняющие друг друга инициативы по созданию чипов. Во-первых, разработка TPU следующего поколения, специально адаптированного для жестких требований современных рабочих нагрузок ИИ. Во-вторых, создание специализированного блока обработки памяти (Memory Processing Unit, MPU).
Фокус на «логическом выводе» (inference) здесь критически важен. В то время как обучение моделей ИИ требует колоссальной параллельной вычислительной мощности, логический вывод — процесс предоставления моделью ответа пользователю — определяет повседневные эксплуатационные расходы сервисов ИИ. Поскольку миллиарды запросов поступают в Google Search и другие платформы, эффективность каждой микросекунды, затраченной на логический вывод, становится мощнейшим финансовым рычагом.
| Тип инициативы | Основная область внимания | Ожидаемый эффект |
|---|---|---|
| TPU следующего поколения | Основные вычисления | Улучшение FLOPS на ватт при выполнении моделей |
| Блок обработки памяти | Пропускная способность данных | Снижение задержек для задач с высокой пропускной способностью |
| Стратегия оптимизации | Интеграция программного и аппаратного обеспечения | Снижение операционных расходов в масштабе |
Компания Marvell зарекомендовала себя как лидер отрасли в области проектирования специализированных полупроводников (custom silicon), особенно в приложениях, ориентированных на инфраструктуру. Специализируясь на высокоскоростных соединениях и контроллерах систем хранения данных, Marvell предоставляет архитектурную экспертизу, которая дополняет внутреннюю команду Google по разработке TPU.
Стратегия Google кажется двусторонней: использование внутренних TPU для выполнения основных трудоемких задач при одновременной передаче разработки отдельных компонентов компании Marvell, чтобы воспользоваться ее специализированной библиотекой интеллектуальной собственности и доказанной эффективностью проектирования. Такой «гибридный» подход позволяет Google сохранять конкурентное преимущество, обеспечиваемое собственной проприетарной архитектурой, при этом осуществляя итерации аппаратных циклов быстрее, чем это было бы возможно при самостоятельной разработке.
Как мы в Creati.ai заметили, отрасль отходит от парадигмы графических процессоров (GPU) общего назначения к узкоспециализированным полупроводникам, ориентированным на конкретные домены. Этот переход определяется тремя основными факторами:
Волны от потенциального партнерства Google и Marvell ощутят все участники полупроводниковой индустрии. Компании, такие как NVIDIA, которые в настоящее время доминируют на рынке корпоративных ИИ-чипов, вероятно, столкнутся с постоянным давлением по мере того, как гиперскейлеры будут становиться все более искусными в разработке собственного кремния.
Для более широкой экосистемы ИИ это означает более дешевый, быстрый и эффективный доступ к возможностям логического вывода. Если разработка этих новых чипов увенчается успехом, это позволит Google интегрировать более сложный ИИ в свои продукты, от Поиска до Workspace, без запретительных затрат на электроэнергию, которые в настоящее время сдерживают развертывание ИИ корпоративного масштаба.
Поскольку Google продолжает совершенствовать свою «дорожную карту», интеграция специализированного мастерства Marvell станет развитием, за которым мы продолжим внимательно следить. Гонка за освоение оборудования для логического вывода ИИ — это, по сути, гонка за освоение экономики будущего интернета, и эти переговоры свидетельствуют о том, что Google не намерен уступать свои позиции.