HappyHorse 1.0 — это мультимодальная модель генерации видео с ИИ, предназначенная для создания видеороликов вещательного качества с нативным аудио. Она генерирует вывод в 1080p за один прямой проход и выравнивает речь с движением губ с субпиксельной точностью. Модель поддерживает генерацию text-to-video и image-to-video, что делает её полезной для рекламы, объясняющих роликов, превью и локализованного контента. Она также поддерживает синхронизацию губ на семи языках, включая английский, мандарин, кантонский, японский, корейский, немецкий и французский. Благодаря встроенному синтезу аудио отпадает необходимость в отдельном TTS или склейке аудио на постпродакшене, обеспечивая более быстрый и интегрированный рабочий процесс.