- Generación nativa sincronizada de video y audio
- Cinco entradas multimodales: texto, imagen, video, máscara y audio
- Salida 1080p con movimiento cinematográfico a 32 FPS
- Inpainting a nivel de región para editar partes específicas de un video
- Soporte de referencia de personaje para consistencia entre tomas
- Sincronización labial multilingüe y generación de voz
- Cortes de cámara conscientes del ritmo para clips impulsados por música
- Acceso a API REST y webhook a través de APIMart