- Génération native synchronisée de vidéo et d’audio
- Cinq entrées multimodales : texte, image, vidéo, masque et audio
- Sortie 1080p avec mouvement cinématographique à 32 FPS
- Inpainting au niveau des régions pour modifier des parties spécifiques d’une vidéo
- Support de référence de personnage pour la cohérence entre les plans
- Synchronisation labiale multilingue et génération vocale
- Coupes caméra sensibles au rythme pour les clips musicaux
- Accès API REST et webhook via APIMart