SkyReels V4는 네이티브로 동기화된 오디오를 포함한 시네마틱 클립을 생성하도록 설계된 AI 비디오 생성 시스템입니다. 듀얼 스트림 MMDiT 아키텍처와 공유 텍스트 인코더를 결합하여 시각 요소, 음성, 효과, 배경 음악을 하나의 파이프라인에서 정렬합니다. 이 모델은 텍스트, 이미지, 비디오 클립, 이진 마스크, 오디오 참조라는 다섯 가지 입력 모드를 지원합니다. 1080p 비디오를 32 FPS로 생성할 수 있고, 영역 수준 인페인팅을 수행하며, 샷 간 캐릭터 정체성을 유지하고, 다국어 립싱크를 생성할 수 있습니다. 비트 인지 카메라 컷은 음악 중심 및 숏폼 소셜 콘텐츠에 특히 유용합니다. 그 결과 빠르고 일관되며 오디오가 풍부한 AI 비디오 제작을 위한 프로덕션 지향 도구가 됩니다.