Luma AI, Uni-1 출시: 추론 중심 이미지 모델로 Google과 OpenAI보다 30% 낮은 비용으로 우수한 성능
Luma AI의 Uni-1은 자기회귀(autoregressive) 아키텍처를 사용하여 추론 벤치마크에서 Google Nano Banana 2와 OpenAI GPT Image 1.5를 능가하면서 2K 해상도 가격을 최대 30%까지 절감합니다.
Luma AI의 Uni-1은 자기회귀(autoregressive) 아키텍처를 사용하여 추론 벤치마크에서 Google Nano Banana 2와 OpenAI GPT Image 1.5를 능가하면서 2K 해상도 가격을 최대 30%까지 절감합니다.
샤오미는 MiMo-V2-Pro, MiMo-V2-Omni, MiMo-V2-TTS를 공개했다 — 이 세 가지 AI 모델은 1조 개가 넘는 파라미터, 멀티모달 인식 및 감성 음성 합성을 특징으로 하며, 에이전트 벤치마크에서 Claude Opus 4.6과 경쟁한다.
구글은 Gemini Embedding 2를 출시했습니다. 이는 텍스트, 이미지, 비디오를 통합된 벡터 공간으로 함께 매핑하여 검색 및 정보 검색 작업에 활용할 수 있는 최초의 본래 멀티모달 임베딩 모델입니다.
중국의 DeepSeek는 텍스트·이미지·비디오를 생성할 수 있는 V4 멀티모달 모델을 곧 출시할 예정이며, 보도에 따르면 Nvidia와 AMD에는 조기 최적화 접근을 허용하지 않고 대신 중국의 연례 의회 회의를 앞두고 화웨이와 Cambricon 등 국내 칩 제조사에만 독점적으로 제공했다고 전해진다.
DeepSeek의 채용 공고는 텍스트, 이미지 및 오디오를 지원하는 멀티모달 AI 검색 엔진 계획을 공개했으며, 구글의 검색 시장 점유율을 직접 겨냥합니다.
베이징에 본사를 둔 Moonshot AI가 OpenAI와 Anthropic에 필적하면서도 운영 비용은 4배 저렴한 오픈소스 멀티모달 AI 모델 Kimi K2.5를 공개해, 미국의 반도체 수출 통제가 중국의 AI 개발을 제약하는 데 얼마나 효과적인지에 대한 의문을 제기했다.