중국, 설 연휴를 앞두고 DeepSeek V4를 포함한 AI 모델 대거 공개

중국의 ‘말띠 해(Year of the Horse)’, AI 군비 경쟁과 함께 시작되다

수백만 명의 중국인이 설 명절(Lunar New Year) 연휴를 준비하는 가운데, 중국 기술 분야에서는 생성형 AI(Generative AI) 시장의 주도권을 잡기 위한 치열한 인공지능 모델 출시 파도가 휘몰아치며 연휴 기간이 격전지로 변했습니다. 관측통들이 ‘레드 오션 스프링(Red Ocean Spring)’이라 부르는 이 조율된 공세 속에서 알리바바(Alibaba), 바이트댄스(ByteDance), 지푸 AI(Zhipu AI)를 포함한 주요 기업들이 사실상 동시에 대규모 모델 업그레이드를 단행했습니다.

말띠 해의 첫날인 2026년 2월 17일에 정점에 달한 이 쏟아지는 발표들은 업계의 중대한 변화를 시사합니다. 초점은 단순한 챗봇을 넘어 ‘에이전트(Agentic)’ 워크플로우, 방대한 컨텍스트 창(Context window), 그리고 OpenAI와 Google 같은 서구 경쟁사들을 견제하기 위한 공격적인 가격 전쟁으로 확실히 이동했습니다. 그 선두에는 큰 기대를 모으고 있는 DeepSeek V4와 함께 알리바바의 강력한 Qwen 3.5, 바이트댄스의 소비자 중심 모델 Doubao 2.0, 그리고 지푸 AI의 독자 기술로 훈련된 GLM-5가 있습니다.

DeepSeek V4: 효율성의 파괴자

이번 분기에서 가장 주목받는 출시는 아마도 DeepSeek V4일 것입니다. 2025년 초 전 세계 주식 시장의 변동성을 초래했던 전작의 시장을 뒤흔든 성공에 이어, DeepSeek은 극강의 효율성이라는 명성에 더욱 집중했습니다. 공식 기술 논문은 여전히 커뮤니티에서 분석 중이지만, 초기 세부 정보에 따르면 V4는 ‘다양체 제약 하이퍼 커넥션(Manifold-Constrained Hyper-Connections, mHC)’이라는 참신한 아키텍처를 도입했습니다.

보고에 따르면 이 아키텍처의 변화를 통해 모델은 일반적으로 이러한 규모와 관련된 연산 비용의 페널티 없이 100만 개 이상의 토큰에 달하는 컨텍스트 창에서 일관성을 유지할 수 있습니다. 업계 유출 정보에 따르면 DeepSeek V4는 GPT-4급 모델의 약 20분의 1 수준의 비용 구조를 목표로 하고 있으며, 이는 전 세계 API 시장에서 또 다른 가격 조정을 강제할 것으로 보입니다.

DeepSeek의 전략은 명확합니다. 광범위하고 자동화된 에이전트 배포를 경제적으로 실현 가능하게 만드는 가격대에서 ‘GPT-5급’ 추론 및 코딩 기능을 제공하는 것입니다. 선택적 정보 유지를 위한 기술인 ‘엔그램 조건부 메모리(Engram Conditional Memory)’의 포함은 이 모델이 복잡한 다단계 소프트웨어 개발 작업에 특별히 최적화되었음을 시사합니다.

알리바바 Qwen 3.5: 엔터프라이즈 ‘운영 체제’

이에 뒤질세라 알리바바 클라우드(Alibaba Cloud)는 Qwen 3.5를 공식 출시하며, 이를 AI 시대의 운영 체제가 되기 위한 여정에서의 ‘주요 진화’라고 설명했습니다. Qwen 3.5 제품군은 2.5 시리즈의 멀티모달(Multimodal) 기능을 확장하여 시각적 추론과 복잡한 지시 수행 능력에서 상당한 향상을 보여주었습니다.

알리바바의 이번 출시는 안정성과 통합을 강조합니다. 일부 경쟁사들의 실험적인 성격과 달리, Qwen 3.5는 기업을 위한 안전하고 확장 가능한 선택지로 포지셔닝되었습니다. 이 모델은 비즈니스 자동화에 중요한 ‘함수 호출(Function calling)’, 즉 AI가 외부 소프트웨어 도구와 인터페이스하는 기능에 대한 향상된 지원을 특징으로 합니다.

알리바바 클라우드 경영진은 출시 행사에서 "미래에 대형 AI 모델은 광범위한 기기에 깊이 통합될 것"이라고 밝혔습니다. 알리바바는 Qwen 3.5 제품군의 상당 부분을 오픈 소스로 공개함으로써 비독점적 기반을 선호하는 개발자들을 위한 기본 표준으로 자사의 생태계를 계속해서 공고히 하고 있습니다.

바이트댄스 Doubao 2.0: 소비자를 위한 에이전트 시대

TikTok의 모회사인 바이트댄스는 Doubao 2.0과 함께 공식적으로 ‘에이전트 시대(Agent Era)’에 진입했습니다. 연휴 며칠 전에 출시된 이 모델은 중국에서 가장 인기 있는 AI 앱을 구동하며, ‘Doubao-Seed-2.0’으로 알려진 대대적인 아키텍처 개편을 나타냅니다.

Doubao 2.0의 초점은 명확합니다. 바로 자율적인 작업 완료입니다. 단순히 사용자 질문에 답하는 것이 아니라, 여행 일정을 계획하고 티켓을 예약하거나 특정 주제를 조사하여 형식에 맞는 보고서를 생성하는 것과 같은 다단계 워크플로우를 실행하도록 설계되었습니다. 바이트댄스는 이 모델을 Pro, Lite 및 전문 코드(Code) 변형을 포함한 여러 크기로 출시하여 모바일 기기에서 대형 서버 측 프로세싱까지 전 범위를 커버하도록 했습니다.

결정적으로, 바이트댄스는 방대한 사용자 기반을 활용하여 모델의 ‘감성 지능’과 대화의 유연성을 다듬음으로써, 혼잡한 시장에서 Doubao를 최고의 소비자 슈퍼 앱으로 유지하는 것을 목표로 하고 있습니다.

지푸 GLM-5: 국산 하드웨어의 승리

지푸 AI(Zhipu AI)의 GLM-5 출시는 기반 시설의 독립성이라는 다른 이유로 눈에 띕니다. 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 사용하는 이 7,440억 개의 파라미터 모델은 전적으로 화웨이(Huawei)의 어센드(Ascend) 칩에서 훈련된 것으로 알려졌으며, 이는 미국의 규제를 받는 NVIDIA 하드웨어로부터 탈피하려는 중국의 노력에 있어 중요한 이정표가 되었습니다.

입력 토큰 100만 개당 약 0.80달러라는 파괴적으로 낮은 가격으로 출시된 GLM-5는 학술 및 연구 분야의 강자로 포지셔닝하고 있습니다. 이 모델의 ‘Pony Alpha’ 프리뷰 버전은 공식 브랜딩이 공개되기 전부터 이미 추론 능력으로 주목을 받았습니다. 국산 실리콘에서 이토록 거대한 모델을 훈련하는 데 성공한 지푸의 성과는 미국의 수출 통제가 중국 AI 발전의 한계를 영구적으로 제한할 것이라는 우려를 완화시킵니다.

신규 출시 모델 비교 분석

다음 표는 이번 연휴 전 기간에 출시된 모델들의 주요 사양과 전략적 포지셔닝을 요약한 것입니다.

표: 2026년 설 명절 AI 모델 출시 현황

모델 명칭	개발사	주요 아키텍처/기능	주요 전략적 초점
DeepSeek V4	DeepSeek AI	다양체 제약 하이퍼 커넥션 (mHC)	극강의 비용 효율성 및 코딩 추론
Qwen 3.5	알리바바 클라우드	강화된 멀티모달 및 함수 호출	기업 통합 및 오픈 소스 생태계
Doubao 2.0	바이트댄스	Doubao-Seed-2.0 / 에이전트 워크플로우	소비자 애플리케이션 및 자율 에이전트
GLM-5	지푸 AI	7,440억 파라미터 (MoE), 어센드 칩 기반	국산 인프라 독립성 및 규모 확보

시장 영향: 제로를 향한 경쟁

이 모델들의 동시 출시는 중국 내수 시장 경쟁의 치열함을 보여줍니다. 2024년과 2025년의 ‘가격 전쟁’ 역학 관계는 가라앉지 않았으며, 오히려 ‘효율성 전쟁’으로 진화했습니다.

개발자들에게 지금은 황금기입니다. 지능의 비용이 무어의 법칙(Moore's Law)보다 빠르게 하락하고 있어, 이전에는 운영 비용이 너무 비싸서 불가능했던 실시간 개인 비서나 자동 코드 리팩토링 봇과 같이 배경에서 지속적으로 추론을 실행하는 새로운 종류의 애플리케이션이 가능해졌습니다.

하지만 관련 기업들에게 재무적 압박은 엄청납니다. 설 명절 전에 출시를 서두르는 것은 연휴 휴식기 전에 개발자들의 관심을 사로잡는 것이 중요하다는 ‘영토 선점(land grab)’ 심리를 시사합니다.

글로벌 맥락

실리콘 밸리가 거대한 컴퓨팅 클러스터를 통해 범용 인공지능(AGI)으로 가는 길에 집중하고 있는 반면, 중국 연구소들은 추론 효율성과 애플리케이션 계층의 지배력에 중심을 둔 독특한 정체성을 구축하고 있습니다. 훈련 및 추론 비용의 극히 일부만으로 미국의 최고 수준 모델에 도전하는 DeepSeek V4의 능력은 "클수록 항상 더 좋다"는 지배적인 담론에 도전장을 내밀고 있습니다.

말띠 해가 시작되면서 베이징, 항저우, 상하이에서 전하는 메시지는 분명합니다. AI 경쟁은 이제 누가 가장 스마트한 모델을 가졌느냐뿐만 아니라, 누가 지능을 어디에나 존재하게 하고, 저렴하며, 실질적으로 유용하게 만들 수 있느냐에 관한 것이 되었습니다.