
뉴델리 — 전 세계 인공지능 지형에 중대한 지각 변동이 일어나고 있으며, 이번 진앙지는 인도입니다. 뉴델리에서 개최되어 큰 기대를 모은 **AI 임팩트 서밋 2026(AI Impact Summit 2026)**에서 인도의 주요 기술 혁신가들과 정책 입안자들은 일련의 국산 AI 모델을 공개하며 ‘주권형 AI(Sovereign AI)’를 향한 결정적인 행보를 알렸습니다. 이러한 일제 공격은 인도가 ‘딥시크 모먼트(DeepSeek moment)’를 추구하는 것으로 널리 평가받고 있습니다. 이는 실리콘밸리의 패권에 도전하는 고성능·저비용 모델로 최근 글로벌 시장을 뒤흔든 중국 스타트업을 지칭합니다.
이 서밋은 인도의 22개 공식 언어에 최적화된 다양한 다국어 모델의 발판 역할을 했으며, 서구 모델을 단순히 적응시키는 방식에서 벗어나 처음부터 독자적인 시스템을 구축하려는 전략적 변화를 강조했습니다. 정부의 지원과 급성장하는 스타트업 생태계를 바탕으로, 인도는 단순한 AI 소비자를 넘어 효율적이고 문화적 맥락을 갖춘 지능의 강력한 창조자로 자리매김하고 있습니다.
이러한 물결의 최전선에는 벵갈루루 기반의 스타트업인 Sarvam AI가 있습니다. 이 기업은 최신 대규모 언어 모델(LLM)을 발표하며 서밋의 주목을 받았습니다. Sarvam AI는 두 가지 핵심 모델을 선보였는데, 엣지 효율성을 위해 설계된 300억 파라미터 모델과 복잡한 추론 및 기업 업무용으로 제작된 거대한 1,050억 파라미터 모델입니다.
‘딥시크’ 현상을 정의한 효율성과 직접적인 평행선을 그리며, Sarvam의 105B 모델은 전문가 혼합(Mixture-of-Experts, MoE) 아키텍처를 활용합니다. 이 설계는 모델이 주어진 작업에 대해 파라미터의 일부만 활성화하도록 하여, 높은 성능을 유지하면서도 추론 비용을 획기적으로 줄여줍니다.
"우리는 단순히 인도를 위해 만드는 것이 아니라, 인도에서 세계를 위해 만들고 있습니다." Sarvam AI의 공동 창업자인 프라튜시 쿠마르(Pratyush Kumar)는 기조 연설에서 이렇게 밝혔습니다. "우리의 모델은 국내 컴퓨팅 인프라에서 처음부터 훈련되었으며, 데이터 주권과 문화적 뉘앙스가 사후 고려 사항이 아닌 핵심 요소로 내장되어 있습니다."
더 큰 모델인 105B는 여러 인도어 벤치마크, 특히 복잡한 추론 및 코딩 작업에서 구글의 제미나이 플래시(Gemini Flash)나 딥시크 R1(DeepSeek R1)과 같은 글로벌 경쟁 모델을 능가하는 것으로 보고되었습니다. 이러한 성과는 ‘검소한 혁신(frugal innovation)’ 모델을 입증하며, 세계 수준의 AI가 반드시 미국 기술 거대 기업들의 수조 달러 예산을 필요로 하지는 않는다는 점을 보여주었습니다.
서밋 전반에 걸쳐 반복된 주제는 언어 장벽 극복의 절실한 필요성이었습니다. 22개의 공식 언어와 수천 개의 방언으로 구성된 인도의 언어적 다양성은 주로 영어 데이터 세트로 훈련된 서구 AI 모델들에게 오랫동안 걸림돌이 되어 왔습니다.
IIT 봄베이가 주도하는 정부 지원 컨소시엄인 BharatGen은 중대한 이정표를 발표했습니다. 바로 22개 모든 인도 공식 지정 언어에 대한 텍스트 기반 AI 모델 구축을 완료했다는 소식입니다. **IndiaAI 미션(IndiaAI Mission)**의 자금 지원을 받는 이 이니셔티브는 비영어권 인구의 기술 접근성을 민주화하는 것을 목표로 합니다.
"언어는 문화의 매개체입니다. AI가 우리 언어를 말할 수 없다면 우리 국민에게 봉사할 수 없습니다."라고 연방 전자정부 및 IT 장관은 언급하며, IndiaAI 미션에 대한 정부의 12억 달러 투자를 강조했습니다. 이 미션은 스타트업을 위해 GPU 컴퓨팅 비용을 적극적으로 보조하여, 글로벌 트렌드보다 지역적 요구를 우선시하는 혁신을 위한 비옥한 토양을 조성하고 있습니다.
Sarvam AI가 파운데이션 모델에 집중하는 동안, 다른 주요 기업들은 하드웨어 및 애플리케이션 스택 전반에 걸친 발전을 선보이며 총체적인 생태계를 구축했습니다.
올라(Ola)의 바비시 아가르왈(Bhavish Aggarwal)이 설립한 AI 벤처 Krutrim은 이번 서밋을 통해 야심 찬 하드웨어 로드맵을 업계에 업데이트했습니다. 클라우드 서비스를 넘어, Krutrim은 최초의 독자적 AI 칩인 Bodhi 1이 2026년 출시를 목표로 순항 중임을 확인했습니다. 프런티어 LLM의 추론 워크로드를 처리하기 위해 특별히 설계된 이 칩은 엔비디아(Nvidia)의 값비싼 수입 하드웨어에 대한 인도의 의존도를 낮추는 것을 목표로 합니다.
Krutrim은 또한 7,000억 파라미터 모델인 Krutrim 3를 개발하기 위한 파트너십을 발표하며, 모델 규모 측면에서 최상위권에서 경쟁하겠다는 의지를 보였습니다.
다양한 모델 지형에 힘을 보태며, 유명 혁신가 프라나브 미스트리(Pranav Mistry)가 이끄는 Two Platforms는 SUTRA를 선보였습니다. 일반적인 모델과 달리, SUTRA는 개념 학습과 언어 처리를 분리하는 듀얼 트랜스포머(dual-transformer) 아키텍처로 설계된 다국어 생성형 AI(Generative AI) 모델입니다. 이 독특한 접근 방식을 통해 50개 이상의 언어에서 효과적으로 확장하는 동시에 높은 비용 효율성을 유지할 수 있어, 다른 비영어권 시장으로의 글로벌 수출을 위한 이상적인 후보가 되었습니다.
이번 서밋은 인도 AI 이니셔티브들 사이의 뚜렷한 전략 차이를 부각했습니다. 다음 표는 공개된 주요 모델들의 핵심 사양과 전략적 초점을 요약한 것입니다.
| 모델 / 이니셔티브 | 개발사 | 주요 특징 | 전략적 초점 |
|---|---|---|---|
| Sarvam-105B | Sarvam AI | 1,050억 파라미터, MoE 아키텍처, 22개 언어 지원 | 고효율 기업용 추론 및 코딩; ‘딥시크’ 스타일의 비용 최적화 |
| Krutrim 클라우드/칩 | Ola (Krutrim) | 맞춤형 실리콘(Bodhi 1), 7,000억 파라미터 모델 계획 | 실리콘부터 클라우드까지 풀스택 주권; 하드웨어 의존도 감소 |
| BharatGen | IIT 봄베이 컨소시엄 | 22개 모든 공식 언어 기본 지원 | 공공 부문 애플리케이션, 거버넌스 및 지역 방언 교육 |
| SUTRA | Two Platforms | 듀얼 트랜스포머 아키텍처, 50개 이상의 언어 | 글로벌 다국어 시장; 개념 숙달과 언어 유창성의 분리 |
“딥시크 모먼트(DeepSeek moment)”라는 문구는 서밋의 거의 모든 복도 대화에서 회자되었습니다. 이는 단순한 기술적 벤치마크 그 이상을 의미하며, 시장 심리의 변화를 상징합니다. 중국의 딥시크가 효율성이 자금력이 풍부한 미국 연구소들의 독점을 깰 수 있음을 증명했듯이, 인도는 자신의 ‘주권형 AI’ 접근 방식이 글로벌 사우스(Global South)를 위해 동일한 역할을 할 것이라고 확신하고 있습니다.
하지만 과제는 남아 있습니다. Sarvam 105B와 같은 모델의 비용 효율성은 유망하지만, 차세대 ‘프런티어’ 모델(10조 개 이상의 파라미터)을 훈련하는 데 필요한 대규모 컴퓨팅 인프라는 여전히 구축 중입니다. IndiaAI 미션의 수천 개 GPU 조달은 시작에 불과하며, 메타(Meta)나 마이크로소프트(Microsoft)가 운영하는 클러스터와 비교하면 아직 미미한 수준입니다.
인도 AI 임팩트 서밋 2026(India AI Impact Summit 2026)은 인도가 AI 채택자에서 AI 설계자로 도약한 변곡점으로 기억될 것입니다. 다국어 능력과 비용 효율적인 아키텍처를 우선시함으로써, 인도 기업들은 서구 기술 거대 기업들이 대체로 간과해 온 독특한 틈새 시장을 개척하고 있습니다.
이러한 모델들이 연구실을 넘어 은행, 농업, 거버넌스 등 실제 현장에 배치됨에 따라 전 세계가 주목할 것입니다. 인도가 이러한 효율적인 다국어 시스템을 성공적으로 확장할 수 있다면, 단순히 ‘딥시크 모먼트’를 갖는 것에 그치지 않고, 미래의 다양하고 비용에 민감한 시장에서 AI가 어떻게 배포되어야 하는지에 대한 교본을 다시 쓸 수 있을 것입니다.