DeepSeek prestes a lançar o modelo multimodal de IA V4, negando acesso antecipado à Nvidia e AMD

DeepSeek V4 estreará com capacidades multimodais nativas, quebrando normas do setor ao excluir fabricantes de chips dos EUA

Pela Equipe Editorial da Creati.ai
2 de março de 2026

Em um movimento que sinaliza uma fratura crescente na cadeia de suprimentos global de inteligência artificial, o laboratório chinês de IA DeepSeek está prestes a lançar seu modelo principal de quarta geração, o DeepSeek V4. Relatórios indicam que o modelo será lançado no início de março, coincidindo com as reuniões parlamentares anuais das "Duas Sessões" (Two Sessions) da China. Ao contrário de seus antecessores, o V4 é um sistema multimodal nativo capaz de gerar texto, imagens e vídeo, posicionando-o como um concorrente direto do Gemini 3.0 do Google e das ofertas mais recentes da OpenAI.

No entanto, o salto tecnológico está sendo ofuscado por uma mudança estratégica significativa: o DeepSeek teria retido o acesso de otimização pré-lançamento dos gigantes de semicondutores dos EUA, Nvidia e AMD. Em vez disso, o laboratório concedeu acesso antecipado exclusivo a fabricantes de chips chineses, especificamente Huawei e Cambricon, para otimizar o modelo para seu hardware. Esta decisão quebra um protocolo de longa data da indústria, onde grandes desenvolvedores de modelos colaboram com a Nvidia para garantir o desempenho no primeiro dia, marcando uma mudança distinta em direção a ecossistemas de "IA soberana（sovereign AI）".

A Mudança Estratégica: Priorizando o Silício Doméstico

Durante anos, o procedimento operacional padrão para laboratórios de IA de alto nível — incluindo OpenAI, Anthropic e anteriormente o DeepSeek — tem sido fornecer à Nvidia e à AMD os pesos dos modelos e detalhes arquitetônicos semanas antes de um lançamento público. Esta "janela de otimização" permite que os fabricantes de chips atualizem seus stacks de software (como CUDA e ROCm) para garantir que o novo modelo funcione de forma eficiente em suas GPUs imediatamente após o lançamento.

Ao negar esse acesso às empresas dos EUA, o DeepSeek está efetivamente forçando um atraso de desempenho para os usuários que executam o V4 em hardware Nvidia no lançamento, enquanto garante que o modelo funcione perfeitamente nos chips das séries Ascend 910C da Huawei e MLU da Cambricon.

Implicações da Estratégia de Exclusão:

Objetivo Estratégico	Impacto no Mercado Interno	Impacto no Mercado Global
Soberania de Hardware	Demonstra que modelos de IA de alto nível podem ser treinados e executados de forma eficiente em silício não ocidental (ex: Huawei Ascend).	Desafia a narrativa de que o hardware da Nvidia é um pré-requisito para a inferência de IA de ponta.
Acoplamento de Ecossistema	Força os desenvolvedores corporativos chineses a adotar hardware doméstico para acessar o melhor desempenho do V4.	Cria um ecossistema de software "bifurcado", onde as otimizações não são mais universalmente transferíveis.
Sinalização Geopolítica	Alinha-se com os mandatos de "autossuficiência" de Pequim antes do encontro político das "Duas Sessões".	Sinaliza aos reguladores dos EUA que os controles de exportação podem acelerar, em vez de interromper, o desenvolvimento tecnológico interno da China.
Proteção de Mercado	Dá à Huawei e à Cambricon uma vantagem de "pioneirismo" em benchmarking e marketing de seus chips contra o H100/H200.	Pode reduzir temporariamente as pontuações de benchmark para GPUs Nvidia no DeepSeek V4, afetando o sentimento do comprador.

Arquitetura Técnica: O "Engram" e Contexto de 1 Milhão

Além das manobras geopolíticas, o DeepSeek V4 introduz inovações arquitetônicas substanciais projetadas para manter a reputação do laboratório de extrema eficiência de custos. O modelo é construído sobre uma arquitetura massiva de Mistura de Especialistas（Mixture-of-Experts - MoE） com uma estimativa de 1 trilhão de parâmetros totais, embora ative apenas cerca de 32 bilhões de parâmetros por token. Essa esparsidade permite que ele entregue um desempenho comparável a modelos densos como os sistemas da classe GPT-5, exigindo uma fração do poder de computação para inferência.

Um diferencial fundamental para o V4 é a introdução da arquitetura de memória condicional "Engram". Este mecanismo inovador separa a recuperação de conhecimento estático do raciocínio dinâmico, permitindo que o modelo acesse uma janela de contexto que excede 1 milhão de tokens sem a penalidade computacional quadrática associada aos mecanismos tradicionais de atenção do Transformer.

Principais Especificações Técnicas do DeepSeek V4:

Tipo de Modelo: Multimodal Nativo (Texto, Imagem, Vídeo)
Parâmetros Totais: ~1 Trilhão (MoE)
Parâmetros Ativos: ~32 Bilhões por token
Janela de Contexto: 1.000.000+ Tokens
Inovação Chave: Memória Condicional Engram e Hiperconexões Restritas por Variedades (mHC - Manifold-Constrained Hyper-Connections)
Hardware Alvo: Otimizado para a série Huawei Ascend 910; inferência de nível de consumidor possível em dual RTX 4090s via quantização.

Convergência Multimodal: Entrando na Era "Omni"

O DeepSeek V4 representa a primeira incursão do laboratório em uma estrutura de modelo verdadeiramente "omni". Iterações anteriores, como a série Janus, separavam a compreensão visual da geração de texto. O V4 unifica essas modalidades, permitindo tarefas de raciocínio complexas que intercalam texto, código e entradas visuais.

Por exemplo, relata-se que o modelo lida com geração de vídeo para código (video-to-code generation), onde um usuário pode carregar uma gravação de tela de uma interação de interface de usuário (UI) e o modelo gera o código frontend correspondente. Da mesma forma, espera-se que suas capacidades de geração de vídeo rivalizem com modelos especializados, aproveitando a vasta janela de contexto para manter a consistência temporal em clipes mais longos.

Essa capacidade coloca o DeepSeek V4 em competição direta com o Gemini 1.5 Pro e Gemini 3.0 do Google, que definiram o padrão atual para raciocínio multimodal de contexto longo. No entanto, a abordagem de pesos abertos (open-weights) do DeepSeek (esperada para seguir o modelo de licenciamento do V3) pode perturbar o mercado ao colocar essas capacidades nas mãos dos desenvolvedores gratuitamente, subestimando os modelos de negócios baseados em API dos concorrentes ocidentais.

A Controvérsia "Blackwell" e Controles de Exportação

O lançamento do V4 ocorre em meio a um escrutínio intensificado em relação à infraestrutura de treinamento do DeepSeek. Relatórios recentes da Reuters e do Financial Times citam autoridades anônimas dos EUA alegando que o DeepSeek pode ter treinado seus modelos em chips restritos Nvidia Blackwell, potencialmente adquiridos por meio de canais de mercado cinza em violação aos controles de exportação dos EUA.

A mudança do DeepSeek para a Huawei para o lançamento do V4 serve a um propósito duplo neste contexto:

Negação Plausível: Ao demonstrar uma otimização superior no hardware da Huawei, o DeepSeek reforça a narrativa de que seus avanços são indígenas, distanciando-se da dependência de tecnologia dos EUA adquirida ilicitamente.
Proteção Regulatória: Favorecer explicitamente os chips domésticos alinha a empresa com os interesses estratégicos de Pequim, oferecendo proteção contra possíveis repressões regulatórias domésticas e, simultaneamente, desafiando as sanções dos EUA.

Impacto no Mercado: Um Desafio à "Bolha de Capex"

O lançamento do DeepSeek V4 representa uma ameaça sutil, mas perigosa, ao atual modelo econômico de IA, frequentemente chamado de "Bolha de Capex"（Capex Bubble）. Os gigantes tecnológicos ocidentais estão gastando centenas de bilhões de dólares em infraestrutura de IA, baseados na crença de que as leis de escala exigem aumentos exponenciais em computação e energia.

O DeepSeek desafiou essa suposição com seus modelos V3 e R1, que foram treinados por menos de US$ 6 milhões — uma fração do custo do GPT-4 da OpenAI. Se o V4 entregar um desempenho multimodal de "estado da arte" com um orçamento similarmente reduzido, isso validará ainda mais a tese de que a eficiência algorítmica (via arquiteturas MoE e Engram) importa mais do que o poder computacional bruto.

Potenciais Reflexos no Mercado:

Eficiência de Software: Uma validação das "Hiperconexões Restritas por Variedades" (mHC) do DeepSeek pode levar a uma reavaliação global da eficiência da arquitetura Transformer.
Pressão nos Preços: Se o V4 for de código aberto, provavelmente forçará provedores de API como OpenAI e Anthropic a reduzir ainda mais os preços dos tokens multimodais para permanecerem competitivos.
Democratização do Hardware: A capacidade de executar o V4 em hardware de nível de consumidor (como a RTX 4090 ou 5090) pode descentralizar o desenvolvimento de IA, reduzindo a dependência de clusters massivos em nuvem.

Conclusão: Uma Nova Fase de Bifurcação da IA

O iminente lançamento do DeepSeek V4 é mais do que apenas o lançamento de um produto; é uma declaração geopolítica. Ao desvincular seu roteiro de otimização da Nvidia e da AMD, o DeepSeek está efetivamente traçando uma linha no silício. A mensagem é clara: a China pretende construir um stack de IA autossuficiente, da camada de chip à camada de aplicação.

Para a comunidade global de IA, o lançamento do V4 apresenta um dilema. A provável disponibilidade aberta do modelo e seu alto desempenho tornam-no irresistível para pesquisadores e desenvolvedores. No entanto, seu viés de otimização para hardware não ocidental pode fragmentar a comunidade, criando "jardins murados" de otimização onde os modelos funcionam melhor no hardware do bloco geopolítico de onde se originaram.

Enquanto as "Duas Sessões" se reúnem em Pequim na próxima semana, o mundo estará atento não apenas aos discursos políticos, mas aos benchmarks de um modelo que promete redefinir o que é possível com computação limitada e silício soberano.