
Creati.ai 編集チーム
2026年3月2日
世界の人工知能サプライチェーンにおける亀裂の深化を象徴する動きとして、中国の AI ラボである DeepSeek は、第 4 世代のフラッグシップモデル「DeepSeek V4」をリリースする構えです。報告によると、このモデルは中国の年次政治会議である「両会」に合わせて 3 月初旬に発表される予定です。前身のモデルとは異なり、V4 はテキスト、画像、ビデオを生成できるネイティブ・マルチモーダル(Native Multimodal)システムであり、Google の Gemini 3.0 や OpenAI の最新製品の直接的な競合として位置付けられています。
しかし、この技術的な飛躍は、重大な戦略的転換によって影が薄くなっています。DeepSeek は、米国の半導体巨人である Nvidia や AMD に対し、リリース前の最適化アクセスの提供を拒否したと報じられています。代わりに、同ラボは国内の中国チップメーカー、具体的には Huawei と Cambricon に対して、自社ハードウェア向けにモデルを最適化するための独占的な早期アクセスを許可しました。この決定は、主要なモデル開発者が Nvidia と協力してリリース初日のパフォーマンスを確保するという長年の業界プロトコルを破るものであり、「ソブリン AI(sovereign AI)」エコシステムへの明確な転換を示しています。
長年、OpenAI、Anthropic、そして以前の DeepSeek を含むトップティアの AI ラボにとって、標準的な運用手順は、公開リリースの数週間前に Nvidia と AMD にモデルの重みとアーキテクチャの詳細を提供することでした。この「最適化ウィンドウ」により、チップメーカーはソフトウェアスタック(CUDA や ROCm など)を更新し、新しいモデルがリリース直後から GPU 上で効率的に動作することを保証できました。
米国企業へのこのアクセスを拒否することで、DeepSeek は事実上、リリース時に Nvidia ハードウェアで V4 を実行するユーザーにパフォーマンスの遅延を強いる一方で、Huawei の Ascend 910C や Cambricon の MLU シリーズチップでモデルがシームレスに動作することを保証しています。
排除戦略の影響:
| 戦略的目標 | 国内市場への影響 | グローバル市場への影響 |
|---|---|---|
| ハードウェア主権 | トップティアの AI モデルが、非西側諸国のシリコン(例:Huawei Ascend)上で効率的にトレーニングおよび実行できることを証明する。 | Nvidia ハードウェアが最先端の AI 推論の前提条件であるという説に異を唱える。 |
| エコシステムの結合 | 中国の企業開発者が V4 の最高のパフォーマンスを得るために、国内ハードウェアを採用することを余儀なくさせる。 | 最適化がもはや普遍的に転送可能ではない「分岐した」ソフトウェアエコシステムを生み出す。 |
| 地政学的なシグナリング | 政治集会である「両会」を前に、中国政府の「自給自足」の指令に歩調を合わせる。 | 米国の規制当局に対し、輸出管理が中国の内部技術開発を停止させるのではなく、加速させる可能性があることを示唆する。 |
| 市場保護 | Huawei と Cambricon に対し、H100/H200 と比較したチップのベンチマークとマーケティングにおいて「先行者利益」を与える。 | DeepSeek V4 における Nvidia GPU のベンチマークスコアを一時的に低下させ、購入者の心理に影響を与える可能性がある。 |
地政学的な駆け引きを超えて、DeepSeek V4 は、極めて高いコスト効率という同ラボの評判を維持するために設計された大幅なアーキテクチャの革新を導入しています。このモデルは、推定総パラメータ数 1 兆の巨大な 混合専門家(Mixture-of-Experts) (MoE) アーキテクチャに基づいて構築されていますが、トークンごとにアクティブ化されるのは約 320 億パラメータのみです。この疎性(Sparsity)により、推論に必要な計算能力をわずかに抑えながら、GPT-5 クラスのシステムのような密なモデルに匹敵するパフォーマンスを提供できます。
V4 の大きな差別化要因は、「エングラム(Engram)」条件付きメモリ・アーキテクチャの導入です。この新しいメカニズムは、静的な知識の検索と動的な推論を分離し、従来の Transformer のアテンション・メカニズムに伴う二次的な計算コストのペナルティなしに、100 万トークンを超えるコンテキストウィンドウへのアクセスを可能にします。
DeepSeek V4 の主な技術仕様:
DeepSeek V4 は、同ラボ初の真の「Omni」モデル構造への進出を意味します。Janus シリーズなどの以前のイテレーションでは、視覚的理解とテキスト生成が分離されていました。V4 はこれらのモダリティを統合し、テキスト、コード、視覚的入力を織り交ぜた複雑な推論タスクを可能にします。
例えば、このモデルは Video-to-Code(ビデオからコードへの生成) を処理できると報告されています。ユーザーが UI インタラクションの画面録画をアップロードすると、モデルが対応するフロントエンドコードを生成します。同様に、そのビデオ生成機能は、広大なコンテキストウィンドウを活用して長いクリップ全体で時間的一貫性を維持することで、専門モデルに匹敵することが期待されています。
この機能により、DeepSeek V4 は、長文コンテキストのマルチモーダル推論の現在の基準を定義した Google の Gemini 1.5 Pro および Gemini 3.0 と直接競合することになります。しかし、DeepSeek のオープンウェイト・アプローチ(V3 のライセンスモデルを踏襲すると予想される)は、これらの機能を開発者の手に無料で提供することで市場を混乱させ、西側諸国の競合他社の API ベースのビジネスモデルを脅かす可能性があります。
V4 のリリースは、DeepSeek のトレーニングインフラに関する監視が強まる中で行われました。ロイターやフィナンシャル・タイムズの最近の報道は、米国の輸出管理に違反してグレーマーケットを通じて入手された可能性がある、制限対象の Nvidia Blackwell チップで DeepSeek がモデルをトレーニングした可能性があるという、匿名の米国当局者の主張を引用しています。
V4 の発売にあたって DeepSeek が Huawei に舵を切ったことは、この文脈において二重の目的を果たします:
DeepSeek V4 のリリースは、しばしば「キャピタル・エクスペンディチャー(Capex)バブル」と呼ばれる現在の AI 経済モデルに対して、微妙ながらも危険な脅威を与えています。西側のテック巨人は現在、スケーリング則には計算能力とエネルギーの指数関数的な増加が必要であるという信念に基づき、AI インフラに数千億ドルを費やしています。
DeepSeek は、OpenAI の GPT-4 の数分の一のコストである 600 万ドル未満でトレーニングされた V3 および R1 モデルで、この前提に挑戦しました。もし V4 が同様の超低予算で「最先端」のマルチモーダル・パフォーマンスを提供すれば、ブルートフォース(力任せ)な計算よりも、アルゴリズムの効率(MoE やエングラム・アーキテクチャを介した)の方が重要であるという説がさらに裏付けられることになります。
潜在的な市場への波及効果:
DeepSeek V4 の差し迫ったリリースは、単なる製品の発表以上のものです。それは地政学的な声明です。最適化のロードマップを Nvidia や AMD から切り離すことで、DeepSeek は事実上、シリコンに線を引いています。メッセージは明確です。中国はチップ層からアプリケーション層まで、自給自足の AI スタックを構築する意向です。
世界の AI コミュニティにとって、V4 のリリースはジレンマを提示します。モデルのオープンな可用性と高いパフォーマンスの可能性は、研究者や開発者にとって抗いがたい魅力です。しかし、非西側諸国のハードウェアに対する最適化の偏りはコミュニティを分裂させ、モデルがその発祥となった地政学的ブロックのハードウェアで最高のパフォーマンスを発揮する、最適化の「クローズド・ガーデン(囲い込まれた庭)」を作り出す可能性があります。
来週、北京で「両会」が招集される中、世界は政治的な演説だけでなく、限られた計算資源とソブリン・シリコンで何が可能かを再定義すると約束するモデルのベンチマークにも注目することになるでしょう。