中國在農曆新年前釋出包含 DeepSeek V4 的一波 AI 模型

中國的「馬年」以人工智慧軍備競賽拉開序幕

隨著中國數百萬人準備慶祝農曆新年，該國的科技領域掀起了一股瘋狂的人工智慧（Artificial Intelligence）發佈浪潮，將春節假期變成了爭奪生成式 AI（Generative AI）主導地位的戰場。在觀察家稱之為「紅海之春」的協同閃電戰中，包括阿里巴巴（Alibaba）、字節跳動（ByteDance）和智譜 AI（Zhipu AI）在內的主要參與者幾乎同時發佈了重大模型升級。

這一系列公告在 2026 年 2 月 17 日（馬年正月初一）達到巔峰，標誌著行業的關鍵轉向。焦點已果斷地從簡單的聊天機器人轉向「代理化（Agentic）」工作流、海量上下文窗口以及旨在削弱 OpenAI 和 Google 等西方競爭對手的激進價格戰。領跑這場攻勢的是備受期待的 DeepSeek V4，以及阿里巴巴強大的通義千問（Qwen）3.5、字節跳動面向消費者的豆包（Doubao）2.0 和智譜在本土訓練的 GLM-5。

DeepSeek V4：效率顛覆者

本季度最受關注的發佈或許是 DeepSeek V4。繼其前代產品在 2025 年初引發全球股市波動並取得市場震撼性成功後，DeepSeek 加倍投入其以極致效率著稱的聲譽。雖然官方技術論文仍由社群解析中，但早期細節顯示 V4 引入了一種新穎的「流形約束超連接」（Manifold-Constrained Hyper-Connections, mHC）架構。

據報導，這種架構轉向允許模型在超過一百萬個標記（Tokens）的上下文窗口中保持連貫性，而不會產生通常與此類規模相關的計算懲罰。行業洩露消息指出，DeepSeek V4 的目標成本結構約為 GPT-4 同類產品的 1/20，此舉可能會迫使全球 API 市場進行另一輪價格調整。

DeepSeek 的策略保持清晰：以足以讓大規模、自動化代理部署在經濟上可行的價格點，提供「GPT-5 級別」的推理和代碼編寫能力。其中包含的「印跡條件記憶」（Engram Conditional Memory）技術，這是一種選擇性信息保留技術，表明該模型專門針對複雜的多步軟體開發任務進行了優化。

阿里巴巴 Qwen 3.5：企業級「作業系統」

阿里巴巴雲（Alibaba Cloud）也不甘示弱，正式推出了 Qwen 3.5，將其描述為在成為 AI 時代作業系統征途上的「重大演進」。Qwen 3.5 系列擴展了 2.5 系列的多模態能力，在視覺推理和複雜指令遵循方面表現出顯著進步。

阿里巴巴的發佈強調穩定性與整合。與某些競爭對手的實驗性質不同，Qwen 3.5 被定位為企業安全、可擴展的選擇。該模型強化了對「函數調用」（Function Calling）的支持——即 AI 與外部軟體工具對接的能力——這對於業務自動化至關重要。

「未來，大型 AI 模型將深度整合到廣泛的設備中，」阿里巴巴雲領導層在發佈期間表示。通過開源 Qwen 3.5 套件的大部分內容，阿里巴巴繼續鞏固其生態系統，作為偏好非私有基礎架構開發者的默認標準。

字節跳動豆包 2.0：消費者的代理時代

TikTok 的母公司字節跳動已憑藉 Doubao 2.0 正式進入「代理時代」。該模型在假期前幾天發佈，為中國最受歡迎的 AI 應用提供支持，並代表了名為「Doubao-Seed-2.0」的重大架構重組。

豆包 2.0 的重點很明確：自主任務完成。該模型的設計不僅僅是回答用戶查詢，而是執行多步工作流，例如規劃旅遊行程並訂票，或研究某個課題並生成格式化的報告。字節跳動發佈了多種尺寸的模型，包括 Pro、Lite 和專門的 Code 變體，確保其覆蓋從行動設備到重型伺服器端處理的全光譜。

至關重要的是，字節跳動正在利用其龐大的用戶群來提煉模型的「情感智慧」和對話流暢度，旨在讓豆包在擁擠的市場中保持頂級消費者超級應用的地位。

智譜 GLM-5：本土硬體的勝利

智譜 AI 發佈的 GLM-5 因另一個原因脫穎而出：基礎設施獨立性。據報導，這個擁有 7440 億參數的模型（採用混合專家（Mixture-of-Experts）架構）完全在華為昇騰（Huawei Ascend）晶片上訓練，標誌著中國脫離受美國限制的 NVIDIA 硬體努力中的一個重要里程碑。

GLM-5 以約每百萬輸入標記 0.80 美元的顛覆性低價推出，將自己定位為學術和研究領域的重磅產品。該模型的「Pony Alpha」預覽版在官方品牌揭曉前就已因其推理能力而受到關注。智譜在本土晶片上成功訓練如此大規模的模型，緩解了人們對美國出口管制將永久封頂中國 AI 發展天花板的擔憂。

新發佈模型對比分析

下表總結了在此次假日前窗口發佈的關鍵模型規範和戰略定位。

表：2026 年農曆新年 AI 模型發佈

模型名稱	開發者	關鍵架構/特性	主要戰略重點
DeepSeek V4	DeepSeek AI	流形約束超連接（mHC）	極致成本效率與代碼推理
Qwen 3.5	阿里巴巴雲（Alibaba Cloud）	增強的多模態與函數調用	企業整合與開源生態系統
Doubao 2.0	字節跳動（ByteDance）	Doubao-Seed-2.0 / 代理化工作流	消費者應用與自主代理
GLM-5	智譜 AI（Zhipu AI）	昇騰晶片上的 744B 參數（MoE）	本土基礎設施獨立性與規模化

市場影響：歸零競賽

這些模型的同步發佈突顯了中國國內競爭的激烈程度。2024 年和 2025 年的「價格戰」動態並未平息；它已演變成一場「效率戰」。

對於開發者來說，這是一個黃金時代。智慧的成本下降速度超過了摩爾定律，使得運行持續後台推理的新型應用程序（如實時個人助理或自動代碼重構機器人）成為可能，而這些應用程序以前的運行成本過於昂貴。

然而，對於涉及的公司來說，財務壓力是巨大的。在農曆新年之前急於發佈，暗示了一種「圈地」心態，即在假期停工前捕捉開發者的注意力被視為至關重要。

全球背景

雖然矽谷仍專注於通過大規模計算集群實現 AGI 的路徑，但中國的實驗室正在開闢出一種以推理效率和應用層主導地位為核心的獨特身份。DeepSeek V4 以訓練和推理成本的一小部分挑戰頂級美國模型的能力，挑戰了「越大越好」的普遍敘事。

隨著馬年的開始，來自北京、杭州和上海的信息很明確：AI 競賽不再僅僅關乎誰擁有最聰明的模型，而在於誰能讓智慧變得無處不在、負擔得起且實際有用。