AI News

Anthropic 揭露涉及中國主要 AI 實驗室的大規模蒸餾網絡

在當前人工智慧軍備競賽的一次重大升級中,Anthropic 公開指控三家著名的中國 AI 實驗室——DeepSeek、Moonshot AI 和 MiniMax——進行一項系統性的工業規模活動,旨在從其 Claude 模型中提取能力。週一發佈的一份新安全報告詳細說明了這些組織據稱如何利用數以千計的虛假帳號,將 Claude 的進階推理和程式編寫能力「蒸餾(distill)」到他們自己的專有模型中。

這一發現正值全球 AI 產業的關鍵時刻,適逢華盛頓關於半導體出口管制有效性的辯論日益激烈。隨著美國決策者努力限制中國獲取尖端硬體,Anthropic 的調查結果顯示,透過模型蒸餾進行的智慧財產權竊取已成為競爭對手繞過硬體限制並縮小能力差距的主要途徑。

「蒸餾」行動的規模

根據 Anthropic 的調查,這項協同行動涉及透過一個由約 24,000 個虛假帳號組成的複雜網絡,與 Claude 模型進行了超過 1,600 萬次對話。據稱,這些帳號透過商業代理服務進行管理以掩蓋其來源,被用於系統性地查詢 Claude,並記錄其輸出以訓練較小的國產模型——這一過程在機器學習中被稱為「蒸餾(distillation)」。

雖然蒸餾是開發人員用來將自己的大型模型壓縮成更高效版本的合法技術,但在未經授權的情況下從競爭對手的模型中提取數據違反了服務條款,並構成了智慧財產權竊取。Anthropic 的數據顯示,該行動並非偶然的實驗,而是對高價值認知行為的高度組織化提取。

攻擊規模在受指控的機構之間存在顯著差異,其中 MiniMax 似乎是最激進的攻擊者。以下細目說明了據稱活動的範圍:

表格:各實驗室據稱蒸餾活動的細目

實驗室名稱 估計對話次數 主要目標能力
MiniMax ~1,300 萬 代理程式編寫、工具編排和複雜的推理序列
Moonshot AI ~340 萬 代理推理、數據分析和電腦視覺任務
DeepSeek >150,000 基礎邏輯、對齊協定和策略敏感查詢

AI 劫持的解析

Anthropic 描述的方法揭示了對大型語言模型(Large Language Model,LLM)訓練管道的複雜理解。攻擊者不僅僅是隨機提問;他們針對的是難以從頭開始複製且成本昂貴的特定「導師」行為。

被認定為最大侵權者的 MiniMax,據報導在新款模型發佈後的 24 小時內,將其近一半的流量重定向至 Claude,實際上是利用 Anthropic 的基礎設施來啟動其自身系統的能力。透過將使用者提示輸入 Claude 並使用高品質的回應來訓練自己的模型,這些實驗室理論上可以在僅花費一小部分運算資源的情況下,達到與美國頂尖模型接近的水平。

報告中確定的關鍵策略包括:

  • 思維鏈誘發(Chain-of-Thought Elicitation): 提示 Claude 「展示其工作過程」或解釋其推理步驟,生成豐富的訓練數據,教導「學生」模型「如何」思考,而不僅僅是回答什麼。
  • 代理網絡混淆(Proxy Network Obfuscation): 利用去中心化的住宅代理網絡來分配請求,使流量看起來像是來自數千名截然不同的合法使用者。
  • 有針對性的防護欄剝離(Targeted Guardrail Stripping): 專門查詢敏感話題以了解 Claude 如何拒絕或處理安全請求,潛在目的是訓練能規避類似限制的模型。

國家安全維度:剝離的安全措施

除了智慧財產權竊取的商業影響外,Anthropic 還強調了一個嚴重的安全擔憂:安全防護欄的移除。像 Claude 這樣的美國前沿模型都經過嚴格的「憲制 AI(Constitutional AI)」訓練,以防止其協助製造生物武器、發動網路攻擊或散佈假消息。

當一個模型被非法蒸餾時,「學生」模型通常只學習「導師」的能力,而沒有繼承其安全抑制機制。Anthropic 警告說,這些「脫韁」的複製體構成了獨特的擴散風險。如果一個蒸餾模型保留了 Claude 的程式編寫熟練度,但缺乏其針對惡意軟體生成的拒絕機制,它就會成為惡意行為者的強大武器。

Anthropic 在其名為《檢測與預防蒸餾攻擊(Distillation Attacks)》的研究論文中表示:「非法蒸餾的模型缺乏必要的安全保障,造成了重大的國家安全風險。」該公司認為,允許外國實體複製美國的 AI 能力,破壞了美國政府一直敦促業界採用的安全協議。

新的防禦措施:行為指紋

與指控同時,Anthropic 發佈了旨在即時識別並阻止蒸餾企圖的新防禦機制細節。該防禦的核心是「行為指紋(behavioral fingerprinting)」,這是一種分析 API 使用統計模式的技術。

與表現出有機、多樣化互動模式的合法使用者不同,蒸餾腳本通常會留下細微的統計特徵。這些特徵包括:

  • 不自然的提示分佈: 高頻率的提示旨在覆蓋模型的整個「知識空間」,而不是解決即時的使用者問題。
  • 系統性的參數掃描: 系統性地改變溫度或採樣設置,以針對同一提示提取多樣化的輸出。
  • 延遲相關性: 顯示 API 正在根據第三方使用者輸入進行程式化調用的時間模式(一種「中間人」設置)。

Anthropic 已宣佈正與其他美國主要的 AI 實驗室(如 OpenAI 和 Google DeepMind)、雲端服務供應商以及政府當局分享這些技術指標,以建立一個全產業的防禦網來對抗模型挖掘。

地緣政治影響:晶片戰爭的聯繫

這一事件為複雜的美中科技關係投下了震撼彈。此時機點尤為敏感,因為美國商務部目前正在審查出口管制的有效性,該管制禁止向中國公司銷售先進的 GPU,如 NVIDIA 的 H100 和最新的 Blackwell 系列。

現行出口禁令的批評者認為,如果中國實驗室可以透過複製美國模型的智慧來「巧妙地」繞過硬體缺陷,那麼禁令是不夠的。如果一個實驗室可以透過蒸餾 Claude,僅使用 10% 的運算能力就訓練出一個具競爭力的模型,那麼旨在減緩中國 AI 進展的「運算壁壘」就會變得更加脆弱。

對政策的影響:

  • 更嚴格的 API 控制: 我們可能會看到美國監管機構要求對 AI API 訪問實施類似銀行業監管的「認識您的客戶(KYC)」標準,以防止匿名外國訪問。
  • 出口管制擴大: 「出口」的定義可能會擴大,不僅包括物理晶片或模型權重,還包括可用於訓練的模型推理 API 的訪問。
  • 報復性措施: 這種公開點名可能會引發北京方面的報復性網路活動或制裁,進一步使全球 AI 生態系統分化。

結論

Anthropic 提出的指控標誌著 AI 領域從理論風險轉向記錄在案的衝突。隨著模型變得越來越有價值,它們不再僅僅是產品,而是具有戰略意義的國家資產。這次「蒸餾劫持案」清楚地提醒人們,在數位時代,能力可以像建立時一樣輕易被竊取。對於該產業來說,現在的重點必須從單純建立更聰明的模型,轉向建立更難以被竊取的模型,確保美國創新的成果不會在無意中助長了那些原本旨在超越的競爭對手。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Claude API
Claude API for Everyone
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

Anthropic 指控中國 AI 實驗室透過蒸餾攻擊挖掘 Claude

Anthropic 公開指控中國的 AI 實驗室透過蒸餾攻擊系統性地從其 Claude 模型中提取知識,並在美國討論 AI 晶片出口管制之際,發佈了新的偵測與防護研究。