AI News

Anthropic 修訂負責任擴展政策 v3(Responsible Scaling Policy v3),在五角大廈壓力下放寬關鍵安全承諾

Anthropic 被廣泛視為生成式 AI(Generative AI)競賽中具有安全意識的良知,現已發佈了其 負責任擴展政策(Responsible Scaling Policy, RSP v3) 的第三個版本。此次更新從根本上重組了該公司處理災難性 AI 風險的方式,且正值地緣政治與商業摩擦劇烈之際。據報導,隨著該公司面臨美國國防部關於其技術軍事用途的最後通牒,其移除「旗艦級」安全承諾——即如果無法保證安全則暫停開發——的做法已引發行業觀察者的嚴厲審查。

從「條件式暫停」向「務實透明化」的轉變

自成立以來,Anthropic 的 RSP 一直由「條件式承諾」機制所定義。在之前的 RSP v2 下,該公司承諾如果新模型在沒有相應保障措施的情況下跨越特定的「AI 安全等級(AI Safety Level, ASL)」閾值,將停止開發或部署。這種「絆網(tripwire)」方法旨在將安全置於競爭速度之上。

在 RSP v3 中,Anthropic 已轉向不再採取這些硬性停止措施。該公司認為,在競爭對手繼續競相前進的市場中,單方面的暫停是無效的。相反,新政策強調 透明化公眾目標設定

RSP v3 的關鍵組成部分:

  • 前沿安全路線圖(Frontier Safety Roadmaps): Anthropic 現在將發佈詳述其安全目標的「路線圖」,而非具有約束力的內部暫停。這些路線圖被描述為「雄心勃勃但非約束性」的,旨在建立公眾問責制,而非嚴格的操作瓶頸。
  • 風險報告: 該公司承諾每 3 到 6 個月發佈一次全面的風險評估。這些報告將詳述其當前模型的安全狀況,包括目前能力與理想安全標準之間的差距。
  • 外部審查: 在特定的高風險場景下,Anthropic 將使其風險報告接受第三方專家審查,以驗證其發現。

Anthropic 的高層將這一轉變定性為對現實的「務實」回應。在隨發佈附帶的部落格文章中,該公司指出,如果其他顧慮較少的開發者繼續推進,「停止 AI 模型訓練實際上對任何人均無幫助」。他們引用了「向頂尖競賽(race to the top)」——即競爭對手會效仿 Anthropic 的安全限制——的失敗,作為此次變革的主要驅動力。

比較:RSP v2 與 RSP v3

下表概述了舊政策與新發佈版本之間的結構性變化。

功能/承諾 RSP v2(舊版) RSP v3(現行)
核心機制 條件式暫停(ASL 絆網) 透明化與路線圖
安全承諾 如果無法保證安全則停止訓練 務實的單方面目標
文件記錄 內部評估與定義的閾值 公開的前沿安全路線圖
風險報告 側重於臨時和內部 系統性的公開風險報告(3-6 個月)
行業策略 以身作則(向頂尖競賽) 轉向國家競爭力

五角大廈的最後通牒:地緣政治的催化劑?

RSP v3 的發佈時機與 Anthropic 與美國軍方之間日益升級的僵局密不可分。報告確認,國防部長 Pete Hegseth 最近會見了 Anthropic 執行長 Dario Amodei,並下達了嚴厲的最後通牒:解除對 Claude 模型軍事用途的限制,否則將面臨嚴重後果。

據報導,五角大廈要求 Anthropic 允許其 AI 用於「任何合法目的」,這實際上剝奪了該公司對特定軍事應用的否決權。Anthropic 歷來對其技術的使用保持嚴格的「紅線」,禁止用於:

  1. 自動武器(autonomous weapons)(即 AI 在沒有人類干預的情況下做出致命的目標決策)。
  2. 大規模國內監控

國防部威脅要引用 《國防生產法》(Defense Production Act, DPA)——這是一部韓戰時期的法律,允許總統強迫私營公司優先處理國防合同。此外,官員們還提出了將 Anthropic 列為「供應鏈風險」的可能性,這將有效地將該公司列入所有聯邦合同的黑名單,可能使其損失數億美元的收入,並將其拒於利潤豐厚的政府部門之外。

批評者認為,RSP「暫停」承諾的放寬創造了一個便利的政策漏洞。通過移除基於內部安全閾值停止部署的嚴格要求,Anthropic 可能是在調整自身定位,以適應 五角大廈(Pentagon) 的要求,而無需在技術上違反其自身的安全憲章。

行業影響與「能力懸置」

RSP 的修訂突顯了 AI 行業日益增長的緊張局勢:「能力懸置(capability overhang)」。該術語指的是 AI 模型的原始能力與可用於控制它的安全機制之間的差距。Anthropic 之前的政策旨在防止這種懸置變得過大。通過移除硬煞車,該公司正隱含地接受更高水平的風險,以便與 OpenAI 和 xAI 等對手保持競爭,後者已經獲得了廣泛的國防合同。

為什麼這對 AI 生態系統至關重要:

  • 軍事 AI 的常態化: 如果作為行業內最直言不諱的安全倡導者 Anthropic 向五角大廈的壓力屈服,這標誌著主要 AI 實驗室中「出於良知的反對」之終結。
  • 自我監管的失敗: 這一轉變承認,在國家安全緊要關頭和市場動態面前,自願性承諾是不夠的。Anthropic 明確引用了缺乏聯邦監管作為其政策轉向的原因。
  • 聚焦部署後監測: 隨著部署前暫停的消失,行業的安全焦點可能會完全轉向系統構建 之後 的「紅隊演練(red teaming)」和監測,而非從一開始就防止其產生。

結論

Anthropic 的 RSP v3 代表了對 2026 年 AI 格局的一種成熟但憤世嫉俗的體認。2023 年的理想主義——即一家公司可以通過道德領導力引導行業走向安全——已與大國競爭和軍事必要性的冷酷現實相撞。雖然 風險報告前沿安全路線圖 的引入提供了一層新的透明度,但具有約束力的「安全承諾」的移除標誌著一個時代的結束。隨著五角大廈的陰影籠罩,Anthropic 不再試圖減慢火車的速度;它只是承諾在火車加速時更大聲地吹響警哨。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
VoxDeck
引領視覺革命的AI簡報製作工具
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Claude API
Claude API for Everyone
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

Anthropic 修訂 Responsible Scaling Policy v3,於五角大樓壓力下放寬關鍵安全承諾

Anthropic 發布了更新的 Responsible Scaling Policy (RSP v3.0),批評者表示此舉撤回了旗艦安全承諾,且恰逢五角大樓對軍事 AI 使用施加強大壓力。