AI News

Anthropic 安全主管離職:「處於危險中的世界」警告震撼 AI 業界

由 Creati.ai 編輯團隊撰寫
2026 年 2 月 10 日

在人工智慧(Artificial Intelligence)社群引起劇烈震撼的發展中,Anthropic 安全保障研究團隊主管 Mrinank Sharma 已經辭職。他的離職於週一透過 X(前身為 Twitter)上一封充滿神祕感與哲學氣息的信件宣布,而就在幾天前,該公司剛發布了最新的旗艦模型 Claude Opus 4.6。Sharma 的離職不僅僅是人事變動;它更是一個鮮明的信號,揭示了全球領先 AI 實驗室內部商業擴張與倫理對齊之間日益加劇的緊張關係。

Sharma 的 辭職 信中引用了詩人 Rainer Maria Rilke 和 William Stafford 的詩句,而非技術基準測試,並警告說「處於危險中的世界」正面臨「一系列相互關聯的危機」。對於像 Anthropic 這樣建立在「憲法 AI(Constitutional AI)」承諾和安全優先開發基礎上的公司來說,在推動 3500 億美元估值的過程中失去一位關鍵的安全保障領導者,引發了關於該行業發展軌跡的令人不安的問題。

「處於危險中的世界」信件:剖析警告

這封辭職信明顯缺乏矽谷離職信中常見的標準企業客套話。相反地,Sharma 對世界現狀以及技術在其中的角色進行了憂鬱的反思。他明確表示,人類正接近一個「門檻,我們的智慧必須與我們影響世界的能力同步增長,否則我們將面臨後果」。

這種語言暗示 Sharma 的擔憂超出了技術故障或「幻覺」。他指出,在 AI 加速發展的能力與旨在遏制它們的社會結構之間,存在著更深層次、關乎生存的失調。

辭職聲明中的關鍵摘要包括:

  • 關於全球危機: 警告世界不僅面臨 AI 風險,還面臨 AI 加劇現有脆弱性的「多重危機(Polycrisis)」。
  • 關於人性: 特別提到了他最後一個研究項目,即調查「AI 助手如何讓我們變得不那麼像人,或扭曲我們的人性」。
  • 關於智慧與力量: 斷言我們的技術槓桿正領先於我們的道德和智力成熟度。

價值觀衝突:內部鬥爭

Sharma 聲明中最具殺傷力的部分,或許是他承認在壓力下難以堅持原則。「我反覆看到,讓我們的價值觀真正主導我們的行動是多麼困難,」Sharma 寫道。「我在自己身上看過,在組織內部也看過,我們不斷面臨著拋開最重要事物的壓力。」

這番告白直擊 Anthropic 品牌身份的核心。Anthropic 由因安全疑慮而離開 OpenAI 的前員工組成,一直將自己定位為「房間裡的成年人」——即不會為了速度而犧牲安全的實驗室。然而,Sharma 的離職表明,隨著賭注的增加——受 Claude Opus 4.6 的發布和大規模資本注入的推動——內部文化可能正在發生轉變。

行業分析師推測,Sharma 所指的「壓力」很可能是為了與 GPT-5.3-Codex 及其他新興巨頭競爭而交付模型的需求。追求 3500 億美元的估值需要激進的產品路線圖,這可能與嚴格的安全保障研究所需的緩慢、深思熟慮的節奏相衝突。

AI 安全(AI Safety)領域的離職潮

Mrinank Sharma 並非孤立案例。在他的辭職之前,已經出現了安全研究人員離開頂級 AI 公司的日益增長的趨勢,理由同樣是產品優先於協議。就在上週,其他著名的 Anthropic 人物,包括 Harsh Mehta(研發)和領先科學家 Behnam Neyshabur,也宣布他們將離開並「開始新事務」。

這種人才流失鏡像了其他實驗室歷史上的離職情況,創造了一種令人擔憂的模式:負責為 AI 系統構建「煞車」的人員感到被迫完全離開這輛車。

表格:近期備受關注的 AI 安全 離職事件與背景

名稱 職位 組織 原因 / 背景
Mrinank Sharma 安全保障團隊主管 Anthropic 引用價值觀衝突及在擴張壓力下的「處於危險中的世界」。
發生在 Claude Opus 4.6 發布幾天後。
Harsh Mehta 研發研究員 Anthropic 宣佈離職以「開始新事務」,正值內部轉向之際。
技術人才廣泛流失的一部分。
Behnam Neyshabur 首席 AI 科學家 Anthropic 與其他研究人員同時離開。
預示研究方向可能存在戰略分歧。
歷史先例 高階安全主管 OpenAI / Google DeepMind 前幾年也出現過類似的離職(例如 Jan Leike、Ilya Sutskever),理由是
為了產品發布而邊緣化安全團隊。

商業背景:Claude Opus 4.6

這次辭職的時間點至關重要。Anthropic 最近推出了 Claude Opus 4.6,該模型以其卓越的代理編碼性能和辦公生產力提升為賣點。雖然技術評論讚揚了該模型的能力,但其發布的速度已引起審查。

Sharma 辭職後的網路討論非常激烈。X 上的技術專家和評論員解析了他的貼文,推測推動 Opus 4.6 的交付涉及在安全閾值上的妥協。正如一條熱門評論所指出的:「構建護欄的人和構建營收目標的人在同一個組織架構中,但他們優化的變量卻不同。」

令人擔憂的是,「安全」正成為一個營銷術語,而非工程約束。如果安全保障主管感到組織正在「拋開最重要的事物」,這就會讓人懷疑據稱管理 Claude 行為的「憲法 AI」框架的可靠性。

對 AI 治理的影響

Sharma 的離職是 AI 行業自我監管狀態的風向標。如果 Anthropic——可以說是主要實驗室中安全意識最強的一個——都因為 價值觀衝突 而難以留住其安全保障領導層,這表明自願性的企業治理可能在市場誘因的重壓下失效。

辭職所凸顯的核心挑戰:

  1. 去人性化風險: Sharma 對 AI 如何扭曲人性的關注表明,風險已超出物理安全(如生物武器),延伸至心理和社會傷害。
  2. 部署速度: 模型開發週期與安全研究週期之間的差距正在擴大。
  3. 資本壓力: 隨著估值達到數千億美元,對投資者的信託責任正與對人類的道德責任發生衝突。

結論

Mrinank Sharma 的離職不僅僅是一個人事公告;它是安靜房間裡吹響的哨聲。隨著 Anthropic 繼續其快速擴張,且世界開始擁抱像 Claude Opus 4.6 這樣的工具,Sharma 提出的關於智慧、價值觀和「處於危險中的世界」的問題仍未得到解答。在 Creati.ai,我們將繼續關注該行業是選擇聽從這一警告,還是加速超越它。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
InstantChapters
即時生成吸引人的書籍章節。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
Claude API
Claude API for Everyone
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

Anthropic 的 AI 安全主管辭職,並對處於危險中的世界發出嚴厲警告

Anthropic 防護團隊主管 Mrinank Sharma 因價值觀衝突而辭職,並警告隨著 AI 能力加速,全球各種危機相互交織。