AI News

偵測與預防之間的脫節

在一項重新引發全球對人工智慧安全與企業責任辯論的披露中,新的調查報告證實,OpenAI 的信任與安全系統在悲劇發生前幾個月,就已成功標記了塔姆勒嶺(Tumbler Ridge)學校槍擊案嫌犯的帳號。然而,協議中的關鍵漏洞意味著,雖然該帳號被封禁,但迫在眉睫的威脅卻從未通報給執法部門。

根據有關卑詩省塔姆勒嶺(Tumbler Ridge)屠殺案兇手 Jesse Van Rootselaar 調查所公佈的文件,OpenAI 的自動化系統在 2025 年 6 月偵測到其嚴重違反使用政策的行為。據報導,嫌疑人曾使用 ChatGPT 模擬戰術情境並起草暴力宣言。雖然這家 AI 巨頭立即採取行動終止了該用戶訪問其平台的權限,但未能將這些危險信號上報給皇家加拿大騎警(RCMP),目前正受到嚴厲審查。

對於 AI 行業而言,這起事件是當前內容審核框架局限性的嚴酷案例研究。它凸顯了一種危險的孤島效應:數位平台雖然能高度準確地識別危險,但缺乏法律義務或程序工作流來彌補數位封禁與現實世界干預之間的差距。

失敗的時間線

調查揭露了一個令人不寒而慄的時間線,強調了錯失預防良機的過程。數據顯示,大型語言模型(Large Language Models,LLMs)識別「傷害意圖」的能力日益增強,但其周圍的人為系統仍處於被動反應而非主動預防。

2025 年 6 月,Van Rootselaar 的帳號在 OpenAI 的內部監控系統中觸發了多個「alpha 嚴重等級」標記。這些標記專門用於描繪性暴力、仇恨言論或對生命構成明確威脅的內容。據報導,Van Rootselaar 輸入的提示詞(Prompts)包括關於學校佈局、緊急應變時間和武器改裝的詳細查詢。

自動化回應非常迅速。在觸發標記互動後的 24 小時內,該帳號被停權。然而,內部審查將此事件歸類為違反服務條款(ToS),而非需要外部報告的緊迫公共安全威脅。因此,Van Rootselaar 被切斷了與 AI 工具的聯繫,但他在皇家加拿大騎警或地方當局不知情的情況下,仍能自由地在線下繼續其計劃。

「警告義務」的困境

這場爭議的核心在於「警告義務(duty to warn)」這一法律與倫理概念。在心理治療領域,如果患者對自己或他人構成迫在眉睫的威脅,專業人員依法必須打破保密協議。目前 AI 服務提供商尚無此類普遍標準,尤其是在跨越國界的情況下。

與許多總部位於美國的科技巨頭一樣,OpenAI 在複雜的隱私法律網下運作。雖然他們會配合執法部門回應傳票,但主動報告往往受限於龐大的數據量以及對誤報的擔憂。

表 1:AI 審核與執法部門之間的差距

組件 OpenAI 內部行動 與執法部門的聯繫
偵測 演算法識別出與暴力相關的「高風險」提示。 無。數據保留在公司伺服器的孤島中。
回應 自動帳號終止和 IP 封鎖。 無。未向皇家加拿大騎警(RCMP)或當地警方發送自動警報。
法律狀態 違反「使用政策」(契約性質)。 潛在的共謀或威脅策劃(刑事性質)。
結果 用戶失去工具使用權限。 嫌疑人在事件發生前一直未受到調查。

技術能力 vs. 運作現實

從技術角度來看,該事件證明了內建於 GPT-4 及其後續模型中的安全過濾器正按設計運作。AI 拒絕生成某些有害輸出,並正確標記該用戶以供審查。這是 AI 對齊(AI alignment)技術方面的一大勝利——模型理解了惡意企圖。

然而,運作端失敗了。龐大的標記內容處理呈現出巨大的物流挑戰。科技公司每天要處理數百萬起違反服務條款的行為,從言語辱罵到合法威脅不等。將角色扮演遊戲玩家或編劇與真正的校園槍擊犯區分開來,仍然是一個複雜的障礙。

隱私倡導者也警告不要建立監控國家,讓 AI 公司自動將用戶提示轉發給警方。「如果我們強制要求 AI 公司向當局報告每一例暴力寫作,我們就有可能讓執法部門充斥著假警報,同時侵蝕用戶隱私,」AI 倫理資深分析師 Elena Rostova 博士指出。「然而,塔姆勒嶺案例證明,當信號如此具體且持續時,目前的報告門檻顯然太高了。」

管轄權挑戰

使問題更加複雜的是事件的跨國性質。OpenAI 是一家總部位於美國的實體,而犯罪發生在加拿大。確定通知哪個執法機構——並遵守用戶母國的隱私法規——增加了層層官僚阻力。

加拿大政府對此疏忽表示憤慨。據報導,政府官員正在起草新法規,要求在加拿大營運的數位平台在偵測到「可靠的大規模暴力威脅」後 24 小時內,無論公司總部位於何處,都必須向皇家加拿大騎警(RCMP)報告。

對 AI 行業的影響

對於 Creati.ai 的讀者和業界專業人士來說,此事件預示著合規標準可能會發生轉變。我們預計,在安全協議方面,AI 部署那種「快速行動,打破陳規」的時代已正式結束。

預測的法規變化

我們很可能會看到專門為生成式 AI(Generative AI)設計的「紅旗法」(Red Flag Laws)的實施。這些法規將迫使公司針對特定類別的標記內容與當局保持直接聯繫。這將責任從「審核」(保持平台清潔)轉向了「公共安全」(保持世界安全)。

此外,這可能會加速**聯邦化安全系統(Federated Safety Systems)**的發展。與其讓每家公司囤積自己的威脅數據,不如建立一個行業範圍內的「高風險行為者」資料庫,以防止在一個平台被封禁的用戶簡單地遷移到另一個平台繼續其準備工作。

人機協作的必要性

雖然 AI 偵測到了內容,但「不」報告的決定很可能是人類審查政策的系統性失敗,或是缺乏報告出口的自動化工作流。公司不僅需要投入巨資開發更好的 AI 偵測,還需要建立專門的人類安全團隊,有能力評估語境並應對國際報告要求。

AI 開發者面臨的主要挑戰:

  • 語境理解: 改進模型以區分虛構創作與實際計劃。
  • 隱私保護: 開發在不暴露無關用戶數據的情況下報告威脅的方法。
  • 全球合規: 在破碎的國際安全法律格局中穿梭。

結論

塔姆勒嶺的悲劇並非人工智慧無法理解其處理內容的失敗;而是管理該智慧之協議的失敗。OpenAI 的系統起作用了——它們在草堆中找到了針。但由於缺乏將那根針交給能阻止刺傷發生的人員的機制,偵測本身是徒勞的。

當業界反思 Jesse Van Rootselaar 的數位足跡在此次災難中的角色時,訊息很明確:內容審核不能再孤立存在。為了讓 AI 真正安全,它必須整合到更廣泛的社會安全框架中,彌補數位標記與現實世界干預之間的鸿溝。

精選
AdsCreator.com
即時從任何網站 URL 生成精緻、符合品牌調性的廣告素材,適用於 Meta、Google 與 Stories。
VoxDeck
引領視覺革命的AI簡報製作工具
Refly.ai
Refly.AI 讓非技術創作者能使用自然語言與視覺畫布自動化工作流程。
BGRemover
輕鬆地在線移除圖像背景,使用SharkFoto BGRemover。
Qoder
Qoder 是一款由人工智能驅動的程式碼助理,自動化軟體專案的規劃、編碼和測試。
Flowith
Flowith 是一個基於畫布的代理型工作空間,提供免費的 🍌Nano Banana Pro 和其他高效模型...
FineVoice
讓文字化為情感 — 在數秒內克隆、設計並創造富有情感的 AI 聲音。
Skywork.ai
Skywork AI 是一款創新的工具,旨在利用 AI 提高生產力。
FixArt AI
FixArt AI 提供免費、無限制的影像與影片生成 AI 工具,免註冊。
Elser AI
一體化網頁創作工作室,將文字與影像轉換為動畫風格藝術、角色、聲音與短片。
Pippit
提升您的內容創造力,使用 Pippit 的強大 AI 工具!
SharkFoto
SharkFoto 是一個整合型的 AI 平台,用於高效率地創建與編輯影片、影像和音樂。
Funy AI
將你的幻想化為影片!從圖片或文字生成AI比基尼、親吻影片。體驗AI換衣功能。完全免費,無需註冊!
KiloClaw
託管的 OpenClaw 代理:一鍵部署,超過 500 款模型,安全的基礎設施,並為團隊和開發者提供自動化代理管理。
Diagrimo
Diagrimo 即時將文字轉換為可自訂的 AI 產生圖表和視覺圖像。
SuperMaker AI Video Generator
輕鬆打造驚艷的影片、音樂和圖像,使用SuperMaker。
AI Clothes Changer by SharkFoto
SharkFoto 的 AI Clothes Changer 可即時讓您虛擬試穿服裝,呈現逼真的合身度、材質與光影。
Yollo AI
與 AI 伴侶互動聊天。支援圖生片、AI 圖片生成功能。
AnimeShorts
輕鬆使用尖端的AI技術創作驚人的動漫短片。
Image to Video AI without Login
免費的影像轉影片 AI 工具,立即將照片轉成平滑且高品質的動畫影片,並且無浮水印。
InstantChapters
即時生成吸引人的書籍章節。
Claude API
Claude API for Everyone
Anijam AI
Anijam 是一個 AI 原生動畫平台,透過代理式影片創作將點子轉化為精緻的故事。
wan 2.7-image
一款可控的 AI 圖像生成器,可精準控制臉部、配色、文字與視覺連貫性。
AI Video API: Seedance 2.0 Here
透過單一金鑰提供頂尖生成模型的統一 AI 影片 API,且成本更低。
happy horse AI
開源 AI 影片生成器,可從文字或圖片建立同步的影片與音訊。
NerdyTips
由 AI 驅動的足球預測平台,為全球聯賽提供以數據為基礎的比賽建議。
HappyHorseAIStudio
適用於文字、圖片、參考素材和影片編輯的瀏覽器式 AI 影片生成器。
WhatsApp AI Sales
WABot 是一款 WhatsApp AI 銷售副駕駛,提供即時腳本、翻譯與意圖偵測。
insmelo AI Music Generator
以 AI 為驅動的音樂生成器,將提示、歌詞或上傳內容在約一分鐘內轉為精緻且免版稅的歌曲。
BeatMV
基於網頁的人工智慧平台,將歌曲轉換為電影感音樂影片並用 AI 創作音樂。
UNI-1 AI
UNI-1 是一個結合視覺推理與高保真影像合成的統一影像生成模型。
Wan 2.7
專業級 AI 影片模型,具精準動作控制與多視角一致性。
Kirkify
Kirkify AI 為迷因創作者即時生成帶有招牌霓虹故障美學的臉部置換爆紅迷因。
Text to Music
將文字或歌詞轉換為完整的錄音室級別歌曲,包含 AI 生成的人聲、樂器與多軌匯出。
Iara Chat
Iara Chat:一個由AI驅動的生產力和通信助手。
kinovi - Seedance 2.0 - Real Man AI Video
免費的 AI 影片產生器,輸出逼真人物畫面,無浮水印,並享有完整商業使用權。
Video Sora 2
Sora 2 AI 將文字或圖像在幾分鐘內轉換為短篇、物理準確的社交及電商影片。
Tome AI PPT
由 AI 驅動的簡報製作工具,可在數分鐘內生成、優化並匯出專業投影片。
Lyria3 AI
AI 音樂生成器,可即時從文字提示、歌詞與風格建立高保真、完整製作的歌曲。
Atoms
由 AI 驅動的平台,使用多智能體自動化在數分鐘內建立全端應用程式與網站,無需編碼。
Paper Banana
以 AI 為動力的工具,可即時將學術文字轉換為已達投稿品質的方法圖與精確的統計圖表。
AI Pet Video Generator
使用 AI 驅动的範本與即時 HD 匯出,從照片建立可病毒式傳播且便於分享的寵物影片,適用於社交平台。
Ampere.SH
免費託管的 OpenClaw 主機。使用 $500 的 Claude 點數,60 秒內部署 AI 代理。
Palix AI
為創作者提供的一體化 AI 平台,使用統一點數生成影像、影片和音樂。
Hitem3D
Hitem3D 使用 AI 將單張影像轉換為高解析度、可投入生產的 3D 模型。
GenPPT.AI
由 AI 驅動的簡報製作工具,能在數分鐘內建立、美化並匯出專業的 PowerPoint 簡報,包含講者備註與圖表。
HookTide
由 AI 驅動的 LinkedIn 成長平台,學習你的語氣以產生內容、互動並分析表現。
Create WhatsApp Link
免費的 WhatsApp 連結與 QR 產生器,具備分析、品牌連結、路由與多代理聊天功能。
Seedance 20 Video
Seedance 2 是一款多模態的 AI 影片生成器,提供角色一致性、多鏡頭敘事與 2K 原生音訊。
Gobii
Gobii 讓團隊建立全天候(24/7)自主的數位工作者,以自動化網路研究與例行工作。
Free AI Video Maker & Generator
免費 AI 視頻製作與生成器 – 無限次使用,無需註冊
Veemo - AI Video Generator
Veemo AI 是一個整合型平台,可從文字或圖片快速生成高品質的影片與影像。
AI FIRST
透過自然語言自動化研究、瀏覽器任務、網頁擷取與檔案管理的對話式 AI 助手。
GLM Image
GLM Image 結合自回歸與擴散混合模型,生成高保真 AI 圖像並具備卓越的文字渲染能力。
ainanobanana2
Nano Banana 2 在 4–6 秒內產生專業品質的 4K 影像,具備精準的文字呈現與主題一致性。
WhatsApp Warmup Tool
由 AI 驅動的 WhatsApp 預熱工具,可自動化大量發送訊息並防止帳號被封。
TextToHuman
免費的 AI 人性化工具,能即時將 AI 文字重寫為自然、類人的寫作風格。無需註冊。
Manga Translator AI
AI Manga Translator 即時在線將漫畫影像翻譯為多種語言。
Remy - Newsletter Summarizer
Remy通過將電子郵件摘要成易於理解的洞察,自動化新聞稿管理。

OpenAI 的 ChatGPT 在 Tumbler Ridge 大屠殺發生數月前標記了加拿大校園槍手的帳戶

OpenAI 在 2025 年 6 月因暴力內容識別並封鎖了 Tumbler Ridge 校園槍手 Jesse Van Rootselaar 的 ChatGPT 帳戶,但沒有通知加拿大警方,重新引發了對人工智慧安全性的辯論。