
在重塑人工智慧(Artificial Intelligence)產業的法律戰重大升級中,大英百科全書(Encyclopedia Britannica)及其子公司韋氏詞典(Merriam-Webster)已對 OpenAI 提起了聯邦訴訟。這份於 2026 年 3 月 13 日提交至美國紐約南區地方法院的訴狀指控,這家 AI 巨頭在未經授權或補償的情況下,利用出版商近 10 萬篇受版權保護的文章來訓練其大型語言模型,涉嫌「大規模」侵犯版權。
這次法律行動代表了傳統出版機構與生成式 AI(Generative AI)開發者之間持續衝突的關鍵時刻。隨著對 AI 獲取資訊的依賴程度日益增長,數據獲取與智慧財產權保護之間的緊張關係已達到沸點。原告辯稱,他們經過精心研究、事實查核且由訂閱資助的內容,正被重新利用於驅動那些實際上與其競爭的工具,威脅到其業務模式和資訊的完整性。
訴訟的核心在於系統性地攝取受保護的智慧財產。根據法院文件,OpenAI 涉嫌從大英百科全書和韋氏詞典網站抓取內容,以訓練其旗艦聊天機器人 ChatGPT 及相關系統。出版商主張,這一過程不僅僅是被動收集公共資訊,而是對高價值版權作品的未經授權挪用。
訴狀強調了兩種主要的損害模式:
原告辯稱,這種循環創造了一種寄生關係,AI 從出版商對人類專業知識的投資中獲益,卻未向創作者提供任何財務回報。OpenAI 被指控通過分流原本會進入官方網站的流量,蠶食了資助這些參考平台維護的訂閱和廣告收入。
也許這項法律挑戰最獨特的面相是專注於 商標稀釋(trademark dilution) 和虛假原產地標記。出版商辯稱,問題不僅在於單純的文本複製,還延伸到了其品牌的誠信度。當 ChatGPT 出現「幻覺(Hallucinations)」——即產生不準確或捏造的資訊時——有時會將這些數據錯誤地歸功於大英百科全書或 Merriam-Webster。
出版商聲稱,這種做法直接違反了《蘭哈姆法案》(Lanham Act)。他們斷言,OpenAI 的系統利用這些百年機構的信任聲譽,為生成的內容增添可信度的假象,即使該內容是不正確的。這種「幻覺」問題不僅會困惑使用者,還會主動威脅到品牌長期以來在準確性和可靠性方面的聲譽。
下表總結了主要爭議點以及原告與被告所持的對立立場。
| 主張/問題 | 原告立場(大英百科全書/韋氏詞典) | 被告立場 (OpenAI) |
|---|---|---|
| 受版權保護的訓練數據 | 未經授權使用超過 10 萬篇文章訓練 LLM | 公開可用的數據屬於 合理使用(fair use) |
| 營收影響 | AI 系統分流流量並蠶食訂閱收入 | 模型賦能創新,且不取代原始來源 |
| 商標完整性 | 幻覺將錯誤資訊錯誤歸因於出版商 | AI 生成的輸出是具轉化性且新穎的 |
| 責任範圍 | 廣泛、系統且未經授權的抓取 | 營運符合標準產業 AI 實務 |
這起訴訟並非孤立事件,而是當前席捲 AI 產業的訴訟浪潮的一部分。隨著在美國針對 AI 公司提起超過 90 起類似的版權訴訟,關於 人工智慧 訓練的法律先例仍在書寫中。
針對 OpenAI 的案件加入了紐約南區地方法院複雜的多地區訴訟環境中。包括《紐約時報》在內的其他媒體巨頭已經啟動了類似程序。觀察家和法律專家正密切關注這些進展,因為它們可能會決定應用於機器學習(Machine Learning)的「合理使用」的未來。OpenAI 一貫主張其模型依賴於公開可用的數據,斷言該技術將資訊轉化為完全全新的輸出,而非直接複製。
對於 Creati.ai 的讀者和業界觀察家來說,此案凸顯了數位商業模式的一個關鍵轉折點。出版商辯稱,他們對高品質、人類創作內容的投資在沒有補償的情況下受到損害。隨著 AI 模型成為資訊探索的主要介面,出版商對「公平補償」的訴求反映了內容創作者對網際網路生態系統永續性更廣泛的焦慮。
如果法院判決大英百科全書和韋氏詞典勝訴,這可能會迫使 AI 公司在獲取數據的方式上發生根本性轉變。相反,如果判決對原告不利,可能會鼓勵開發者繼續利用公開可用的數據集而無需授權協議。隨著案件的進展,業界將密切關注法院如何解讀生成式人工智慧的轉化性質與智慧財產權持有人的受保護權利。這場爭端的解決可能會為未來十年的 AI 發展奠定基礎。