Anthropic 內部實驗顯示，更強大的 AI 代理能談成更好的交易

AI 商務的新前線：Anthropic 的內部市場實驗

在人工智慧（Artificial Intelligence）正從簡單的內容生成轉向主動、任務導向執行的時代，「AI 代理（AI Agents）」的概念已成為產業討論的最前線。作為該領域的領先觀察者，Creati.ai 一直在追蹤自主系統的演變，而 Anthropic 最近的一項揭露，為數位經濟的未來提供了迷人的見解。

Anthropic 最近進行了一項為期一週的受控內部實驗，旨在衡量不同 AI 模型在作為自主談判代表時的經濟效能。透過建立一個模擬市場，該公司試圖理解模型能力——即底層大型語言模型（LLM）原始的「智慧」——如何直接轉化為現實世界中的談判表現。這些結果不僅具有啟發性，對於多代理系統（multi-agent systems）領域而言更是具有變革意義。

解碼市場：實驗框架

Anthropic 組織了一個獨特的數位商務環境，其中 69 個 AI 代理受命與彼此互動、進行交易，並為其各自的「所有者」爭取最佳結果。該實驗旨在模擬高風險的經濟環境，在這種環境中，效率、微妙的說服力和戰略預見力都會得到回報。

代理們根據所使用的模型層級進行分類，將能力更強、參數更多的高階模型與更輕量、更快速，但「智慧」程度較低的對應模型進行對比。透過監控這些代理如何處理交易請求、還價和成交策略，研究人員得以量化「智慧溢價（intelligence premium）」——即部署更聰明的代理所獲得的效用差異。

模擬中的關鍵觀察

指標	高能力代理	低階代理
談判成功率	明顯較高	基準成功率
戰略適應性	主動改良	被動/啟發式
使用者感知	高透明度	對損失的感知微乎其微

「無聲」的差距：當無能被忽視時

Anthropic 的研究結果中最令人震驚的發現，或許是觀察到這些代理使用者之間存在的心理與實務差距。儘管更先進的模型持續獲得了優異的財務成果，但使用能力較低、成本較低模型的使用者，往往沒有意識到自己的表現不佳。

這種現象——在經濟學中常被稱為「能力不足卻毫無自覺（unskilled and unaware）」效應——對企業採用 AI 代理具有深遠的影響。如果部署能力更強的模型能帶來顯著更好的交易結果，但使用者介面或預期管理未能突顯這種差異，組織將面臨流失大量價值的風險。這項研究顯示，對於複雜的 B2B 談判或自主商務而言，模型的「智慧」不僅僅是一種技術上的奢侈，更是一種關鍵的競爭優勢。

對 AI 經濟與多代理系統的啟示

當我們展望由 AI 代理充斥的未來時，這項研究為一個新的研究分支奠定了基礎：AI 經濟學（AI Economics）。我們正進入一個階段，供應鏈的效率、數位市場的流動性以及採購的獲利能力，可能很快就會由這些系統之間的互動所主導。

企業的戰略考量

作為 Creati.ai 的開發者與利益相關者，我們為尋求整合代理系統的公司總結了三個關鍵要點：

能力校準： 組織必須擺脫模型「一體適用（one-size-fits-all）」的思維。對於常規行政任務，較小的模型已足夠；但對於高風險談判或資源分配，為高能力模型支付的溢價，完全能從交易成果的投資報酬率（ROI）中得到證明。
透明度問題： 開發者必須建構監控系統，讓使用者能看清楚代理「為何」做出特定決策。若缺乏這種洞察，使用者可能會將不良的 AI 表現誤認為市場狀況不佳。
系統互動： 多代理系統的未來取決於不同模型如何互動。Anthropic 的實驗證明，對手的「智慧」與代理本身的內部邏輯同樣重要。

前進之路：精進自主談判

轉向自主、基於代理的工作流程是必然的趨勢。然而，Anthropic 的實驗強調，我們在穩定這些系統於協作環境中運作方面仍處於早期階段。隨著更多公司採用這些技術，我們預期對「可解釋代理（Explainable Agency）」的需求將會增加——這些系統不僅能有效談判，還能向人類利益相關者證明其戰略選擇的合理性。

Creati.ai 將持續關注這些發展。來自 Anthropic 的實驗室結果，是理解機器智慧將如何重塑全球經濟的基礎一步。無論是在供應鏈管理還是內部企業採購中，很明顯地，未來將屬於那些懂得以下事實的人：在 AI 代理的世界裡，能力不僅能提供更好的回應，還能提供更好的交易。

總結來說，隨著我們持續推動 AI 研究的極限，焦點必須更銳利地對準技術表現與經濟影響的交叉點。來自這個 69 個代理市場的發現清楚地顯示，雖然 AI 代理每一天都在變得更聰明，但性能層級之間的差距正在擴大；那些能識別這種差異的企業，將成為未來數位市場的贏家。