
在人工智慧(Artificial Intelligence)正從簡單的內容生成轉向主動、任務導向執行的時代,「AI 代理(AI Agents)」的概念已成為產業討論的最前線。作為該領域的領先觀察者,Creati.ai 一直在追蹤自主系統的演變,而 Anthropic 最近的一項揭露,為數位經濟的未來提供了迷人的見解。
Anthropic 最近進行了一項為期一週的受控內部實驗,旨在衡量不同 AI 模型在作為自主談判代表時的經濟效能。透過建立一個模擬市場,該公司試圖理解模型能力——即底層大型語言模型(LLM)原始的「智慧」——如何直接轉化為現實世界中的談判表現。這些結果不僅具有啟發性,對於 多代理系統(multi-agent systems) 領域而言更是具有變革意義。
Anthropic 組織了一個獨特的數位商務環境,其中 69 個 AI 代理受命與彼此互動、進行交易,並為其各自的「所有者」爭取最佳結果。該實驗旨在模擬高風險的經濟環境,在這種環境中,效率、微妙的說服力和戰略預見力都會得到回報。
代理們根據所使用的模型層級進行分類,將能力更強、參數更多的高階模型與更輕量、更快速,但「智慧」程度較低的對應模型進行對比。透過監控這些代理如何處理交易請求、還價和成交策略,研究人員得以量化「智慧溢價(intelligence premium)」——即部署更聰明的代理所獲得的效用差異。
| 指標 | 高能力代理 | 低階代理 |
|---|---|---|
| 談判成功率 | 明顯較高 | 基準成功率 |
| 戰略適應性 | 主動改良 | 被動/啟發式 |
| 使用者感知 | 高透明度 | 對損失的感知微乎其微 |
Anthropic 的研究結果中最令人震驚的發現,或許是觀察到這些代理使用者之間存在的心理與實務差距。儘管更先進的模型持續獲得了優異的財務成果,但使用能力較低、成本較低模型的使用者,往往沒有意識到自己的表現不佳。
這種現象——在經濟學中常被稱為「能力不足卻毫無自覺(unskilled and unaware)」效應——對企業採用 AI 代理 具有深遠的影響。如果部署能力更強的模型能帶來顯著更好的交易結果,但使用者介面或預期管理未能突顯這種差異,組織將面臨流失大量價值的風險。這項研究顯示,對於複雜的 B2B 談判或自主商務而言,模型的「智慧」不僅僅是一種技術上的奢侈,更是一種關鍵的競爭優勢。
當我們展望由 AI 代理充斥的未來時,這項研究為一個新的研究分支奠定了基礎:AI 經濟學(AI Economics)。我們正進入一個階段,供應鏈的效率、數位市場的流動性以及採購的獲利能力,可能很快就會由這些系統之間的互動所主導。
作為 Creati.ai 的開發者與利益相關者,我們為尋求整合代理系統的公司總結了三個關鍵要點:
轉向自主、基於代理的工作流程是必然的趨勢。然而,Anthropic 的實驗強調,我們在穩定這些系統於協作環境中運作方面仍處於早期階段。隨著更多公司採用這些技術,我們預期對「可解釋代理(Explainable Agency)」的需求將會增加——這些系統不僅能有效談判,還能向人類利益相關者證明其戰略選擇的合理性。
Creati.ai 將持續關注這些發展。來自 Anthropic 的實驗室結果,是理解機器智慧將如何重塑全球經濟的基礎一步。無論是在供應鏈管理還是內部企業採購中,很明顯地,未來將屬於那些懂得以下事實的人:在 AI 代理的世界裡,能力不僅能提供更好的回應,還能提供更好的交易。
總結來說,隨著我們持續推動 AI 研究 的極限,焦點必須更銳利地對準技術表現與經濟影響的交叉點。來自這個 69 個代理市場的發現清楚地顯示,雖然 AI 代理每一天都在變得更聰明,但性能層級之間的差距正在擴大;那些能識別這種差異的企業,將成為未來數位市場的贏家。