
人工智慧的格局正迅速從被動的內容生成轉向主動的任務執行。Anthropic 正式推出了「電腦使用」(Computer Use)功能,將這一演進推向主流,這是一項重大功能,允許其 AI 助手 Claude 直接與 Mac 和 Windows 桌面互動。這一更新整合到了 Claude Cowork 和 Claude Code 環境中,標誌著對傳統 API 限制的 AI 互動方式的背離,預示著 AI 代理將成為我們數位工作空間直接操作者的未來。
這項發展不僅僅是一個軟體更新;它是人類與機器互動方式的根本性轉變。透過賦予 AI 導航瀏覽器、操作應用程式和處理介面的能力,Anthropic 正在解決自動化的「最後一哩路」問題——即 AI 在文字方塊中產生的內容與在使用者作業系統上實際執行工作流之間的差距。
從核心來看,Anthropic 的「電腦使用」(Computer Use)功能的設計目的是執行以前僅限於人工干預的任務。無論是填寫複雜的試算表、操作專有的企業軟體,還是執行多步驟的瀏覽器任務,Claude 現在都能夠觀察螢幕並啟動點擊、輸入和導航指令。
然而,Anthropic 採用了分層架構方法來實現此功能,以確保效率和可靠性。Claude 被程式化為優先選擇現有的、強大的整合——例如與 Slack、日曆服務和生產力套件的直接 API 連接——只要有可能。 「電腦使用」功能主要旨在作為一種複雜的備用機制。當基於 API 的整合不可用或不足時,AI 會轉向直接的桌面互動,有效地模仿人類輸入方法來彌補差距。
這種設計理念反映了對 AI 穩定性的細緻理解。透過優先考慮結構化數據交換(API)而非非結構化介面操作(螢幕控制),Anthropic 旨在將錯誤率降至最低,同時保持處理非標準化工作流所需的多功能性。
在 Claude Cowork 和 Claude Code 中部署此功能是一項戰略舉措,特別針對高級使用者和開發者。對於那些深耕於軟體開發或企業營運的人來說,這些工具不僅僅是介面,更是操作樞紐。
「Dispatch」功能的加入進一步增強了這一實用性。Dispatch 允許使用者從任何地方遠端控制自己的電腦環境,從本質上將 Claude 變成了一個本地機器的便攜式、智慧型代理(proxy)。這項功能預計將顯著簡化遠端開發工作流,使工程師能夠在不親自綁定到工作站的情況下啟動環境設定、偵錯任務或執行重複的本地測試。
這些功能的底層技術在很大程度上歸功於 Anthropic 最近對 Vercept AI 的收購。Vercept 專業知識的整合非常迅速,團隊在收購後僅幾週就交付了實質性的產品成果。這種速度突顯了當前 AI 軍備競賽的激烈程度,專有技術和人才獲取正在決定通往真正代理式 AI 競賽中的獲勝者。
為了理解這項技術在專業技術棧中的位置,將傳統的 AI 自動化與 Anthropic 的新代理式方法進行對比是有幫助的。
| 自動化層級 | 主要方法 | 可靠性概況 | 使用案例場景 |
|---|---|---|---|
| API-Based Integration | 結構化 JSON/REST | 高 - 確定性 | 數據同步、CRM 更新、日曆管理 |
| Computer Use (AI) | 視覺介面控制 | 中 - 自適應 | 與舊版應用程式互動、重 UI 工作流、螢幕導航 |
| Hybrid Approach | 智慧備用 | 高 - 優化 | 需要數據同步和 UI 執行的複雜任務鏈 |
如上表所示,Anthropic 所倡導的混合方法旨在將結構化數據的可靠性與視覺互動的靈活性相結合。
授予 AI 助手對桌面環境的完全控制權是一項雄心勃勃的技術壯舉,但也引入了不容忽視的攻擊面。代理式 AI 解釋螢幕內容並執行點擊的能力引入了與數據隱私和未經授權操作相關的風險。如果代理可以點擊,它就有可能刪除文件、無意中洩露訊息或與敏感對話框互動。
Anthropic 充分意識到了這些影響。透過將其定位為「研究預覽」,該公司發出了訊號,表明該技術雖然強大,但在對抗性安全領域仍處於起步階段。可靠性仍然是一個主要挑戰;與通常返回成功或失敗狀態的 API 不同,視覺介面需要 AI 「解釋」點擊是否成功,或者 UI 狀態是否以非預期的方式發生了變化。
業界廣泛觀察到了類似的(儘管不那麼成功的)基於瀏覽器代理的實驗。OpenAI 對各種操作員模型的嘗試突顯了建立不產生幻覺操作或不卡在 UI 迴圈中的可靠代理的困難。Anthropic 的「電腦使用」透過嘗試操作整個作業系統邁出了更大的一步,使其成功(或失敗)成為通用 AI 代理未來的風向標。
截至 2026 年 4 月,這些功能對 Pro 和 Max 使用者的開放,表明了推動快速採用的趨勢。對於組織而言,這意味著 AI 的角色正從提供建議的顧問轉變為執行操作的員工。
展望未來,這項倡議的成功不僅取決於該功能的技術能力,還取決於其與更廣泛業務流程的整合。如果 Claude 能夠在沒有人工監督的情況下持續管理並在不同的桌面應用程式中執行任務,我們可能會看到生產力基準的巨大轉變。代理導航舊版軟體的能力——這通常是數位轉型中最大的瓶頸——可能會釋放出傳統 API 永遠無法實現的顯著效率提升。
最終,Anthropic 將電腦控制權(desktop control)帶給大眾的舉措證實了 AI 革命不再侷限於聊天視窗。它正在進入螢幕、進入作業系統,並直接進入我們的工作流。對於專業生態系統而言,訊息很明確:自主代理的時代已經到來,它已經準備好接管控制權。