
在人工智慧快速發展的格局中,從基於矽基的大型語言模型(Large Language Models, LLMs)轉向具身物理智慧長期以來被視為「最後一道防線」。今天,由 OpenAI 和紅杉資本(Sequoia Capital)等重量級投資方支持的知名新創公司 Physical Intelligence,隨著該公司最新機器人基礎模型的發布:π0.7,邁出了巨大的一步。
這一突破超越了傳統的機器人編程。π0.7 不需要針對每個細微動作編寫特定任務代碼或準備詳盡的數據集,它作為一個通用型「機器人大腦」運作。它具備從訓練中進行泛化的卓越能力,使機器手臂能夠執行在學習階段從未明確教授過的物理任務。從折疊衣物到操作精密的實驗室設備,π0.7 代表了我們對機器靈活性構想的根本性轉變。
對於 機器人技術 研究人員而言,歷史上的難題一直是「模擬到現實」(sim-to-real)的差距——即在虛擬環境中訓練的模型,無法適應現實世界中不可預測的摩擦力、光照和物理特性。Physical Intelligence 通過整合大規模的跨具身(cross-embodiment)數據解決了這一問題。通過在多樣化的機器人平台上訓練模型,系統學到了物理學和空間意識的基礎原理,而非僅僅是機械軌跡的死記硬背。
在 Creati.ai,我們將此視為一個關鍵時刻。π0.7 的效率在於其架構設計,它將物理交互的處理方式與大語言模型處理句子中 Token 的方式相似對待。以下是 π0.7 與以往專業機器人控制系統的比較:
| 功能 | 傳統機器人系統 | Physical Intelligence π0.7 |
|---|---|---|
| 適應性 | 僅限於已編程的任務 | 泛化至未見過的動作 |
| 訓練需求 | 每個任務需明確指令 | 通過基礎模型進行少樣本學習(Few-shot learning) |
| 集成性 | 硬體專用軟體 | 通用跨平台兼容性 |
| 問題解決 | 對預設傳感器進行反應 | 針對物理操作進行代理推理 |
π0.7 模型的影響力遠不止於實驗室研究。作為一個 通用機器人 引擎,它可以接收視覺、觸覺和本體感覺等傳感器輸入,並將其轉化為流暢、目標導向的電機控制。
π0.7 部署中重點突出的關鍵進展包括:
對於整個產業而言,Physical Intelligence 的進展凸顯了一個更廣泛的趨勢:人工智慧模型 向物理領域的整合。投資者和研究人員在生成式文本和影像模型上投入了數十億美元,但智慧的經濟效益最終仍取決於我們與世界互動的能力。
Physical Intelligence 的首席工程團隊指出:「π0.7 的發布不僅僅是一次軟體更新,它是一場基礎設施的變革。」通過降低複雜物理自動化的進入門檻,這家新創公司本質上是在為下一代工業和消費級機器人提供作業系統。
儘管圍繞 π0.7 的熱情高漲,但通往普及型機器人輔助的道路仍然充滿技術和倫理障礙。邊緣延遲、板載推理的能耗以及人機協作的安全協議仍然是關注焦點。此外,隨著這些系統變得越發強大,對高質量、高保真的人機互動數據的需求將繼續呈指數級增長。
展望未來,我們預計 Physical Intelligence 和更廣泛的機器人社群將達成以下里程碑:
在我們持續監測 Physical Intelligence 的進展時,顯而易見的是,機器之「腦」終於趕上了其硬體的潛力。π0.7 不僅僅是一個軟體里程碑;它是一個概念驗證,證明我們正走向一個未來——在該未來中,「通用智慧」不僅由系統所知的內容定義,更由其在物理世界中所能做到的事情定義。
在 Creati.ai,我們致力於追蹤這些基礎性突破如何重組勞動力、製造業和個人助理服務。π0.7 的發布是一個強有力的提醒:人工智慧的未來不僅僅是數位化的,它更是深刻、根本且現實地存在於物理世界之中。