| 創(chuàng)澤機器人 |
| CHUANGZE ROBOT |
當大模型還在數(shù)字世界"紙上談兵",具身智能已悄然打響一場關(guān)于"物理數(shù)據(jù)"的靜默戰(zhàn)爭。這不是算法的較量,而是關(guān)乎百萬小時真實交互數(shù)據(jù)的軍備競賽——誰掌握了高質(zhì)量、多模態(tài)的物理世界數(shù)據(jù),誰就握住了通往通用人工智能(AGI)的鑰匙。
2026年4月,上海浦東的智元機器人數(shù)據(jù)采集工廠里,上百臺人形機器人正在"冰球場"式的布局中同步訓(xùn)練。數(shù)據(jù)采集員操控機械臂完成抓取飲品杯、裝袋、打包吸管的動作,每天重復(fù)約200次,只為采集一條有效軌跡數(shù)據(jù)。這一幕,正是具身智能產(chǎn)業(yè)"數(shù)據(jù)饑渴"的縮影。
一、數(shù)據(jù)荒漠:具身智能的阿喀琉斯之踵
具身智能正站在歷史性拐點。2025年,ZG次將"具身智能"寫入政府工作報告;2026年4月,智元合作伙伴大會吸引30多個和地區(qū)的2500余名嘉賓參會,空中客車高J副總裁格雷格·翁巴赫驚嘆:"ZG有超過150家企業(yè)在研發(fā)具身智能機器人"。
然而,繁榮表象下暗藏致命瓶頸。行業(yè)共識認為,實現(xiàn)具身智能的"涌現(xiàn)"能力至少需要百萬小時來自真實世界的物理交互數(shù)據(jù),目前積累的數(shù)量尚不足5%(白皮書數(shù)據(jù))。這種數(shù)據(jù)稀缺性,與當年大語言模型(LLM)訓(xùn)練時互聯(lián)網(wǎng)文本數(shù)據(jù)的豐沛形成鮮明對比。
更嚴峻的是數(shù)據(jù)獲取的"不可能三角":精度、規(guī)模、成本三者難以兼得。真機遙操作數(shù)據(jù)精度Z高,但成本呈指數(shù)J上升——據(jù)科創(chuàng)板日報報道,光是"倒牛奶"這一個動作就可能需要采集近百條訓(xùn)練數(shù)據(jù),而真實場景采集時,一小時僅能采集20條有效軌跡數(shù)據(jù),且存在30%的行為偏差。相比之下,互聯(lián)網(wǎng)視頻數(shù)據(jù)規(guī)模龐大卻缺乏物理真實性,合成數(shù)據(jù)成本低卻面臨"仿真到現(xiàn)實"(Sim2Real)的遷移鴻溝。
帕西尼感知科技創(chuàng)始人許晉誠指出:"當前具身智能所能使用的數(shù)據(jù)量僅為大語言模型的幾百分之一"。這種數(shù)量J的差距,構(gòu)成了具身智能發(fā)展的"數(shù)據(jù)鴻溝"。
二、三條數(shù)據(jù)路線的"金字塔"博弈
遙操作數(shù)據(jù)當前占據(jù)金字塔D端。2024年9月,智元機器人在上海張江啟用行業(yè)個數(shù)據(jù)采集工廠,占地4000平方米,分割為家居、餐飲、工業(yè)等不同主題場景,每日超100臺機器人同步訓(xùn)練,單機單日可產(chǎn)生上萬條高質(zhì)量軌跡數(shù)據(jù)。2025年,智元開源了百萬真機數(shù)據(jù)集AgiBot World,覆蓋80余種日常生活技能,長程數(shù)據(jù)規(guī)模較Google的Open X-Embodiment高出10倍,場景覆蓋面擴大100倍。
但真機遙操作的瓶頸同樣明顯。韓國企業(yè)Robotis為挑戰(zhàn)智元,選擇在烏茲別克斯坦建設(shè)11萬平方米的數(shù)據(jù)工廠,利用當?shù)爻杀緝?yōu)勢降低采集成本。這揭示了一個殘酷現(xiàn)實:純遙操作路徑在經(jīng)濟和工程上均不可持續(xù)。
動作捕捉數(shù)據(jù)正在崛起為"中間路線"。2024年斯坦福大學(xué)李飛飛團隊發(fā)布的DexCap系統(tǒng),通過可穿戴的相機背心和手套上的SLAM相機,以低成本、抗遮擋方式采集高質(zhì)量3D手部運動數(shù)據(jù)。國內(nèi)諾亦騰推出的PN Studio系統(tǒng),使用航天J傳感器標定方式,能在1000平方米范圍內(nèi)實現(xiàn)Z多5人全身和手指的動作捕捉。2025年,諾亦騰在深圳龍華區(qū)揭牌運營機器人跨本體數(shù)據(jù)工廠,推進"無本體數(shù)據(jù)采集"的規(guī);獙鞲衅髦苯哟┐髟诓僮髡呱砩,實現(xiàn)數(shù)據(jù)采集與機器人本體解耦。
更具顛覆性的是無本體數(shù)據(jù)采集。2024年斯坦福大學(xué)提出的UMI(Universal Manipulation Interface)框架,確立了"手持夾爪+GoPro手腕攝像頭"的核心范式,讓人類手部成為"通用的數(shù)據(jù)接口"。國內(nèi)初創(chuàng)公司鹿明機器人推出的FastUMI Pro,將單條數(shù)據(jù)采集時間從50秒縮短至10秒,綜合成本降至傳統(tǒng)方法的五分之一。
合成數(shù)據(jù)則是規(guī)模化預(yù)訓(xùn)練的"終極答案"。NVIDIA推出的MimicGen方案,僅需5次人類演示即可生成1000個雙手靈巧任務(wù)演示;銀河通用基于十億量J仿真數(shù)據(jù),發(fā)布了個全仿真預(yù)訓(xùn)練具身大模型GraspVLA。然而,合成數(shù)據(jù)面臨物理保真度難題——軟體形變、復(fù)雜摩擦、細顆粒物學(xué)等現(xiàn)象,傳統(tǒng)剛體物理引擎難以準確模擬(白皮書第4章)。
三、Scaling Law初現(xiàn):數(shù)據(jù)規(guī)模正在重塑競爭格局
2026年初,具身智能領(lǐng)域迎來"Scaling Law"的初步驗證。
Generalist AI發(fā)布的GEN-1模型,將數(shù)據(jù)規(guī)模推向50萬小時真實世界操作數(shù)據(jù),模型性能和任務(wù)成功率從64%大幅提升至99%。這一躍遷印證了:與LLM類似,具身智能模型能力同樣隨數(shù)據(jù)規(guī)模增長而涌現(xiàn)。
更具標志性的是觸覺數(shù)據(jù)的突破。戴盟科技發(fā)布的Daimon-Infinity數(shù)據(jù)集,包含觸覺、視覺、動作軌跡及語音文本等多模態(tài)信息,其中1萬小時數(shù)據(jù)已面向行業(yè)開源。實測表明,觸覺數(shù)據(jù)的引入能顯著降低模型訓(xùn)練對數(shù)據(jù)規(guī)模的依賴——相比視覺信息,觸覺能直接感知接觸關(guān)系與物體特性,避免多視角采集帶來的冗余與遮擋。
北京石景山區(qū)投用的全國Z大人形機器人訓(xùn)練基地,更讓機器人掌握"頭發(fā)絲J"的觸覺感知——0.01牛的力度識別精度,相當于一根頭發(fā)絲輕輕落在手指上的壓力。
然而,數(shù)據(jù)規(guī)模的擴張并非簡單的"堆量"。智元機器人提出的ADC(對抗數(shù)據(jù)采集)模式,通過增加數(shù)據(jù)的信息密度和多樣性,以20%的數(shù)據(jù)量達到傳統(tǒng)方案2.7倍的效果。配合"HIL-SERL"強化學(xué)習(xí)系統(tǒng),機器人能在真實世界中1-2.5小時內(nèi)學(xué)會多種高精度、靈巧操作任務(wù),成功率接近100%。
四、自動駕駛的鏡鑒:從"高精地圖"到"數(shù)據(jù)飛輪"
具身智能的數(shù)據(jù)困境,與自動駕駛的發(fā)展歷程驚人相似。
自動駕駛早期依賴高精地圖——將"實時理解環(huán)境"簡化為"在已知地圖定位",雖加速技術(shù)落地,卻帶來路徑依賴:制作成本高、鮮度維護難、泛化能力受限(白皮書第3章)。Z終,行業(yè)轉(zhuǎn)向"影子模式"——利用量產(chǎn)車在日常行駛中實時回傳數(shù)據(jù),經(jīng)云端融合處理,實現(xiàn)動態(tài)更新。
這一轉(zhuǎn)變對具身智能的啟示深刻:真正的智能體現(xiàn)在對未知環(huán)境的適應(yīng),而非對預(yù)采數(shù)據(jù)的記憶。然而,具身智能面臨更嚴峻的"冷啟動"困境——自動駕駛可與汽車銷售同步啟動數(shù)據(jù)采集,而機器人尚未大規(guī)模進入真實場景,數(shù)據(jù)飛輪在啟動前是斷裂的。
破解之道在于"仿真優(yōu)先,真機驗證"的混合范式。自動駕駛的工程化實踐表明,云端并行仿真可在數(shù)小時內(nèi)完成相當于數(shù)百萬公里路測的場景覆蓋,實現(xiàn)算法版本的快速迭代。NVIDIA Cosmos平臺提供預(yù)訓(xùn)練的生成式世界基礎(chǔ)模型,開發(fā)者可直接生成合成數(shù)據(jù)或微調(diào)使用,加速物理AI系統(tǒng)開發(fā)。
國內(nèi)流形空間(Manifold AI)d創(chuàng)的WMA(World Model Action)路線,以世界模型作為機器人的基礎(chǔ)模型,自研通用空間世界模型WorldScape,具備"推理想象-行動"三位一體能力,已在無人機領(lǐng)域?qū)崿F(xiàn)落地突破。
五、商業(yè)化前夜:數(shù)據(jù)驅(qū)動的漸進式演進
具身智能的"GPT-3.5時刻"尚未到來,但商業(yè)化路徑已日漸清晰。
D一階段:少量數(shù)據(jù)構(gòu)建原型能力。當前多數(shù)企業(yè)處于此階段,利用數(shù)十至數(shù)百條高質(zhì)量演示數(shù)據(jù),訓(xùn)練機器人掌握特定結(jié)構(gòu)化任務(wù)。然而,a16z的深度洞察指出:實驗室里95%成功率的策略,一旦進入真實倉庫,光照、背景、視角、物體材質(zhì)發(fā)生變化,成功率可能迅速跌至60%(白皮書第5章)。
第二階段:聚焦場景,大量數(shù)據(jù)驅(qū)動迭代。國內(nèi)已建成或計劃在建的具身智能訓(xùn)練場達20余家,其中10家公開披露的訓(xùn)練場總面積超過4萬平方米。上海張江"麒麟"訓(xùn)練場、北京石景山觸覺感知數(shù)訓(xùn)中心、天津帕西尼超J數(shù)據(jù)工廠(年產(chǎn)近2億條數(shù)據(jù)),正形成覆蓋制造業(yè)、物流、家居等垂直場景的數(shù)據(jù)基礎(chǔ)設(shè)施。
第三階段:海量數(shù)據(jù)實現(xiàn)高階功能閉環(huán)。未來"云-邊-端"協(xié)同架構(gòu)下,云端將利用大規(guī)模算力進行持續(xù)技能訓(xùn)練,邊緣側(cè)承擔(dān)實時協(xié)同與隱私計算,機器人本體成為標準化通用移動計算平臺。商業(yè)模式也將從一次性硬件銷售,轉(zhuǎn)向"智能即服務(wù)"的訂閱模式——用戶像在應(yīng)用商店購買軟件一樣,按需訂閱機器人技能(白皮書第5章)。
六、投資啟示:在數(shù)據(jù)洪流中錨定價值
從數(shù)據(jù)視角審視,具身智能產(chǎn)業(yè)呈現(xiàn)五大投資機會:
1. 感知技術(shù)創(chuàng)新:觸覺傳感器、靈巧手等多模態(tài)感知設(shè)備,正從"被動采集"走向"感算一體"。帕西尼DexH13靈巧手集成近2000顆自研高精度觸覺傳感器,實現(xiàn)15種多維觸覺感知。
2. 數(shù)據(jù)采集與治理:覆蓋采集、清洗、標注、存儲的全生命周期管理體系,是推動行業(yè)標準化的底層基建。簡智機器人實現(xiàn)"采集完成后2小時內(nèi)新鮮數(shù)據(jù)送達模型"的目標,需要系統(tǒng)性工程能力支撐。
3. 垂直場景解決方案:工業(yè)精密裝配、倉儲柔性物流等領(lǐng)域,已展現(xiàn)清晰商業(yè)化前景。德馬科技與智元合作搭建的物流數(shù)據(jù)采集工廠,正構(gòu)建可持續(xù)迭代的"數(shù)據(jù)-模型-場景"技術(shù)閉環(huán)。
4. 真機失敗數(shù)據(jù)的價值:被忽視的負面樣本對模型能力提升至關(guān)重要。智元ADC模式證明,對抗性數(shù)據(jù)能以更少樣本實現(xiàn)更強效果。
5. 世界模型的長期潛力:螞蟻靈波發(fā)布的LingBot-VA模型,創(chuàng)"邊推演、邊行動"框架,在LIBERO基準測試中任務(wù)成功率達98.5%。盡管仍需耐心,世界模型被視為通往具身"GPT-3.5時刻"的潛在路徑。
七、數(shù)據(jù)即權(quán)力,物理即未來
站在2026年的門檻回望,具身智能正在重演大語言模型的"數(shù)據(jù)故事"——從稀缺到豐沛,從昂貴到普惠,從封閉到開源。但這一次,戰(zhàn)場從數(shù)字比特轉(zhuǎn)向物理原子,數(shù)據(jù)從文本 token 變?yōu)槎嗄B(tài)的"狀態(tài)-動作-反饋"軌跡。
這不是一場短跑,而是一場以五年、十年為尺度的馬拉松。正如國際先進技術(shù)應(yīng)用推進中心(深圳)發(fā)布的白皮書所言:"發(fā)展具身智能是多領(lǐng)域融合的系統(tǒng)性工程,數(shù)據(jù)是跨領(lǐng)域的真實樞紐,貫穿全部鏈條"。
當智元的數(shù)據(jù)采集工廠每天產(chǎn)出上萬條數(shù)據(jù),當帕西尼的天津超J工廠年產(chǎn)近2億條多模態(tài)數(shù)據(jù),當Generalist AI驗證50萬小時數(shù)據(jù)的Scaling Law——我們看到的不僅是技術(shù)的進步,更是一個關(guān)于"如何教會機器理解物理世界"的宏大敘事正在展開。
數(shù)據(jù)即權(quán)力,物理即未來。在這場靜默的數(shù)據(jù)戰(zhàn)爭中,Z終的贏家不屬于技術(shù)Z先進者,而屬于那些能深刻理解產(chǎn)業(yè)節(jié)奏、準確定位數(shù)據(jù)生態(tài)位,并構(gòu)建起持續(xù)迭代能力的企業(yè)。

![]() |
| 機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 展廳機器人 服務(wù)機器人底盤 具身智能教育機器人 智能配送機器人 導(dǎo)覽機器人 |