2025年12月18日,大曉機器人正式發布行業首創的ACE具身研發范式、首個開源且商業應用的開悟世界模型3.0(Kairos 3.0)、讓具身本體擁有自主空間智能的具身超級大腦模組A1。

01 具身智能:從“以機器為中心”轉向“以人為中心”的研發
商湯科技聯合創始人、執行董事、大曉機器人董事長王曉剛表示,“以人為中心(Human-centric)”的ACE范式根本性地革新了具身智能研發路徑,并且開悟世界模型3.0為機器人裝上“超級大腦”。
“以機器為中心”的研發范式,其根本局限在于將機器人本體及其硬件參數置于研發流程的核心,本質上是用極高的資源消耗,換取有限且僵化的“智能”。
ACE研發范式顛覆傳統邏輯,將人類與物理世界的互動規律作為核心研究起點,以環境式數據采集為引擎,構建了一套從“環境式數據采集—開悟世界模型3.0—具身交互”的全鏈路技術體系。環境式數據采集可實現一年千萬小時的數據收集,開悟世界模型3.0則不斷放大真實數據價值,使其達到上億小時數據規模的效果。
王曉剛說:“世界模型的數據采集分為幾個層次,不是一上來就采用人的行為數據,而是在底層注入了很多物理規律。模型里有思維鏈。當讓機器人擺放字母時,如果沒有理解物理規律,它們是擺放不了的,這也是以往VLA(視覺語言對齊)訓練方法的短板。”
ACE范式核心技術之一是環境式數據采集技術,通過跨視角多模態設備,融合視覺、觸覺、語音、力學規律等多維度數據,以物理級建模與全場景覆蓋的創新設計,為具身智能模型訓練提供“人—物—場”全要素精準數據支撐。
環境式數據采集技術以人為中心構建全要素采集體系,整合第一視角與第三視角視頻、力觸覺信息、運動軌跡、語音等多模態數據,構建基于物理基礎的3D資產庫,全面覆蓋具身模型訓練所需的各類交互信息,實現了多視角協同、長程任務覆蓋與全維度信息捕捉的跨越式升級。

王曉剛表示:“相較于遙操數據采集或仿真數據,環境式數據采集的成本顯著降低。”在硬件成本方面,遙操模式需購置幾十萬臺機器人設備,而環境式采集采用AI眼鏡等現有傳感器,無須額外投入高價機器人;且隨著規模化應用推進,傳感器成本會進一步下降,原因在于當前機器人尚未形成規模化,成本難以降低。在人力成本方面,遙操采集需專門雇傭人員在實驗室操作,環境式采集則可在正常工作、生活場景中開展,工作人員佩戴設備即可一邊完成本職工作一邊采集數據,無須額外投入人力,效率實現數倍提升。
這種低成本模式具備極強的可復制性,例如在閃購倉場景中,工作人員正常工作即可同步采集數據,這也是數據規模能從10萬小時快速提升兩個數量級至1000萬小時的關鍵原因,類比特斯拉通過量產車輛,讓司機邊開車邊反饋數據,無須專門組建采集車隊,就能實現大規模數據積累。
環境式采集的數據質量核心優勢在于“真實性與場景完整性”——數據源于真實工作生活場景,能完整還原實際操作中的各類細節與變量,避免了仿真數據的理想化偏差和遙操數據的場景局限性。盡管未給出具體百分比提升,但從應用價值來看,真實場景數據更能反映實際需求,為模型訓練提供更精準、更可靠的支撐,其質量優勢遠非人工設計的仿真數據或局限于實驗室的遙操數據可比。
02 開悟世界模型3.0的開源策略
作為首個“多模態理解—生成—預測”的世界模型,開悟世界模型3.0通過視覺、3D軌跡、觸覺、摩擦力等多維度信息輸入,深度理解真實世界的物理規律與人類行為的底層邏輯,讓模型能形成“知其然,知其所以然”的思維鏈。

基于多模態信息的深度融合,模型可生成長時動態交互場景視頻,在場景內實現各元素精準可控;并具備跨本體一鍵生成、多本體泛化、預測萬千演化路徑等特性,為具身智能提供高保真、可泛化的虛擬訓練環境。

基于上述優勢,大曉機器人打造了開悟具身智能世界模型產品平臺,并于12月18日正式發布。開悟具身智能世界模型產品平臺集成“文生世界、像驅世界、跡塑世界”等多模態生成能力,內置支持11大類、54細類,累計328個標簽,覆蓋115個垂類具身場景,開發者只需輸入簡單指令,就能快速生成可視化的任務模擬內容,并可一鍵分享,大幅降低具身智能的開發門檻。
王曉剛介紹,世界模型3.0實行“云服務產品+開源生態”雙軌模式。在云服務平臺上,用戶可通過網頁訪問,創作、分享視頻、機械臂參數等各類機器人相關數據,形成“創作—共享”的生態閉環。平臺通過提供算力、存儲等服務實現商業化變現,憑借成熟的產品化設計,吸引有數據創作、共享需求的用戶付費使用。
開源則是通過生態共建反哺商業化。通過降低適配門檻,方便開發者進行軟硬件適配,助力技術快速普及,同時收集更多用戶反饋,推動模型快速迭代。當前國產化芯片成為主流趨勢,開源模型能吸引芯片廠商適配,模型影響力越大,對芯片公司的價值越高,進而形成“模型—芯片”的協同生態,提升自身行業話語權;開源還能吸引更多用戶參與數據創作,用戶上傳的初始照片、任務指令等數據,為世界模型提供豐富的場景素材,解決數據“無中生有”的問題,進一步強化模型核心競爭力。
這種模式既通過云服務實現短期商業化收益,又借助開源構建長期生態壁壘,實現了商業價值與技術影響力的雙贏。
開源的重要性對芯片公司同樣重要。王曉剛提到,大曉機器人跟不同芯片公司合作時,因為各公司的頂層架構軟件都不一樣,形成了很大壁壘。“如果大家能夠基于開源的影響力,一起開發、聯合優化,效率會大大提升,壁壘會降低很多。”
03 機器人產業發展尚在早期,有期待但要依規律而行
王曉剛坦言,目前機器人的開發處于行業發展初期,雖然產品形態相對明確,但市場規模仍較為有限,有在企業展廳做展示的,也有做研發的平臺,在起步階段,主要是起到普及作用,讓公眾了解機器人什么能做、什么不能做。“這與人工智能發展早期是一樣的。新技術推出的第一步是做POC,先拿著玩一玩,再量產,一旦價值被驗證后就可以實現規模化。目前還處于用戶體驗與價值驗證的初期環節。”
在對行業現有機器人的拆解中,大曉機器人團隊發現,硬件本身存在很多缺陷。比如傳感器的視野范圍狹窄,機器狗加載現有的傳感器,能夠看到的范圍非常窄,過馬路時不知道選擇哪一條,也看不到紅綠燈。機器狗也有跟隨的功能,視野范圍現在都是120°,如果超出這個范圍,機器狗就無法跟隨。大曉機器人做的是360°的UWB信號,主人往任何地方走,它都能跟上,所以硬件首先要滿足場景功能上的需求,擁有空間自主能力。
從大眾的期待來看,人們一直在期待通用型的機器人。王曉剛說:“這是漸進的過程,一個機器人能把不同領域的事情做好目前不太可能,但是在一個領域里盡可能地通用化就很了不起,能夠產生巨大的價值。”機器人可以在底層共享知識,比如對世界的理解、思維鏈等,世界模型的能力可以讓每個垂直領域的機器人都受益。工業機器人基于物理模型以及多年的規則積累和特定任務,可靠性高,但是通用性差一些,在一些柔性產線,需要機器人具備一定通用化的能力,這就是今天機器人發展的機會所在。
目前,大曉機器人的方案還會持續迭代,不斷降低成本。王曉剛說,目前還要尋找更便宜的國產化芯片,降低功耗,“軟硬一體的設計要跟場景緊密結合。”
04 四大關鍵要素決定機器人產業大規模應用時間
貝恩公司在《全球人形機器人產業趨勢洞察》中,將人形機器人功能的核心模塊分為以下幾部分:跟大腦決策相關的智能模塊,跟人類五官相關的感知模塊,跟物理世界外部環境交互、期望能夠實現高精度模擬人類動作的操控模塊以及電池動力模塊。
貝恩公司董事經理趙天辰認為:“從技術角度,以達到人類平均水平為目標,人形機器人在智能和感知模塊還需要大概3年的時間。操控和電池模塊,需要5—10年的時間。”
在智能模塊中,利用通用人工智能大模型的機器人,基礎推理能力已經超過人類水平,但實際場景結合任務要求和外部場景感知,實現低錯誤率和自主決策還是低于人類水平。在感知模塊,動態識別延遲以及跟人類物理場景互動及時性,距離人類還有差距。在操控模塊,人形機器人在關節自由度和靈活度已經接近和超過人類水平,但在實際運動過程中,運動穩定性、任務執行過程中低錯誤率遠遠低于人類水平。在電池動力模塊,主流的全球頭部人形機器人單塊電池使用時間,還遠遠沒有達到期望的8小時甚至更高水平,未來在能量密度提升或換電技術上有望進一步突破。
人形機器人下一步大規模部署會發生在什么時間,什么行業?貝恩公司大中華區高科技業務主席成鑫說,取決于四個關鍵方面。
第一,投資產出。現在機器人成本較高,全球領先的型號制作成本至少在5萬美元以上,還沒有算日常維護、運營的成本,這個成本顯然是沒有競爭力的,不管放在什么環境之下。所以首先看整體研發制造的成本在何時能達到合理水平。
第二,技術成熟度。在智能、感知、操作、動力等方面,還要突破一些技術。成鑫認為,目前沒有無法逾越的技術障礙,更多是時間問題。“解決這些問題都有成本,比如操控部分,靈巧手的自由度方向有25—30個,但現在機器人能做到5個7個就不錯了,說明它能做的范圍還是比較有限,以此類推在智能感知領域、動力領域都有很多問題。”
第三,需求迫切性。有些行業并不一定非得要用機器人,主要還是在勞動力比較短缺、任務比較危險的領域。這樣的行業到底有多少是一個比較大的問題。現在很多行業業務模式也在變,未來5—10年是否像現在一樣還未可知。
第四,風險承受力。成鑫說:“企業能否接受機器人,還存在安全、隱私和數據問題,以及人類的自然心理問題。在護理、養老場景,如果護工變成機器人,大家心理上能夠接受嗎?”
上述要件都決定了機器人能不能,以及在什么時候、哪些領域進行普及。成鑫建議,看機器人產業發展時,可以圍繞上述四個方面去觀察。
來源:商學院






資訊頻道