<b id="nqvhe"><source id="nqvhe"><menu id="nqvhe"></menu></source></b>

    1. <source id="nqvhe"></source><xmp id="nqvhe"></xmp>
      1. <b id="nqvhe"></b>
        <u id="nqvhe"></u>
      2. <b id="nqvhe"><address id="nqvhe"><ol id="nqvhe"></ol></address></b>
      3. <source id="nqvhe"></source>
        <xmp id="nqvhe"><video id="nqvhe"></video></xmp>
          <b id="nqvhe"></b>
          <u id="nqvhe"></u>
        1. ABB25年12月
          關注中國自動化產業發展的先行者!
          2026中國自動化產業年會
          2025工業安全大會
          OICT公益講堂
          當前位置:首頁 >> 資訊 >> 行業資訊

          資訊頻道

          Ctrl-World:清華與斯坦福聯合研發的世界模型在具身智能評測中登頂全球
          • 點擊數:477     發布時間:2026-03-09 22:55:03
          • 分享到:
          清華大學與斯坦福大學聯合研發的世界模型 Ctrl-World,在具身智能權威評測基準WorldArena中綜合表現卓越,斬獲具身任務能力全球第一,視頻生成質量全球第二。該模型通過創新的動作條件化架構和物理引擎約束嵌入等技術,實現了對物理規律的高精度模擬,其策略評估結果與真實環境近乎一致,能有效降低機器人策略研發成本,標志著具身世界模型的發展重點已從視覺保真度轉向高實用性。該成果由清華大學孵化的具身智能公司星動紀元參與研發,該公司也憑借全棧自研技術成為全球人形機器人賽道的超級獨角獸之一。
          關鍵詞:

          圖片

          文章 | 第 6782 期  約 2065 字  閱讀約 20 分鐘


          Image

          在全球具身智能領域,世界模型的發展正從“生成好看”邁向“真能干活”的關鍵階段。近期,在權威評測基準WorldArena榜單中,由清華大學陳建宇團隊與斯坦福大學Chelsea Finn團隊聯合研發的Ctrl-World世界模型交出了一份驚艷答卷:在具身任務能力上斬獲全球第一,并在視頻生成質量上排名全球第二,綜合表現超越了谷歌、英偉達等國際頂尖模型。這一成就不僅標志著中國團隊在具身智能前沿領域的突破,更揭示了世界模型向高實用性演進的新方向。

          ImageImage

          WorldArena:具身世界模型的“終極試煉場”

          WorldArena之所以成為行業公認的權威榜單,源于其“全面、硬核、具引領性”的定位。該基準由清華大學牽頭,聯合普林斯頓大學、新加坡國立大學、北京大學、香港大學、中科院、上海交通大學、中國科學技術大學等8所全球頂尖學術機構共同研發,聚焦具身世界模型的核心需求,設計了涵蓋16大核心指標與3大真實應用任務的全方位評測體系。評測維度包括視覺質量、運動質量、內容一致性、物理貼合度、3D準確性、可控性等,并直接模擬數據引擎、策略評估、動作規劃等真實機器人應用場景,確保模型不僅“看起來真實”,更“真正可用”。此次評測吸引了谷歌、英偉達、阿里、字節、智譜、智元、斯坦福大學等全球14款頂級模型同臺競技,結果堪稱行業技術發展的“風向標”。

          ImageImage

          Ctrl-World全面領跑:四大核心維度登頂,具身任務能力全球第一

          在WorldArena的評測中,Ctrl-World在EWMScore綜合指標上表現卓越,具體體現為兩大維度的高分:

          具身任務能力全球第一在主體一致性、軌跡精度、深度準確性、策略評估一致性四大核心維度上均位列榜首。其中,主體一致性得分0.8411(全球第一),確保了生成視頻中物體的身份、外觀與時序穩定,為機器人作業提供了高保真的“數字孿生”對象;軌跡精度得分0.4766(全球第一),意味著生成的機械臂運動軌跡與真實物理軌跡高度吻合;深度準確性得分0.9300(全球第一梯隊),展現了對三維空間結構的精準把握;策略評估一致性Pearson相關系數高達0.986,近乎完美復刻真實物理模擬器的評估結果,使虛擬測試可直接替代昂貴真實環境。

          視頻生成質量全球第二在視頻生成綜合評分中,Ctrl-World以59.70分排名第二,僅次于阿里Wan 2.6(61.86分),但超越了谷歌Veo 3.1(58.87分)和英偉達Cosmos-Predict 2.5等模型。這體現了其在生成高質量視頻的同時,保持了卓越的物理合理性與實用價值。

          ImageImageImage

          技術解碼:Ctrl-World的“制勝密碼”

          Ctrl-World的領先并非偶然,其背后是一系列創新技術設計:

          1.動作條件化(Action-Conditioned)架構與許多文本條件化模型不同,Ctrl-World采用顯式動作建模,直接將機器人動作參數(如關節角度、末端執行器位姿)作為生成條件。這強制模型學習“執行動作→產生狀態”的因果物理鏈,避免了常見物體穿透、隔空吸附等物理錯誤,從而在交互質量、軌跡精度等指標上實現突破。

          2.物理引擎約束嵌入在訓練過程中,Ctrl-World嵌入了物理引擎監督,將牛頓力學定律內化為生成硬約束。這使得生成內容嚴格遵守質量、摩擦、碰撞等物理守恒律,因此其策略評估相關性高達0.986,遠高于英偉達Cosmos-Predict 2.5的0.483,確保了虛擬環境與真實動態的高度一致。

          3.多視圖聯合與視頻預測模型為提升空間認知能力,Ctrl-World融合多視圖聯合預測,隱式建模深度圖與點云結構。這不僅助力其在深度準確性上達到0.9300的頂級水平,也使其在“堆疊積木”等需要精確三維感知的任務中表現優異。

          ImageImageImage

          從高分到實用:Ctrl-World如何推動具身智能落地

          Ctrl-World的評測優勢直接轉化為實際應用價值。在策略評估任務中,其0.986的相關性意味著開發者可用它高效測試機器人策略,大幅降低研發成本;在動作規劃中,高軌跡精度與深度準確性確保了機械臂能精準完成“調整瓶子”、“點擊鈴鐺”等操作,避免抓空或碰撞;在數據引擎任務中,其生成數據的物理合理性使合成視頻能有效訓練真實機器人策略,解決了“虛擬數據訓練,真實世界失效”的行業痛點。

          Image

          Ctrl-World在WorldArena的登頂,標志著具身世界模型的發展重點已從視覺保真度轉向功能實用性。通過以物理規律為根、空間認知為骨,Ctrl-World證明了在機器人仿真、策略訓練等場景中的巨大潛力。隨著WorldArena等評測體系持續推動行業創新,具身智能有望加速邁向高可靠性、低成本落地的未來。

          Image

          星動紀元是一家成立于2023年8月、由清華大學交叉信息研究院孵化的具身智能與人形機器人公司,也是清華大學唯一直接持股的人形機器人企業。公司定位為“原生通用具身智能體定義者”,堅持“具身大腦+人形本體”軟硬一體化全棧自研。

          公司核心產品包括星動L7全尺寸工業人形機器人、星動Q5服務機器人以及星動XHAND 1五指靈巧手。其自研的ERA-42端到端VLA具身大模型,是全球僅有的四款可實現全尺寸雙足人形機器人全身及五指靈巧手精準控制的系統之一,與特斯拉Grok、英偉達GR00T等并列。

          成立僅兩年多,星動紀元已完成近10億元A+輪融資,累計融資超18億元,估值近90億元,成為全球人形機器人賽道最年輕的超級獨角獸之一。其商業化進展迅速,2025年訂單總額突破5億元,海外業務占比達50%,產品已進入北美、歐洲等核心市場,全球市值TOP10的科技公司中有9家是其客戶。


          來源:深觀啟元





          關于我們





          圖片

          中國國際科技交流中心

          地址:北京市海淀區學院南路86號


          熱點新聞

          推薦產品

          x
          • 在線反饋
          1.我有以下需求:



          2.詳細的需求:
          姓名:
          單位:
          電話:
          郵件:

            <b id="nqvhe"><source id="nqvhe"><menu id="nqvhe"></menu></source></b>

            1. <source id="nqvhe"></source><xmp id="nqvhe"></xmp>
              1. <b id="nqvhe"></b>
                <u id="nqvhe"></u>
              2. <b id="nqvhe"><address id="nqvhe"><ol id="nqvhe"></ol></address></b>
              3. <source id="nqvhe"></source>
                <xmp id="nqvhe"><video id="nqvhe"></video></xmp>
                  <b id="nqvhe"></b>
                  <u id="nqvhe"></u>
                1. 国产精品高清视亚洲精品