智元获得WorldArena世界模型总分冠军,成为近期具身智能领域备受关注的一项成果。
根据最新公布的WorldArena Track1赛道评测结果,智元自主研发的GE-Sim 2.0成功位居榜首。该赛道主要考察机器人对环境的理解能力以及执行动作的能力,因此被认为是评价机器人智能水平的重要标准之一。
值得关注的是,智元团队此次并未针对比赛内容进行特殊设计。参评所使用的GE-Sim 2.0保持原有架构,仅结合榜单数据进行了基础微调。在没有专项优化的情况下取得第一名成绩,也进一步证明了模型具备较强的泛化能力。
从技术报告披露的信息来看,GE-Sim 2.0相比上一代模型已经实现明显进步。其定位不仅是世界模型,更逐步发展成为具备完整能力体系的世界模拟器。机器人能够借助这一系统在虚拟环境中进行反复验证和学习,从而减少现实环境中的试错过程。
功能层面上,GE-Sim 2.0已经覆盖长时序生成、多视角生成、本体状态生成、近实时推理以及奖励判别等多个关键模块,构建起较完整的能力链路。
在长时序推演测试中,GE-Sim 2.0表现出较强稳定性。根据报告内容,连续推演40至50秒的视频时,生成质量依然保持在较高水平,衰减幅度低于行业基线模型,展现出持续推理能力方面的优势。
除了生成效果之外,团队还重点验证了模型与真实世界之间的关联性。大量闭环评测结果表明,GE-Sim 2.0在多个任务中的反馈与现实结果具有较强一致性。团队不仅分析总体数据,还进行了逐案例对比,并通过混淆矩阵提供量化证明。
此外,在奖励模型参与下,GE-Sim 2.0能够自动筛选高质量数据,并将这些数据反馈给策略模型,实现模型能力进一步提升。实验结果显示,这一机制已经在多项任务中带来了明显收益。
此次登顶WorldArena榜单,不仅展现了GE-Sim 2.0的综合实力,也反映出智元在世界模型技术方向上的持续积累和探索成果。




