2025_NIPS_RoboScape: Physics-informed Embodied World Model

在这里插入图片描述

一、主要内容

本文针对现有具身世界模型在机器人交互场景中物理一致性不足(如3D几何失真、运动不合理)的问题,提出了一种物理感知的具身世界模型RoboScape。该模型通过多任务联合训练框架,将RGB视频生成、时间深度预测和自适应关键点动态学习统一起来,在保证视觉保真度的同时提升了物理合理性。

核心工作包括:

  1. 数据处理管道:基于AGIBOT-World数据集,构建了含物理先验标注的多模态数据集,通过深度生成、关键点跟踪、视频切片、片段过滤和分类等步骤,确保训练数据的高质量和多样性。
  2. 模型架构设计:采用自回归Transformer框架,引入两个物理感知辅助任务:
    • 时间深度预测:通过双分支协同自回归Transformer,将深度特征融入RGB生成,增强3D几何一致性;
    • 自适应关键点动态学习:采样高动态区域关键点并维护其时间一致性,隐式编码物体材质属性和运动规律。
  3. 实验验证:从视频生成质量、机器人策略训练实用性、策略评估可靠性三个维度验证,结果表明RoboScape在PSNR、LPIPS等指标上优于IRASim、iVideoGPT等基线模型,生成的合成数据可有效提升Diffusion Policy、π0等策略模型的性能,且作为策略评估器时与真实模拟器结果
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值