智元推出WholeBodyVLA,面向真实世界的人形机器人全身视觉与语言交互框架
智元提出了面向真实世界的人形机器人全身VLA框架,名为WholeBodyVLA,该框架旨在为人形机器人提供全面的感知、决策和执行能力,使其更好地适应真实世界环境,通过整合全身的各种传感器和动作信息,WholeBodyVLA框架帮助机器人实现更加精准、灵活的运动控制,并增强机器人的智能交互能力,这一创新框架为人形机器人在实际应用中的性能提升和智能化发展奠定了基础。
智元 agibot 宣布,由香港大学、智元 agibot、复旦大学及上海创智学院组成的跨机构研究团队共同推出 wholebodyvla——一种专为真实场景下双足人形机器人设计的全身级 vision–language–action 统一框架。


https://www.php.cn/link/dd2dde535d322743ac08d65bf6df132d
https://www.php.cn/link/f2dc8351dbd57c759aebf55e53876289
据悉,该成果依托智元灵犀X2平台开展研究,首次将视觉-语言-动作(VLA)范式系统性拓展至人形机器人全身运动控制层面,并在多模态 loco-manipulation(移动操作)任务中完成实际验证。


WholeBodyVLA 为实现双足人形机器人全身体感驱动与自主协同控制提供了切实可行的技术路径。其通过从人类行为视频中进行模仿学习,并融合面向移动操作优化的强化学习控制器,使机器人可在开放物理环境中稳健执行兼具行走与交互操作的长周期复合任务,为人形机器人在智能制造、智能服务、仓储物流等高复杂度现实场景中的落地应用奠定关键基础。
源码地址:点击下载
<< 上一篇
网友留言(0 条)