智元推出WholeBodyVLA，面向真实世界的人形机器人全身视觉与语言交互框架

2026-01-09/ 9 次浏览/ 资讯

智元提出了面向真实世界的人形机器人全身VLA框架，名为WholeBodyVLA，该框架旨在为人形机器人提供全面的感知、决策和执行能力，使其更好地适应真实世界环境，通过整合全身的各种传感器和动作信息，WholeBodyVLA框架帮助机器人实现更加精准、灵活的运动控制，并增强机器人的智能交互能力，这一创新框架为人形机器人在实际应用中的性能提升和智能化发展奠定了基础。

智元 agibot 宣布，由香港大学、智元 agibot、复旦大学及上海创智学院组成的跨机构研究团队共同推出 wholebodyvla——一种专为真实场景下双足人形机器人设计的全身级 vision–language–action 统一框架。

智元提出 WholeBodyVLA，面向真实世界的人形机器人全身 VLA 框架

https://www.php.cn/link/dd2dde535d322743ac08d65bf6df132d
https://www.php.cn/link/f2dc8351dbd57c759aebf55e53876289

据悉，该成果依托智元灵犀X2平台开展研究，首次将视觉-语言-动作（VLA）范式系统性拓展至人形机器人全身运动控制层面，并在多模态 loco-manipulation（移动操作）任务中完成实际验证。

智元提出 WholeBodyVLA，面向真实世界的人形机器人全身 VLA 框架

WholeBodyVLA 为实现双足人形机器人全身体感驱动与自主协同控制提供了切实可行的技术路径。其通过从人类行为视频中进行模仿学习，并融合面向移动操作优化的强化学习控制器，使机器人可在开放物理环境中稳健执行兼具行走与交互操作的长周期复合任务，为人形机器人在智能制造、智能服务、仓储物流等高复杂度现实场景中的落地应用奠定关键基础。

源码地址：点击下载

关键词：git github 上海

<< 上一篇

使命召唤，黑色行动7年终折扣与免费试玩，最佳入手时机！

下一篇 >>

田曦薇同款长焦Live神器 vivo S50 Pro mini，独特拍照体验，展现别样美返回搜狐网首页查看更多内容。

智元推出WholeBodyVLA，面向真实世界的人形机器人全身视觉与语言交互框架

网友留言（0 条）

发表评论

智元推出WholeBodyVLA，面向真实世界的人形机器人全身视觉与语言交互框架

相关文章

网友留言（0 条）

发表评论