北京FreqPolicy人形具身智能策略框架
北京人形提出了具身智能策略框架FreqPolicy,旨在推动人形机器人的智能化发展,该框架强调机器人与环境的交互和感知能力,以实现更加智能的行为表现,FreqPolicy框架包括感知、认知、决策和控制等多个方面,通过优化算法和集成技术,提高人形机器人的自主性、灵活性和适应性,该策略框架的提出为人形机器人领域的发展提供了重要支持,有望促进机器人在智能服务、生产制造等领域的应用拓展。


北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)对外宣布,其自主研发的具身智能策略框架 FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency 已被人工智能领域顶级会议 NeurIPS 接收。
据悉,FreqPolicy 的核心突破在于首次提出频谱一致性约束机制,从频域视角重新构建了具身智能机器人的动作时序建模方式。该框架通过在策略生成过程中引入动作信号的频域表征,实现了“单步输出高质量动作序列”的能力,显著增强了机器人操作的流畅性与执行效率。
在人工智能加速向物理世界落地的趋势下,FreqPolicy 针对高效具身操作任务展开研究,采用一步生成架构,大幅提升了动作预测与控制的频率,满足机器人系统在高动态、高实时性场景下的响应需求,尤其适用于复杂环境中的自适应操控任务。
FreqPolicy 将动作块(action chunk)利用 DCT-II 变换转换至频域空间,并在此空间施加一致性约束,以更有效地捕捉动作的时间动态特性。同时,该框架设计了针对频域分量的自适应注意力机制,使其能够在频谱范围内灵活聚焦关键频率成分。上述设计帮助模型学习到更优的动作转移路径,最终实现从噪声直接生成目标动作的一体化过程。
在多个仿真基准测试中,FreqPolicy 表现出色。相比当前最先进的单步动作生成方法,在 Robomimic 基准上平均性能提升 6%,在 MetaWorld 基准上平均提升达 8.9%。此外,当与 OpenVLA 等视觉-语言-动作(VLA)模型集成时,FreqPolicy 在保持操作精度的同时,将推理速度提升至原有水平的 5 倍。

在真实机器人应用场景中,FreqPolicy 展现出广泛的适用性,涵盖桌面操作、家庭服务及工业自动化等任务场景。实验结果显示,其任务成功率优于传统的扩散策略和标准流匹配策略,且推理频率实现 3 到 5 倍的提升。
展望未来,北京人形机器人创新中心将持续优化 FreqPolicy 框架,进一步增强其对多模态动作分布的建模能力,并加快推理效率,推动其在更高复杂度真实场景中的落地应用。
网友留言(0 条)