ISSN 1009-5624 CN 10-2021/TQ 主管:中国乐凯集团有限公司 主办:北京乐凯科技有限公司
【摘要】针对人形机器人在动态环境中行为多样性生成机制不明确、控制策略稳定性不足的问题,本文提出了融合自监督学习与高保真物理仿真的多尺度行为建模方法。 通过构建感知-预测-控制闭环结构,分层解析动作、姿态与策略三类行为差异的生成路径,引入潜变量编码与物理反馈机制实现行为多样性的调控。 通过设计稳定性约束与策略分布边界,提升行为生成的可控性与结构可区分性。 结果表明:该方法在确保执行稳定性的同时实现了更丰富、可区分的行为模式,具备良好的泛化能力与解释性,为具身智能系统的多样性控制问题提供了解决思路。