本技术提出了一种双臂机器人协同控制的新方法,该方法利用多智能体强化学习技术,将机器人控制问题转化为马尔可夫决策问题。通过构建仿真环境,设计强化学习算法,实现双臂机器人的高效协同控制。
背景技术
工业机器人一般为工业用机械臂,由传感器、机械结构、电气控制系统等部分组成,可以完成搬运、装配、焊接等操作。目前大部分的工业机器人为单臂系统,可执行的任务较为单一。随着生产任务要求越来越复杂、应用领域越来越大,在实际应用中,单臂机器人受自身机械结构限制或不稳定环境等因素的影响,在控制方面存在越来越明显的局限性。
与之相比,双臂机器人拥有两条机械臂,可以进行协调操作,就能够相互配合地完成更加复杂的任务。双臂机器人由两条机械臂组合而成,双臂之间相互独立又存在依赖关系,控制算法更为复杂。
现有的双臂机器人控制策略主要包括主从控制和位置/力混合控制。主从控制策略中,主臂进行轨迹规划,从臂依此规划自己的动作。位置/力混合控制策略则通过分解任务空间中的位置和力控制,以提高系统的响应速度和精度。但是,这些传统控制策略通常建立在精确的数学模型之上,这限制了它们的适应性和灵活性,特别是在任务要求或环境发生变化时。
为了解决上述技术问题,深度强化学习提供了解决方案,但是现有的强化学习算法的超参数众多且敏感,不同训练批次的模型表现可能存在显著差异,影响了算法的稳定性;双臂机器人需要双臂间进行信息交互,而传统的强化学习算法无法满足这一需求。
实现思路