本技术涉及一种基于智能任务监管的机械臂动态避障方法,包括以下步骤:S1:采集位置信息集合;S2:基于机械臂的状态以及轨迹规划的要求,构建基本行为和复合行为用于零空间行为控制,并设置行为优先级作为动作信息;S3:基于机械臂的安全距离要求,设置控制障碍函数;S4:构建深度强化学习训练模型;S5:将位置信息集合与动作信息输入深度强化学习训练模型,根据设置的奖励函数获取对应的奖励,若根据所述信息得到机械臂末端与障碍物的距离小于最小安全距离,则机械臂的输入由控制障碍函数接管。本发明有效提高了机械臂在动态障碍物环境中的灵活性和适应性,并避免发生碰撞事故。
背景技术
在过去十年,轨迹规划取得了显著的进展,广泛应用在机器人学、自动化控制和无人驾驶等领域中,并成为其核心技术之一。随着计算能力的提升、传感器技术的进步以及人工智能算法的发展,轨迹规划技术不仅在理论研究上取得了突破、还在实际应用中展现了广泛的前景,其中工业机械臂的应用最为广泛。
随着传统工厂的转型升级,在如今的制造车间中,工件的位置可能会频繁发生变化,其他机械臂或工人也可能在工作区域内移动,这种动态障碍物的情况下,轨迹规划和避障任务很容易发生冲突,从而导致规划的轨迹不佳,甚至造成碰撞事故的发生。而零空间行为控制方法因其能够较好地处理多任务冲突,在动态环境中有着出色的表现。
尽管如此,由于零空间行为控制的任务优先级是固定的,在实际执行过程中无法根据环境变化而动态调整,这限值了零空间行为控制方法的适应性和灵活性。而强化学习具有高度自主学习性的特点,因此将强化学习作为行为控制的任务主管。但是,将强化学习作为行为控制的任务主管虽然能够较好地应对静态障碍物,但是在应对动态障碍物时,在避障的稳定性上还是存在不足,不能确保机械臂的安全。
实现思路