一种基于双环策略的杂乱堆叠场景长序列物体抓放决策的方法
2025-02-22 19:43
No.1342944798251950080
技术概要
PDF全文
本技术公开了一种基于双环策略的杂乱堆叠场景长序列物体抓放决策的方法,包含两个闭环策略,内环策略负责通过主动感知提高物体匹配的准确性,当机械臂抓取到物体后,该策略会通过旋转物体从多个视角进行感知,增加物体与目标场景内物体匹配的置信度。外环策略则负责执行抓取和放置操作,结合不确定的物体匹配和抓取能力进行抓取动作的预测,并根据当前物体的匹配情况决定是否直接放置到目标位置,或者将物体暂时放置在缓冲区,该方法利用预训练视觉基础模型进行物体匹配、内环策略学习和内环终止机制的实现,该方法对感知噪声的影响更加鲁棒,且通过强化学习闭环优化考虑了任务层级的最优性,从而达到更好的任务成功率和效率。
背景技术
目前,杂乱堆叠场景下长序列物体抓放是机器人操作领域一个非常重要的任务,也是服务机器人的一个关键技术。传统方法依赖于已知的物体模型,但是通常情况下用户很难提供这样的信息。近年来的工作开始研究未知物体模型的多物体长序列抓放任务,仅需给定一张初始场景的RGB-D图像和一张目标场景的RGB-D图像,探索如何将初始场景下的多物体重排成目标场景下的状态。 由于不存在物体模型,近期的一些工作主要利用基于学习的感知模块来实现初始场景和目标场景的匹配,从而生成场景表示。这些方法显著缩小了从已知物体到未知物体重排任务的感知差距。然而,这些系统在规划层面上的动作是通过启发式规则或监督学习得出的,较少关注任务层级的最优性。感知噪声会加剧这种情况,因为这些启发式规则可能基于错误的感知结果。此外,现有的系统在处理长任务序列的情况下,难以优化整体的任务完成效率。为了优化任务层级性能,强化学习是一个有用的工具。然而,直接通过强化学习长序列任务中的策略存在挑战。 现有技术存在如下技术问题: 1)现有技术生成的堆叠场景下长序列抓放序列效率普遍较低; 2)现有技术对未知物体的泛化性较差; 3)现有技术在未知物体模型时,对感知噪声的鲁棒性差; 4)现有技术不关注任务层级的最优性。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
王越  许可淳  熊蓉
技术所属: 浙江大学
相关技术
具有准零刚度特性的三自由度并联隔振平台 具有准零刚度特性的三自由度并联隔振平台
一种基于数字孪生技术的机械臂构建方法 一种基于数字孪生技术的机械臂构建方法
一种用于机械臂的重力平衡装置 一种用于机械臂的重力平衡装置
一种机械臂抓取目标检测方法和系统 一种机械臂抓取目标检测方法和系统
一种基于双层博弈的重载机械臂人机协同控制方法 一种基于双层博弈的重载机械臂人机协同控制方法
基于光热效应的光驱动感知一体化柔性关节及其光路系统 基于光热效应的光驱动感知一体化柔性关节及其光路系统
一种基于质心动力学模型的人形机器人全身协调控制方法 一种基于质心动力学模型的人形机器人全身协调控制方法
一种可末端自锁的双层环形可展开周边桁架 一种可末端自锁的双层环形可展开周边桁架
基于模仿学习的人形机器人多运动切换控制方法及系统 基于模仿学习的人形机器人多运动切换控制方法及系统
一致性约束的检测机器人任务分配方法 一致性约束的检测机器人任务分配方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利