分布式多智能体强化学习在对象分类中的应用与设备
2025-02-14 12:41
No.1339939572636983296
技术概要
PDF全文
本技术涉及计算机技术,提出了一种利用分布式多智能体强化学习进行对象分类的新方法及其相关装置。该方法首先将训练数据集分割成至少两个子集,然后对每个子集使用对应的智能体进行训练,以实现高效的对象分类。
背景技术
随着人工智能的发展,通过训练神经网络模型得到对象分类模型,实现对对象进行分类被广泛应用。比如:通过对象分类模型对设备进行故障分类、通过对象分类模型对文本进行分类等。传统的对象分类模型的训练方法中,需要使用不同分类的训练数据对神经网络模型进行训练。然而,在一些场景中,不同分类的训练数据通常是不均衡的,即,某些分类的训练数据较多,另一些分类的训练数据较少,此时,训练得到的对象分类模型的分类性能较低。比如:在对设备进行故障分类的场景中,一般故障类别的训练数据的数量较少,而正常类别的训练数据的数量较多。 为了提高在训练数据不均衡的情况下模型分类的性能,提出了一种基于智能体强化学习的对象分类方法。传统的基于智能体强化学习的对象分类方法包括:获取不平衡的训练集;使用该训练集构建数据环境;基于深度Q网络(Deep Q-Leaning Network,DQN)算法,通过数据环境与智能体之间的交互训练强化学习模型,得到对象分类模型。 然而,基于智能体强化学习的对象分类方法虽然能够克服训练集数据不均衡的问题,但是,通过单一的智能体训练得到的对象分类模型的分类能力有限,可能无法达到期望的分类性能。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
槐青  李苗苗  董炜  叶昊  张统帅  王艺霖  季一润  袁茜  袁文迁  高岩峰  李雨  黄彬  杨敏祥  黄晓乐  谢丽芳
技术所属: 国网冀北电力有限公司电力科学研究院  清华大学
相关技术
一种服务开发方法、装置、设备及存储介质 一种服务开发方法、装置、设备及存储介质
一种高精度双层优化方法的神经网络搜索架构构建方法 一种高精度双层优化方法的神经网络搜索架构构建方法
跨总线域的设备对宿主机空间DMA访问方法及相关设备 跨总线域的设备对宿主机空间DMA访问方法及相关设备
一种客户信息定期维护方法及系统 一种客户信息定期维护方法及系统
代码发布方法、装置、计算机设备和可读存储介质 代码发布方法、装置、计算机设备和可读存储介质
一种基于统一管理平台的子应用数据获取方法及装置 一种基于统一管理平台的子应用数据获取方法及装置
利用深度学习的BIM模型错误自动检测系统 利用深度学习的BIM模型错误自动检测系统
一种基于智能反射面的室内T型走廊场景路径损耗的分析方法 一种基于智能反射面的室内T型走廊场景路径损耗的分析方法
模型评估任务处理方法及装置 模型评估任务处理方法及装置
基于大数据的异常信号智能识别方法 基于大数据的异常信号智能识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利