本技术涉及计算机技术,提出了一种利用分布式多智能体强化学习进行对象分类的新方法及其相关装置。该方法首先将训练数据集分割成至少两个子集,然后对每个子集使用对应的智能体进行训练,以实现高效的对象分类。
背景技术
随着人工智能的发展,通过训练神经网络模型得到对象分类模型,实现对对象进行分类被广泛应用。比如:通过对象分类模型对设备进行故障分类、通过对象分类模型对文本进行分类等。传统的对象分类模型的训练方法中,需要使用不同分类的训练数据对神经网络模型进行训练。然而,在一些场景中,不同分类的训练数据通常是不均衡的,即,某些分类的训练数据较多,另一些分类的训练数据较少,此时,训练得到的对象分类模型的分类性能较低。比如:在对设备进行故障分类的场景中,一般故障类别的训练数据的数量较少,而正常类别的训练数据的数量较多。
为了提高在训练数据不均衡的情况下模型分类的性能,提出了一种基于智能体强化学习的对象分类方法。传统的基于智能体强化学习的对象分类方法包括:获取不平衡的训练集;使用该训练集构建数据环境;基于深度Q网络(Deep Q-Leaning Network,DQN)算法,通过数据环境与智能体之间的交互训练强化学习模型,得到对象分类模型。
然而,基于智能体强化学习的对象分类方法虽然能够克服训练集数据不均衡的问题,但是,通过单一的智能体训练得到的对象分类模型的分类能力有限,可能无法达到期望的分类性能。
实现思路