本技术介绍了一种利用深度学习技术的鱼类图像识别技术及其系统。该技术构建了一个Bilateral‑Net水下图像增强模型,该模型集成了基于混合域自注意力机制的对比度增强模块和双边特征融合技术,以提高鱼类图像的识别准确性。
背景技术
受水下特殊成像环境的限制,水下鱼类图像存在对比度低、细节模糊和颜色失真等现象,影响目标识别的效率和准确性,此外鱼类图像具有类间相似和类内差异大等特性,对水下生物观测与识别工作带来挑战。因此构建水下鱼类图像增强和识别技术对于建设海洋牧场具有重要意义。
现有的图像增强方法可以分为传统无模型和基于模型的方法。它们都能够一定程度增强图像的对比度、保留图像细节以及改善图像色彩偏差等。然而传统无模型方法在改善图像质量时并没有考虑水下图像成像时的不同水下环境变化,存在过度增强或增强不足的现象,不能完全适合于所有水下图像;传统的基于物理模型的方法在校正水下图像色偏中表现不佳,需要依赖先验知识,并手动调整参数,既耗时且受参数影响较大,无法泛化到复杂多变的水下场景中。为了克服上述局限性,近年来,深度学习引入到水下图像增强领域,通过在大规模水下数据集上训练网络,使其有效应对水下多变的环境。然而这些水下图像增强模型用于鱼类图像时,仍会存在不同程度的增强效果不足,因此还需在现有模型基础上进行改进,提升鱼类图像增强效率。另外,随着深度学习日趋成熟,研究人员将深度学习方法也应用于鱼类图像识别,卷积神经网络在鱼类识别任务中得到广泛认可,然而,在实际识别任务中准确率出现下降趋势,分析导致这一现象的主要原因有以下三点:(1)鱼类图像受到光成像限制导致图像具有不同程度的模糊、色偏和低对比度等问题,影响识别效率;(2)目前鱼类图像数据集中各类内数据不足、类间数量不平衡,而深度学习依赖大量稳健的数据,因此在鱼类识别任务中易出现过拟合的情况;(3)对具有类内差异大、类间相似度高的鱼类不能进行有效识别,从而引起的识别错误。
实现思路