本技术公开了一种用于领域可泛化文本识别的序列风格一致性学习方法和系统,属于文本识别领域。包括:1、提取图片特征序列;2、对提取的图片特征序列进行数据增强处理;3、对初始特征序列和增强特征序列进行解耦处理并进行熵损失优化;4、通过风格一致性学习来减小风格相关特征和任务特征之间的相关性,优化对比学习损失;5、模型预测阶段仅使用任务相关序列特征进行预测。相比于现有的传统方法,本发明首次针对文本识别任务提出了领域可泛化的方法,填补了该项技术的空白,并实现了比当前最先进的领域泛化模型更好的性能。
背景技术
许多基于深度学习的文本识别方法有着不错的性能,但由于泛化性不高,很难满足真实世界的文本识别需求。目前已有的文本识别方法在训练和测试模型过程中大多使用相同风格的数据样本,没有考虑到数据样本之间的独立性和分布唯一性。训练好的模型遇到新的风格的图片,比如不同的字体或不同的角度,其准确率并不高,说明模型的领域泛化性较差,导致这一问题的原因是域偏移。
用于图像分类任务的领域可泛化方法可以很好的解决域偏移问题,但由于图像分类任务和文本识别任务之间的不同,目前已有的图像分类任务的领域可泛化方法不能够直接用于文本识别任务,文本识别模型缺少有效的领域可泛化方法。
实现思路