一种用于领域可泛化文本识别的序列风格一致性学习方法和系统
2025-02-25 13:41
No.1343941087194259456
技术概要
PDF全文
本技术公开了一种用于领域可泛化文本识别的序列风格一致性学习方法和系统,属于文本识别领域。包括:1、提取图片特征序列;2、对提取的图片特征序列进行数据增强处理;3、对初始特征序列和增强特征序列进行解耦处理并进行熵损失优化;4、通过风格一致性学习来减小风格相关特征和任务特征之间的相关性,优化对比学习损失;5、模型预测阶段仅使用任务相关序列特征进行预测。相比于现有的传统方法,本发明首次针对文本识别任务提出了领域可泛化的方法,填补了该项技术的空白,并实现了比当前最先进的领域泛化模型更好的性能。
背景技术
许多基于深度学习的文本识别方法有着不错的性能,但由于泛化性不高,很难满足真实世界的文本识别需求。目前已有的文本识别方法在训练和测试模型过程中大多使用相同风格的数据样本,没有考虑到数据样本之间的独立性和分布唯一性。训练好的模型遇到新的风格的图片,比如不同的字体或不同的角度,其准确率并不高,说明模型的领域泛化性较差,导致这一问题的原因是域偏移。 用于图像分类任务的领域可泛化方法可以很好的解决域偏移问题,但由于图像分类任务和文本识别任务之间的不同,目前已有的图像分类任务的领域可泛化方法不能够直接用于文本识别任务,文本识别模型缺少有效的领域可泛化方法。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
佘清顺张鹏程赵洲
技术所属: 浙江大学 杭州一知智能科技有限公司.
相关技术
变压器呼吸器变色检测方法、装置、系统及电子设备 变压器呼吸器变色检测方法、装置、系统及电子设备
基于机器视觉和AR的虫害检测与管理系统 基于机器视觉和AR的虫害检测与管理系统
一种电路板的故障快速检测方法、系统及存储介质 一种电路板的故障快速检测方法、系统及存储介质
遥感影像检测方法、装置、电子设备及存储介质 遥感影像检测方法、装置、电子设备及存储介质
一种基于在网计算的流表压缩方法 一种基于在网计算的流表压缩方法
一种基于分段信道估计的通感一体化系统干扰消除方法 一种基于分段信道估计的通感一体化系统干扰消除方法
一种基于上半身姿态的驾驶员情绪状态检测方法及系统 一种基于上半身姿态的驾驶员情绪状态检测方法及系统
一种引入RBU的轻量化皮革表面缺陷显著目标检测方法 一种引入RBU的轻量化皮革表面缺陷显著目标检测方法
一种基于金字塔的SAR图像相干斑抑制方法 一种基于金字塔的SAR图像相干斑抑制方法
一种考虑多层级特征的多类别点云异常检测方法及系统 一种考虑多层级特征的多类别点云异常检测方法及系统
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利