本技术属于计算机书法技术领域,具体的说是一种汉字笔画特征抽取方法,包括以下步骤:基于深度学习算法构建特征提取模型;输入原始图像并进行二值化处理,得到预处理图像;将预处理图像转换为张量,并进行归一化处理,得到过程图像;通过构建特征提取模型,在将拍照的汉字图像输入时,可自动对汉字图像进行处理,采用二值化处理方式,得到预处理图像,再对预处理图像进行转换张量以及归一化处理,得到过程图像,通过算法识别过程图像中的每个笔画,并采用矩形框分割组成汉字的多个笔画,最后对矩形框包围的笔画进行优化重组,即可得到预测图像,实现将手写汉字图像转变为可控汉字评分、指导的计算机图像。
背景技术
汉字笔画特征提取是对书写的汉字字图像进行预处理,从图像中提取出该汉字每一个笔画的过程,这项技术为后续手写汉字比对、评分与指导的研究提供可靠的数据支持;也可为汉字风格转换的研究提供数据参照。
计算机书法领域的手写汉字笔画提取,主要分为在线笔画提取与离线笔画提取。在线笔画提取主要借助电子屏幕等设备采集书写者的行笔线路,进而通过起笔点与落笔点提取笔画信息。离线笔画提取作为近年来计算机书法研究的重点内容之一,其又可分为基于二值图像的笔画提取与基于骨架的笔画提取。
基于二值图像的笔画提取的方法为:首先将汉字图像二值化,然后利用汉字轮廓的角点或对笔画像素点进行分析,从而提取笔画的交叉区域,将笔画用交叉区域进行分割,最后分析笔画段关系,将分割开的笔画段重新组合起来,进而提取笔画。
基于骨架的笔画提取的方法为:基于骨架的笔画提取首先提取汉字骨架,然后对得到的骨架进行预处理。通过预处理得到质量较高的骨架,最后对交叉区域处的笔画段进行分析,从而将合适的笔画段进行组合,得到独立的笔画,主要方法为基于走势的笔画提取与基于模板的笔画提取。
综上所述,在线笔画提取方法较为简易,使用特定设备书写,提取笔画是基于书写过程的,因此受到特定设备限制和空间限制,相较于离线笔画提取不具备通用性;而在离线笔画提取方法中,无论是基于二值图像还是基于骨架,通常程序会对图像中的像素点反复遍历多次,存在计算量大,耗时较长的缺陷,因此图像像素越大,耗时越久。
为此,本发明提供一种汉字笔画特征抽取方法。
实现思路