本技术公开了一种表格型文本图片的识别方法,首先将表格型文本图片进行灰度化处理得到灰度图,对灰度图运用自动阈值的二值化处理,然后使用霍夫变换提取表格横竖线结构,得到横竖线坐标及单元格;然后对表格型文本图片中的文本内容进行检测并得到具有标签的文本图像,所述标签具有坐标;对文本图像进行字符识别;再将步骤S1的单元格与步骤S2的标签进行自动坐标匹配,并将步骤S2的字符识别结果输出到相应单元格内。该方法用于实现金融资讯扫描文件等内容的识别,能够准备识别表格和其中的文本内容。
背景技术
随着计算机视觉的飞速发展,作为计算机视觉的经典问题之一的光学字符识别(optical character recognition,OCR)技术迅速突破了传统技术框架的瓶颈,在自然场景文本识别、车牌识别、证件票据识别等诸多领域得到了广泛的应用。传统的光学字符识别技术是一个经典的模式识别问题,包括对图片的预处理、特征提取、利用分类器分类等几个步骤,已经形成了较为完善的技术体系。但随着深度学习的发展,传统光学字符识别框架被打破,基于深度学习的光学字符识别作为新的研究热点展现出更多的活力和更广阔的应用场景。因此,光学字符识别技术目前正面临着巨大的机遇和挑战。现有的文件内容识别方法大多采用传统的扫描匹配算法,缺乏对文件内表格、段落等复杂结构的特殊处理、对检测识别产生的错误内容的二次校准等技术。
实现思路