本技术涉及一种先进的字符处理和识别方法,以及相应的存储介质和终端设备。该方法首先通过图像识别技术获取图像中字符的坐标信息。随后,利用核密度函数对相邻字符的坐标差值进行聚类分析,以精确确定字符间的关系。
背景技术
患者在体检机构或者医院进行体检或者检查化验后,纸质化验单不易保存。而且当用户去另外的医院检查时,由于纸质化验单数据不能结构化,体检机构与医院之间或者医院与医院之间的数据不能通用等一系列问题使得当前医院对于患者的情况不能进行很好的评估。经常发生换一家医院又要重新做检查的情况,浪费了大量的时间、金钱和人力。因此需要一种方法可以将患者的纸质体检报告单或者化验单中的数据结构化,将碎片性的化验单信息整体化,这对于患者电子病历的建立、各医院数据间的联通具有重要的意义。
表格是化验单及体检报告单中的重要组成部分,将纸质表格转化为结构化的电子信息时表格中字符的识别是需要解决的问题。
实现思路