本技术涉及一种基于病历文本获取实体关系图的系统,所述系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据目标病历文本,获取目标实体列表和目标标签列表,获取中间实体关系图,基于预设规则列表对中间实体关系图进行处理,获取到目标实体关系图,本发明结合多个模型获取病历文本中的实体,基于样本数据不断调整各个模型的参数,进而使得获取到实体关系的准确性较高,将模型与规则进行结合,以图的形式进行呈现,提高了效率,先利用模型后利用基于病历文本中实体的语义信息等特征信息设置的规则对病历文本中的实体进行处理,使得获取到的病历文本实体关系图的准确性较高。
背景技术
随着互联网技术的不断发展,病历文本呈现电子化,病历文本作为判断疾病、治疗过程及疾病发展状态检测的重要文档,包含了大量的实体,实体与实体之间会存在相关的关系,这些实体关系对于理解病历内容、辅助医生决策、进行与疾病相关联数据挖掘等具有重要意义,如何清晰明了的获取病历文本中实体之间的关系成为热门研究方向,现有技术中,基于规则从病历文本中抽取出实体,在实体关系抽取的过程中,利用规则对预处理后的非结构文本进行匹配,从而提取出实体关系三元组,上述获取实体关系的方法存在的问题有:规则制定复杂,降低了获取到病历实体关系的效率,当病历文本类型多样化时,不能够准确识别出病历文本中的实体与实体之间的实体关系,使得获取到的病历文本中实体关系的准确性较低。
实现思路