本技术方案专注于知识图谱补全领域,旨在克服传统提示工程在知识图谱补全中引发的致幻性问题。该方法通过元认知和多角度提示,提升大语言模型在知识图谱补全任务中的准确性和可靠性。
背景技术
医疗领域对知识图谱的需求日益增长,特别是在辅助诊疗、医学知识管理等方面。例如在辅助诊疗方面,知识图谱能够提供结构化、关联化的知识共享和利用能力,尤其在知识快速更新的医疗诊断领域,可以缓解临床医生的记忆和分析压力。通过知识图谱,医生可以快速获取患者的疾病历史、家族病史、用药情况等全方位信息,为诊断和治疗提供有力支持。此外,知识图谱还可以辅助影像诊断,通过智能影像分析,提高影像、语义/知识、诊断报告三者间转化的准确性。在医学知识管理方面,知识图谱可以整合分散的医学数据和文献,帮助研究人员发现新的治疗方法和药物。它能够整合来自不同来源的异构数据,例如电子病历、医学文献、临床指南和患者生成的数据等,形成一个更全面、更准确的知识表示。
知识图谱(Knowledg e Graph, KG)是通过描述实体及其关系,构建了语义网络,为信息检索、智能问答等任务提供了语义支持。然而,知识图谱通常面临数据不完整的问题,知识图谱补全(Knowledge Graph Completion, KGC)则致力于填补这些知识空白,确保知识图谱的完整性和准确性。
知识图谱补全的常用方法主要分为两大类:基于结构化的和基于描述化的补全方法。基于结构化的方法侧重于利用图的拓扑结构来推断缺失的关系,如通过嵌入模型或路径推理等方式来预测未知连接;而基于描述化的方法则通过实体和关系的文本描述,利用自然语言处理技术从语义角度进行推理。尽管基于描述的知识图谱构建(KGC)在文本与结构化知识的学习中取得了显著进展,但其有效性仍受到文本质量和结构不完整性的限制。例如,在图1中,Gary Roger Rydstrom被描述为美国音效设计师和导演,他曾七次获得奥斯卡音效奖,并执导了获得奥斯卡提名的电影《Meet Joe Black》。然而,仅依赖“award”这一关系的描述,可能导致大语言模型错误地推断出Rydstrom获得了奥斯卡导演奖,从而引发实体类型理解的偏差。此外,对于长尾实体,从现有图谱中学习结构化模式也存在挑战。这些限制使得KGC在处理不充分和不完整知识图时难以在实际应用中达到理想的性能。
近年来,提示工程(Prompt Engineering)在知识图谱补全中的应用受到了广泛关注。提示工程通过精心设计的提示来引导大语言模型解决特定问题,为提升知识图谱补全的效果提供了一条新路径。在这一背景下,思维链(Chain of Thought, CoT)和思维树(Tree of Thought, ToT)等推理策略也应运而生。其中,思维链通过逐步推理过程增强了模型在解决复杂问题时的逻辑推理能力,而思维树则进一步引导模型从多分支路径探索不同的推理可能性。
上面这些模型和策略在特定环境中表现出显著效果,尤其是在提升模型的显性推理能力方面,如算术、常识和符号推理。然而,这些方法在深化理解方面的有效性相对有限,因为推理任务通常涉及系统地连接不同的概念,而真正的理解需要掌握底层语义以及更广泛的上下文信息。常规的提示工程方法在引导推理过程中,可能引发大语言模型的“致幻性”,即模型在信息不充分或误导性的情况下生成不正确或不合理的推理结果。
实现思路