本技术提供了一种基于知识蒸馏的口语场景主诉症状检测方法、装置、介质及计算机设备,方法包括:对采集到的口语化主诉数据进行数据标注,得到若干学生数据组和若干教师数据组;利用学生数据组对学生网络进行训练,利用教师数据组对教师网络进行训练;利用训练后的教师网络对训练后的学生网络进行知识蒸馏,得到主诉症状检测网络;将待识别的口语化主诉语句输入到主诉症状检测网络中进行识别,得到对应的症状预测结果;采用本发明的方法,通过知识蒸馏技术,有效提升了学生网络对口语化场景下主诉症状的检测精度;将训练好的教师网络的知识迁移到学生网络中,学生网络从教师网络中学习到更复杂的模式信息,提升其对口语化主诉数据的分类能力。
背景技术
现有技术中,随着大语言模型的快速发展,生成式AI在各领域的重要性日益凸显。但在实际应用中医问诊大模型进行问诊的场景下,由于用户输入文本的口语化程度较高,导致大模型捕捉到的主诉症状不准确,同时疾病症状库中症状繁多,也给症状定位带来了巨大困难。
实现思路