本申请涉及人工智能辅助疾病检测技术领域,公开了帕金森病评估模型训练方法、系统及帕金森病评估方法,该模型训练方法包括:获取多个样本对象的多类面部表情图像,并为每个样本对象标注真实类别标签(PD患者或非PD患者);通过初始模型的分支网络模块提取多尺度特征,并利用初始模型的注意力融合模块对多尺度特征进行自适应加权融合,形成面部表情融合特征;通过初始模型的分类模块对面部表情融合特征进行分类,得到预测结果;根据预测结果与真实标签的差异构建联合损失函数,以优化模型的分类性能;基于联合损失函数对初始模型进行训练,最终得到目标帕金森病评估模型。该目标帕金森病评估模型能进一步提升帕金森疾病的评估。
背景技术
目前,帕金森病(PD)的诊断通常分为体内诊断和体外诊断两种方式。体内诊断主要依赖于专业的影像学设备,如正电子发射断层扫描(Positron Emission Tomography,PET)。虽然体内诊断方式具有较高的诊断准确性,但它也存在以下局限:一方面,PET等专业影像学设备在发展中国家往往较为稀缺,对于老年人来说,长途跋涉到发达地区的大医院进行就诊非常不便;另一方面,PET检查的费用较高,并非每个家庭都能承担。相比之下,体外诊断方式近年来越来越受到研究者们的关注,因其只要求采集体外生物标志物来进行诊断,例如语音信号、步态信号和面部表情等,可见体外诊断方式较为便捷,且成本较低。在上述三种体外生物标志物中,步态信号要求受试者佩戴专业的步态传感器,语音信号的特征会受到受试者语言种类的影响,而利用面部表情进行帕金森病诊断只要求采集受试者的面部表情图像,其临床依据在于帕金森病患者通常具有“面具脸”特征,即帕金森病患者做出面部表情的能力存在障碍,导致其面部表情减少或丧失。综上,利用面部表情进行帕金森病诊断具有便捷性、经济性和可靠性。
现有的通过面部表情进行帕金森病诊断的技术主要存在以下不足:第一,诊断模型使用传统的神经网络结构,例如残差网络ResNet,无法有效提取面部表情特征,且提取的特征容易受到人脸图像中面部遮挡、姿态变化等局部干扰的影响;第二,现有技术通常通过一种特定的面部表情图像来进行帕金森病诊断,例如一种高兴表情,然而,部分帕金森病患者在患病初期还未丧失所有面部表情,这就容易导致模型将帕金森病患者误诊为正常人的情况;第三,现有技术通常采用简单拼接的方式来进行特征融合,未考虑不同种类的面部表情对于帕金森病诊断的重要性,从而无法实现对提取特征的有效融合;第四,目前的帕金森病患者面部表情数据规模通常较小,导致模型学习帕金森病诊断任务时面临样本类别分布不平衡的问题,而现有技术通常采用常规的二元交叉熵损失函数来训练诊断模型,未考虑样本类别分布不平衡对模型特征学习带来的负面影响。因此,亟需一种准确可靠的帕金森病智能评估方法,一方面,能够提取主体面部表情图像的多尺度特征,另一方面,能够缩小类内特征与类中心的距离以提高类别间的可分性。
实现思路