本技术公开了一种糖尿病预测和可解释性分析方法以及计算机程序产品,属于医疗信息学技术领域,包括:构建样本数据集;构建特征自注意力模块的数学模型;构建融合特征自注意力模块的改进残差网络模型;利用改进残差网络模型对样本数据进行糖尿病风险预测;使用SHAP模型计算每个输入特征向量的SHAP值,评估输入特征向量对模型输出的边际贡献;生成SHAP值的可视化摘要图,展示各个特征对预测结果的具体影响。本发明融合自注意力机制和深度残差思想,显著提升了RAC模型的预测性能。通过引入SHAP特征分析,量化各特征对预测的贡献,增强了模型的可解释性,能够为糖尿病预测提供系统性评估。
背景技术
糖尿病作为一种全球性的代谢性疾病,其预测和监测对于早期干预和治疗至关重要。通过人工智能算法提高糖尿病预测的准确率以及模型的可解释性,可以为糖尿病人群预测发病概率提供有效工具,这对于辅助医生进行糖尿病诊断具有重要的现实意义。
目前,利用人工智能算法实现糖尿病预测的方法主要包括决策树、朴素贝叶斯模型、多元贝叶斯逻辑回归模型、基于支持向量机的预测模型等,但多数模型的关键性能指标尚未达标,与临床应用的高要求尚有差距。
近年来,对于糖尿病预测方法的研究趋势逐渐转向开发高性能且具备可解释性的预测模型。例如,将深度神经网络应用于体检记录,以实现糖尿病的预测。另外,结合使用LightGBM与SHAP方法的预测模型不仅提升了预测效果,还增强了模型的解释性。这些研究表明,结合高预测性能与增强的可解释性是当前糖尿病预测模型研发的核心方向。
尽管糖尿病预测领域持续涌现新进展,但现有预测方法无论是传统机器学习算法,还是深度学习网络,仍面临多重局限性。例如,由于预测模型结构简单,导致预测精度不高,无法满足临床应用的高要求;由于数据不平衡,导致模型仅对大多数类表现良好,即,高特异性但低灵敏度;多数预测方法为黑箱机器学习模型,临床医生很难理解整个预测过程,因此不利于建立起对预测结果的信任度。
本背景技术所公开的上述信息仅仅用于增加对本申请背景技术的理解,因此,其可能包括不构成本领域普通技术人员已知的现有技术。
实现思路