本技术属于视网膜图像质量评估技术领域,提出了一种创新的基于双路径频域交叉注意力融合的评估方法。该方法通过以下步骤实现:首先,步骤S1,获取RGB图像;其次,步骤S2,对图像进行预处理和频域转换;然后,步骤S3,利用双路径结构进行特征提取;接着,步骤S4,通过交叉注意力机制融合特征;最后,步骤S5,输出视网膜图像的质量评估结果。该方法能够有效提升视网膜图像质量评估的准确性和效率。
背景技术
确定视网膜眼底图像质量是否足以进行医学诊断的过程称为视网膜图像质量评估,这一过程是诊断糖尿病视网膜病变、黄斑变性和青光眼等眼部疾病的重要先决条件。目前,通过眼底相机无创采集的视网膜图像是肉眼直接、集中观察动脉、静脉和毛细血管的唯一方法。因此,这些图像中眼底结构的适当照明和清晰度至关重要。然而,随着全球眼底疾病患病率的增加和眼科医生的相对短缺,高质量眼底图像的获取和后续诊断面临着巨大的挑战。在医疗条件较差、医疗资源匮乏的地区,由于眼底图像采集人员的经验水平参差不齐,很多采集到的眼底图像都存在不同程度的质量问题,如图1所示的曝光太弱或者过度曝光等问题。
对于眼科医生来说,采集时间和诊断评估时间之间的不连续性可能会产生问题。具体来说,如果在审查过程中发现图像质量问题,患者必须返回进行另一次眼底扫描,从而需要进一步的经济和时间支出。更重要的是,低劣的图像质量可能会导致误诊和治疗延误。通过涉及大量视网膜图像数据库的研究表明,超过25%的视网膜图像由于质量差而不适合医学诊断,导致它们无法在计算机辅助诊断系统(CADS)中使用,因此,在进行疾病诊断之前对视网膜图像质量的评估尤为重要。然而,传统的手动质量评估方法(由训练有素的眼科医生或验光师检查数字视网膜图像)非常繁重且耗时,且专业人员的有限性加剧了这一挑战,因此,在进一步分析之前自动评估视网膜图像的质量以排除低质量的条目对于提高诊断效率和准确性至关重要。
通过深度学习,特别是深度卷积神经网络(CNN)的应用,图像分析领域取得了重大进展。CNN通过实现端到端特征提取逐渐取代了传统的手动特征提取方法,这在自动化视网膜图像质量评估方面显示出了巨大的潜力。这些网络自主地从图像中学习复杂的特征,从而提高评估的效率和准确性。
尽管深度学习为高级图像质量评估提供了显着的优势,但它也遇到了显着的挑战,例如:仅依赖RGB图像可能会导致模型过分强调灯光因素并忽略重要的底层结构信息;在执行三类质量评估(良好、可用、拒绝)时,传统的深度学习模型常常难以区分相邻类别,经常将“可用”图像错误分类为“良好”或“拒绝”,从而降低了对图形的评估准确性。因此,发明人有鉴于此,提供了一种基于双路径频域交叉注意力融合的视网膜图像质量评估方法,以便解决上述问题。
实现思路