本技术公开一种基于深度学习的联合颈椎推断年龄与性别分类方法及系统,包括:将X光头颅定位侧位图像作为基于U‑Net架构的分割网络的输入,得到X光头颅定位侧位图像中单个颈椎的分割掩模;根据颈椎分割掩模设计多种输入工况;针对每个输入工况设置单个颈椎和多种颈椎组合输入组合;以X光头颅定位侧位图像左上角为坐标原点设定范围取ARDA指导的颈椎区域;使用训练后的Efficentnet‑B0模型对针对每个输入工况设置单个颈椎和多种颈椎组合输入组合以及ARDA指导的颈椎区域进行年龄推断和分类,得到X光头颅定位侧位图像对应性别的概率和年龄;通过不同的颈椎组合模式与单个颈椎进行年龄和性别推断精度的比较,进一步提高年龄估计准确性和可靠性。
背景技术
法医学是通常用于尸体遗骸处于分解阶段的刑事案件,法医人类学家可以帮助识别遗体被焚烧、腐烂、无法辨认或以其他方式肢解的死者,因此年龄推断和性别分类技术在法医人类学中的应用至关重要。骨骼结构在发育和老化过程中会发生一系列形态学变化,这些变化可以作为推断年龄和性别分类的依据。常用于确定年龄的骨骼是手腕,而用于确定性别的骨骼是骨盆骨。在未成年人的年龄推断中,手、手腕、锁骨内侧、第一肋骨、膝盖以及颈椎等部位常被用作观察对象,腕部X线片因其直观性和准确性,成为了确定儿童成熟度最常用的方法,然而,成人的骨骼发育已经成熟,传统的观察方法很难准确地反映出骨骼及其周围组织的增龄性变化。这也在一定程度上限制了骨龄推断在成人年龄评估中的应用。
颈椎是由七节椎骨紧密相连构成的,通过对颈椎椎体进行侧位拍摄,可以清晰地展现出其生长发育、老化过程中的增龄性改变。骨骺一旦完成结合,椎体的发育就会停止。根据颈椎的形态学变化,其发育过程通常被划分为六个不同的阶段。通过观察颈椎所处的阶段,可以对颈椎成熟度(CVM)进行评价,这种评价方式在评估骨骼年龄方面已被证实与手腕部区域同样可靠和有效。由于骨骼成熟是一个持续的过程,CVM的评估本质上是一个回归问题。而颈椎的发育分级是通过将连续的CVM按级别离散为6类,将回归问题转化为分类问题。即使是对有经验的医生,离散化也难以获得满意的表现,尤其对于边缘受试者来说,CVM的六个阶段可能很难区分。而影像噪声水平较高的X光头颅定位侧位图像,图像清晰度较差,使得分期困难。此外,由于患者的角度和姿势导致图像失真,可能也会导致X光头颅定位侧位图像评估分期困难。很多研究报告CVM评估的可重复性和可靠性较差。这一结论主要是基于对椎体下缘凹陷的识别标准,以及对椎体形状(梯形、水平矩形、正方形或垂直矩形)的认定主观性较强,导致颈椎的分期可靠性受到影响,认为CVM图谱不能以客观和详细的方式来评估生长,因为结果可能因操作者的不同而不同。而且图谱也不能像TW2方法那样用来计算年龄。由于以上问题,Perinetti等认为临床医生需经过专门培训,才能够使用CVM方法做出较为满意的评估。
由于颈椎椎体的大小和形状随年龄变化发生增龄性变化,且椎体易于通过影像技术进行测量,既往基于颈椎的年龄推断主要依赖于颈椎的形态学变化。有学者利用椎体高度和(或)椎体长度的比值、不同椎体的凹度和角度作为变量来推断青少年的年龄。Mito等采用C3和C4椎体的宽度/高度比值指标对7-15岁176名女孩的颈椎影像进行研究,确定了颈椎骨龄的回归公式,平均绝对误差(MAE)为1.17;计算颈椎骨龄与腕部骨龄的相关性R为0.869;结果表明,颈椎推断骨龄与Tanner-Whitehouse 2(TW2)方法推断的骨龄一样可靠,可客观评价颈椎骨成熟度并进行骨龄计算。Caldas等测量颈椎C3和C4椎体宽度和前侧高度并用两个椎体的宽高比(AH3
/AP3
和AH4
/AP4
)作为变量得出年龄推断的多元回归方程。之后,Caldas等人将上述公式使用计算机系统辅助骨骼年龄推断,方法操作简单,耗时少,客观性强。Beit等测量C2至C4椎体的形态变化(凹度、前高度和角度),通过和腕骨年龄的对比发现:C2、C3和C4的凹性、C3和C4前高度、C3角与骨龄呈极显著相关,并以这三个指标为变量得出了骨龄推断的多元回归方程。Cameriere等使用C4椎体前(a)和后(b)高度的比值来推断年龄。颈椎发育在25岁左右完成,C3-C7的棘突和上下骨骺环与椎体融合,之后颈椎开始发生退行性改变,如椎间盘(intervertebral disc)、颈椎曲度(cervical curvature)、骨密度等发生增龄性改变。然而,由于传统测量方法难以清晰、准确的描述颈椎的退行性改变特征,目前很少有通过颈椎老化变化推测成人年龄的研究。而在与年龄相关的动态注意对头颅定位侧片进行发育和老化分析研究中,我们发现颈椎区域与年龄有很强的相关性,尤其是在25-40岁年龄段,这也提示我们颈椎的增龄性变化特征可以用于成人的年龄推断。
既往传统研究由于方法学的限制,仅通过测量颈椎椎体各部分长度并将比值作为变量,这样的方式无法全面的反应颈椎形状的增龄性变化。人工智能深度学习方法的使用将有助于减少分析X线片的主观影响和诊断所需的时间,实现高效率和准确性,从而帮助临床医生做出准确的评估。2012年,Baptista等使用贝叶斯分类器对CVM进行分类,正确的CVM阶段的识别率约为70%。2015年,Dzemidzic等在分析C2、C3和C4轮廓的矩形特征和凹度后,使用决策树对CVM进行分类。Moraes等通过使用简单的多层感知器对C3椎体底部的凹面进行学习来输出骨龄。2019年,等通过在C2、C3和C4上定义19个参考点,并进行20个不同的线性测量。选取分类领域常用的7种人工智能算法进行比较。而Amasya等还考虑了C5的标志点(共需要定义和手动标记26个参考点),并通过提取椎体长度宽度之间的多个比值来对特征进行分类。选取了常用的5种人工智能算法进行比较。两项研究结果均认为人工神经网络是测定CVM的首选方法。上述研究使用了经典的基于机器学习的方法,可以更准确的识别CVM分期,并达到较高的准确性。但这些方法依然存在着需要专业知识对医学影像片进行手工特征标记,费时费力,且又容易出现错误。
深度学习模型可以通过学习提取给定数据的特征。因此,它相比经典的机器学习方法不需要专家来进行手工标记。2019年,Makaremi等首先提出了一种基于CNN的深度学习方法来确定CVM的6个阶段,使用分类熵作为优化准则。研究表明,当数据均匀分布在所有CVM阶段时,结果表现更好达到了90%的准确性。但该方法需要手动分割感兴趣区域(ROI)。2021年,Seo等通过对6个常用的CNN模型CVM分期精度的结果比较,发现所有深度学习模型的准确率均超过90%,其中Inception-ResNet-v2表现最佳。并使用Grad-CAM可视化每个深度学习模型,并确定了每个深度学习模型的特征热区图,但由于需要人工裁剪ROI作为预处理,该系统是半自动的。2022年,李海振等选择了VGG16、GoogLeNet、DenseNet161和ResNet152共四个CNN模型进行对比以确定最适合进行CVM分期的CNN模型。结果为ResNet152模型的平均曲线下面积(area under curve,AUC)为0.933,总准确率为67.06%,是CVM分类的最佳模型。但以上研究相比于端到端的全自动推断还是需要手工参与操作,费时费力,且均为CVM分期研究,深度学习的颈椎年龄推断还没有研究涉及。
此外,准确的性别评估对于识别未知尸体至关重要,男性和女性在骨骼结构结构通常表现出性别二态性,因此,骨骼轮廓通常使用性别特定标准。其中利用X射线图像中的骨骼结构进行性别分类是法医人类学和医学成像中的常见方法。骨盆是评估性别可靠的骨骼,女性的骨盆为了适应分娩的需求表现为入口横径大于前后径、耻骨弓较宽等,这些特征便于性别分类。颅骨性别评估的度量分析也可以提供客观的结果,比如下颌骨(下颌)的大小和形状、乳突、眉脊(眶上脊)和前额(额骨)的角度存在性别二态性;此外手和腕骨的一些特征,例如腕骨和掌骨的大小和形状,也可可用于性别分类。对颈椎性别二态性的研究表明,椎体尺寸和形态存在显著的性别差异。Stemper等人的研究表明男性椎骨在多个测量值上都更大,包括椎体宽度、椎间盘小关节深度和节段支撑面积;Madhavan等人和Stan等人发现第二颈椎(C2)已被确定为对性别估计特别有用,准确率约为77.5%;;Amores等人的研究显示其他颈椎C3-C6,也表现出明显的性别二态性因此,在法医学中通过颈椎骨进行性别分类具有潜力。尽管颈椎展现出性别二态性特征,但其形态学差异难以被精确表征并客观量化。近年来有研究使用深度卷积神经网络(CNN)对牙科X射线图像进行性别分类的结果证明了其高准确性和效率。各种CNN架构,包括ResNet50、DenseNet121和定制模型,已被用于这项任务,与手动方法相比,这些方法具有显著的优势,包括更快的处理时间和减少对专家知识的依赖(Ilic等人,2019;等人,2019)。且传统的手工测量与比较方法不仅耗时冗长,还不可避免地引入了主观因素的干扰,从而削弱了骨骼性别分类的效率和精确性。因此,开发一种能够同时实现颈椎年龄精确推断与性别准确分类的自动化、智能化系统显得尤为重要。
基于深度学习技术,对X光头颅定位侧位图像进行增龄化特征分析和提取的研究中发现在26-40岁年龄组使用颈椎区域进行年龄推断得到的最佳结果,也表明颈椎区域在成人受试者老化研究中具有独特的重要性。此外,由于确定年龄推断和性别估计当前广泛采用的参考图谱主要基于英国及北美地区人群的身体测量数据构建,这可能导致在应用于其他地区或不同人群时产生偏差。因此,为实现更为精确的年龄推断,需要依据更广泛的地域与不同群体多样性来开发和验证标准图谱,以确保法医人类学技术能够无偏见地服务于全球司法体系。
实现思路