本技术提供一种基于SAM模型的扫描电镜矿物识别方法及设备,涉及矿物识别领域,包括:对样本图像集合进行矿物与孔隙的标注,获得标签图像集合;通过样本图像集合和标签图像集合对SAM2模型进行训练,获得训练好的SAM2模型;获取待识别的扫描电镜图像,对扫描电镜图像进行图像增强处理,获得增强后的扫描电镜图像;将增强后的扫描电镜图像输入训练好的SAM2模型,获得矿物与孔隙的分割结果。本发明在SAM2模型的训练过程中,通过Boundary损失、交叉熵损失和IOU损失计算总损失,通过总损失调整SAM2模型的参数,使SAM2模型在边界细节、类别区分和分割覆盖率上实现良好的平衡,提高矿物识别的精度和边界清晰度,最终提高矿物与孔隙的分割结果的精确度。
背景技术
矿物识别在非常规储层地质学的研究中具有重要意义,它直接影响到非常规储层中矿物的分类、研究和应用。扫描电镜(SEM)由于其高分辨率和优越的表面形貌成像能力,广泛应用于储层孔隙表征的研究中。页岩作为重要的非常规油气储层,其矿物组成和孔隙结构对油气的储集性能和渗透性具有决定性作用。传统的矿物识别方法通常依赖于人工手动分析和经验判断,这不仅费时费力,而且容易受到人为误差等主观因素的影响。为了解决这些问题,近年来,基于深度学习的图像分割技术逐渐被引入矿物识别领域。
专利申请CN202410762786.4公开了一种基于机器学习算法识别矿物的方法及相关装置,实现了矿物样本的自动识别,但受限于识别算法的泛化能力,仅限于识别本地图库中含有的矿物类型,无法对不在学习库中的样本进行识别。
专利申请CN202311584960.2公开了一种基于图像数据增强与集成学习的矿物识别方法与系统,采用深度卷积生成对抗网络(DCGAN)基于真实矿物图像和合成图片增强数据,耦合合多种深度学习模型,有效增强矿物识别精度,但在页岩SEM图像中基本无法分割出完整的矿物形态,并且该模型也无法区分油气储层中的孔裂隙特征。
Chen 等采用了卷积神经网络与U-Net架构,通过修改原始权重函数,有效的分割页岩SEM图像中粘土矿物与基质矿物的内部纹理差异;Wu 等通过使用随机森林分类器识别四个关键的岩石组分:孔隙/裂缝、有机质/类酮、岩石基质(粘土、方解石、石英)和黄铁矿。该方法被证明比传统的分割技术更可靠和稳健,特别是对于基质和黄铁矿组分。上述方法中,用于分类的关键特征主要来自于小波变换、高斯模糊和高斯差分等方法提取,其使用了有限的训练数据集,但该分类器在验证数据集上总体F1得分超过了0.9。
上述工作中都在一定程度上为页岩的矿物识别提供了新的思路与方法,但这些方法所使用的训练数据集主要来自于人工标记,工作量较大,且主观性强。当前存在的主要问题包括:1)标注成本高且标注数据量少:现有深度学习方法需要大量标注样本进行训练,标注工作耗时且成本高昂,特别是在缺乏足够标注数据的情况下,模型的性能难以满足要求;2)分割精度不足:现有技术在处理复杂矿物和孔隙边界时存在精度不足的问题,尤其是在识别细小孔隙、裂缝和黏土矿物边缘时,分割边缘常出现模糊和不准确;3)缺乏灵活性和自适应能力:传统方法在处理不同类型矿物和孔隙时,缺乏自适应能力,需要频繁调整参数或进行复杂的预处理,限制了其在多样化地质样品中的应用。
2023年Maciej A. Mazurowski使用了Segment Anything Model (SAM)这个基础模型进行医学图像分割的研究和评估,在19个不同的医学成像数据集上测试了SAM的性能,涵盖了多种成像模式和解剖部位,结果表明SAM对于轮廓明确、提示信息较少歧义的目标,如计算机断层扫描中的器官分割,表现出较好的分割性能;但对于更复杂的场景,如脑肿瘤分割,性能较差。2024年Yihao Liu针对医学图像,包括CT、MRI和超声等不同成像模式的图像开发的SAMM(Segment Any Medical Model)系统,可以实现大部分医学图像的分割及可视化成像。
尽管SAM模型在自然图像与医学图像分割中表现良好,且在零样本边缘检测任务中优于传统方法,但其在矿物识别领域尚未得到充分应用。另外,现有SAM模型尚未针对矿物识别任务专门训练,其在页岩SEM图像中的具体应用效果仍有待验证。因此SAM模型可以作为一种有潜力的通用视觉模型,应用于矿物识别领域。
实现思路