本技术涉及一种基于主动学习技术的地下储层岩性识别方法,属于数据挖掘领域;解决了由于缺乏高效的评估方法导致难以对大规模岩性数据的岩性进行识别的问题。其技术方案是:首先,生成近邻扩散网络,组织岩性数据节点之间的关系;随后,计算岩性数据节点的拓扑结构重要性和可疑度,得到关键节点序列,在专家的标注下对少部分岩性数据节点进行岩性识别,再结合邻域集,通过扩散作用对其他未被专家标注的岩性数据节点进行标注;经过多轮迭代之后得到最终的岩性识别结果。本发明提出了一种基于主动学习技术的地下储层岩性识别方法,实现了通过对少量岩性数据节点的标注来完成对大规模岩性数据的岩性识别。
背景技术
随着地质勘探工作的不断深入,人们需要通过了解岩石中的矿物成分及其分布情况来为地质学研究、矿产勘查等工作提供数据上的支持。如何对数据进行处理是一个极其重要的问题,传统的岩性识别方法依赖于直接观察以及经验积累,地质学家通过现场勘测岩石的各种外观特征对其进行分析,再结合地层学原理,手工划分岩性,这种方式虽然能够有效地对岩性进行识别,但是耗费了大量时间,并且需要行业的专业人士才能进行判断,这进一步限制了识别效率,单靠人力不可能完成对大规模数据的岩性进行分析。二十世纪初,显微镜技术的发展给地质学家带来了新的思路,通过观察岩石薄片来判断岩石中的矿物成分,从而更精确地识别岩性。随着钻井技术的不断成熟,人们获取到更多准确的、全面的地质数据,但还缺少高效的方式对其进行分析,想要正确处理大量的数据,仍然是一个技术上的难题。
进入二十一世纪,遥感技术、人工智能和机器学习的应用,给岩性识别提供了新的发展动力,岩性识别逐渐向数字化、自动化发展,遥感影像分析技术帮助人们获取大范围的岩性信息,而机器学习算法则帮助处理大量数据,通过将部分数据作为输入来对模型进行训练,再用训练好的模型对新输入的岩性数据给出岩性识别结果,人们还在此基础上结合观察切片等方式来综合分析,以得出一个更加全面、准确的岩性识别结果。但已有的技术还存在一些不足:一方面,需要大量已标记数据用于训练模型,成本较高,传统的机器学习方法需要大量的岩性数据来对模型进行训练,对资源和存储空间的要求较高,尤其是在面对大规模岩性数据集时,可能需要进行大量的矩阵运算和存储管理,没有考虑到在保证质量的前提下,减少资源消耗从而提高效率;另一方面,效果依赖于训练数据,可能导致过拟合或欠拟合问题,在对复杂模型进行训练时,很有可能学习到数据集中的噪声,导致在训练数据上表现良好,而对于新的数据则表现很差,这就是发生了过拟合。而当模型比较简单时,它就很难从岩性数据中捕捉到潜在的模式,从而也不能得到很好的结果。
实现思路