本技术公开了一种基于测井数据特征衍生和机器学习的页岩TOC预测方法,涉及页岩总有机碳预测技术领域,基于测井数据特征衍生和机器学习的页岩TOC预测方法主要包括:利用岩石热解实验得到页岩TOC数据;根据页岩TOC数据,利用地质研究工具得到原始测井数据并进行预处理;对所述预处理后的测井数据进行特征衍生得到新数据集,并对随机森林机器学习模型进行训练得到页岩TOC预测模型,并对待测页岩数据进行预测得到页岩TOC预测结果。实施本发明提供的基于测井数据特征衍生和机器学习的页岩TOC预测方法,能提高页岩TOC预测的灵活性、适用性和正确率。
背景技术
总有机碳(Total Organic Carbon,TOC)是评估非常规资源和CO2
地质封存潜力的关键参数。准确预测和量化TOC不仅有助于评估地下资源量和确定页岩油的地质甜点,而且有助于指示CO2
/页岩润湿性的差异,从而推进CO2
地质封存研究。准确预测TOC对于非常规油气资源勘探开发和CO2
封存具有重要意义。
获得页岩TOC含量一般有直接法和间接法。直接法为通过岩石热解实验准确获得页岩中TOC,往往该实验方法不仅耗时耗力且成本高昂。间接法如ΔLogR法被众多学者引用、改进并取得了不错的效果;但该方法需要人为设定测井曲线基线和有机碳含量背景值,容易引发误差造成结果偏差,且受地质差异影响较大;以往学者们通过分析页岩TOC与多个测井曲线的相关性,选择相关性最好的测井曲线作为预测参数进行预测。也有学者基于电阻率测井数据和声波时差测井交会与页岩TOC建立函数关系进行预测。上述方法缺点均是使用少数测井曲线进行分析,且预测公式中的参数为人工确定的标准化数据,具有较大误差;通过建立多元线性回归方程也不足以表征TOC与各参数之间,各参数与各参数之间存在的复杂非线性关系。
随着技术的发展,基于机器学习算法,如反向传播神经网络、支持向量机算法分析大量测井数据实现对TOC进行快速预测,相对传统方法可以提高准确性和效率。研究表明,数据和特征数量和质量决定了机器学习的上限,而模型和算法要做的是无限逼近这个上限,输入变量越多往往模型精度越高。但上述技术仍存在不足,难以对数据特征进行准确提取,不能有效利用数据中所含信息,且对高纬度数据难以处理;难以适应多变的地质环境,缺乏灵活性和适用性。
为此,需要探索一种省时省力的、方便准确的预测页岩中TOC含量的新方法。
实现思路