一种基于机器学习的页岩含油量预测方法

未命名 07-15 阅读:133 评论:0


1.本发明涉及页岩含油量预测领域;尤其涉及一种基于机器学习的页岩含油量预测方法。


背景技术:

2.近年来,随着非常规油气探索的不断深入,页岩油勘探开发已然成为全球油气资源勘探的热点方向。
3.目前评价页岩含油量的参数主要包括:含油饱和度、热解参数s1和氯仿沥青“a”等。这些参数都可用于确定泥页岩中含有的石油含量。
4.其中,含油饱和度通过样品中石油体积与孔隙体积相比得到,求取过程中需要获得页岩含油体积、含水体积、孔隙度等参数。但考虑到1)目前从实验室获得的页岩孔隙度、含油饱和度等参数的准确性尚存在争议;2)含油饱和度确定的是页岩的有效孔隙度中的含油体积,页岩中纳米级孔隙极为发育,特别是有机质孔隙,利用含油饱和度参数表征含油性时未考虑封闭孔隙中赋存的油气量;3)页岩含油饱和度的准确求取需要有密闭取心的样品以防止轻烃组分散失,成本高。因此含油饱和度参数难以满足高准确性和易获取的要求。
5.热解参数s1为升温至300℃并恒温3分钟从样品中热蒸发出的烃类组分,其含量代表页岩样品的石油含量。氯仿沥青“a”为利用可溶有机质从样品中抽提分离出来的石油。两者都指示烃源岩样品中的残留烃,在常规油气评价中用于反映有机质丰度特征和烃源岩的生烃潜力。随着页岩油气研究的兴起,热解参数s1和氯仿沥青“a”被用于表征页岩储层的含油性。虽然地化参数也存在轻烃组分散失的问题,但结合密闭取心封闭保存资料、成烃动力学组分模拟、油气相变分析、生排烃质量守恒等方法可以尝试恢复轻烃组分损失量,获取更为准确的页岩油含量。相比于可溶有机质抽提,岩石热解(rock-eval)技术具有快速、经济、高效的点,通过大量做样获取热解参数s1可以快速了解页岩储层含油性情况,实现含油性非均质特征的精细刻画,为页岩含油量的优选提供依据。较高热解参数s1(游离烃含量)的页岩地层通常具有较高的油含量和页岩油资源。因此,只要能够预测页岩中的热解参数s1,就可以预测页岩含油量。然而,通过地球化学分析得到热解参数s1的方法,其成本高、代价昂贵、耗时长等。因此开发一种低成本高时效的方法来获热解参数s1显得尤为重要。如何建立一种能够准确预测页岩含油量的方法,是当前页岩油领域的重要研究课题。
6.目前,用于预测页岩含油量s1的方法主要是地球化学方法。因为它被认为是最可靠的方法。这种方法虽然精度高,但也有劳动密集型、成本高、耗时长的缺点。此外,由于该方法是基于实验室的,无法对整个深度的s1内容进行评估。另一种常用的s1含量评价方法是基于测井曲线。在基于对数的方法中,利用线性或多元线性回归方法建立单井或多条测井曲线与实测s1数据之间的经验数学关联。然后,利用已建立的经验数学模型,从测井资料中估算页岩的未知s1含量。目前常用的估算s1含量的经验测井方法有:伽马射线测井方法,多元线性回归方法,以及δlgr方法。这些方法都是经验-半经验方法,预测效果差、适用性低。为克服现有数学回归方法的不足,近年来,机器学习技术被引入页岩s1含量和其他性质的
预测中。常用的机器学习方法主要包括:随机森林、支持向量机、bp神经网络等。人工智能在这方面有很好的发挥空间,能够揭示多参数之间的潜在、未知、复杂的数学关系,从而建立更加准确、更加广泛的预测模型。与经验回归模型相比,这些机器学习模型可以处理自变量和因变量之间极其复杂的相互依赖关系,并从数据集生成假设来预测未知值。


技术实现要素:

7.本发明的目的是提供了一种基于机器学习的页岩含油量预测方法。本发明所涉及的方法相较于当前的页岩油预测方式,能够更精准的预测,是一种更适合用来预测页岩含油量的方法。针对现有技术、现有方法预测不精准的问题,本发明提出了一种基于机器学习的页岩含油量预测方法,来实现页岩含油量的准确预测。
8.本发明是通过以下技术方案实现的:
9.本发明涉及一种基于机器学习的页岩含油量预测方法,包括以下步骤:
10.采集各地区多口井的测井曲线及实测热解参数s1数据进行建模;
11.利用决策树算法进行特征筛选,建立并训练基于随机森林模型,并将随机森林模型与实测的真实值进行对比分析,并验证其准确性,对比现有常用方法数据的伽马射线对数模型;比较本发明方法的可行性,为利用机器学习预测页岩含油量提供新思路,为后续勘探开发提供依据。
12.优选地,所述方法具体步骤如下:
13.步骤1,模型搭建
14.(1)准备页岩测井数据和页岩热解s1数据;
15.(2)数据预处理:对数据进行规范化,使数据可被代码读取;
16.(3)提取特征变量和目标变量:提取特征变量为从多个测井曲线类型中,提取几个相关性强测井曲线类型,目标变量y就是s1;
17.(4)划分训练集和测试集:从实验数据中选择一部分作为训练集,剩下的作为测试集;
18.(5)基于随机森林模型搭建并且设置模型参数,包括:决策树的最大深度max_depth、弱学习器的个数n_estimators、叶子节点的最小样本数min_samples_leaf、随机状态参数random_state、min_samples_leaf在叶节点处需要的最小样本数、max_features每个决策树的随机选择的特征数目、min_samples_split拆分内部节点所需的最少样本数;
19.(6)模型评估与使用:根据评估指标选择最优模型(测试集mse均方误差,mae绝对误差,相关系数r2),其中均方误差和绝对误差越趋于0为最佳,相关系数越趋于1为最佳;
20.步骤2,模型精度验证与传统实证方法的比较
21.在模型训练和测试完成后,使用来自不同地区、不同盆地的未知数据集进行模型验证,验证模型的准确性。
22.优选地,所述现有常用方法为:(a)多元线性回归模型,(b)δlgr模型,(c)未知热解参数s1。
23.本发明所涉及的随机森林算法最优参数见表1所示。
24.表1
25.参数搜索范围步长最优值
n_estimators5-100137max_depth4-20114min_samples_leaf1-1011max_features1-817min_samples_split1-1012
26.本发明具有以下优点:
27.(1)本发明方法利用决策树,根据score数值高于0.8标准优选相关性较高的七个测井参数,将其作为评价热解参数s1的重要因子,以此来间接预测页岩含油量;该方法提高了预测精度和计算效率,降低了多余参数所带来的误差,同时减少了代码的计算冗余的现象。
28.(2)本发明方法针对不同地区的数据,采用机器学习算法对这些数据进行热解参数s1预测,进而达到对页岩含油量的预测目的;本发明所涉及的不论是模型预测还是应用预测相关性均高于传统方法所得到预测结果,而且拟合效果好,模型稳定。
29.(3)本发明方法应用广泛,可预测不同的领域,不同地区,泛化性好,且得到的数据更加贴近地质真实性。
30.(4)本发明方法预测所需时间短,仅需1s就可以完成,较传统的经验方法需要几个小时或几天才能完成而言,本发明方法大大提高了效率。
附图说明
31.图1是本发明所涉及的机器学习预测s1流程图;
32.图2是本发明所涉及的测量热解参数s1和预测的热解参数s1的交叉图;
33.图3是本发明所涉及的测井解释法预测页岩含油量模型图,其中,(a)多元线性回归模型,(b)δlgr模型,(c)未知热解参数s1数据的伽马射线对数模型。
具体实施方式
34.下面结合具体实施例对本发明进行详细说明。应当指出的是,以下的实施实例只是对本发明的进一步说明,但本发明的保护范围并不限于以下实施例。
35.实施例
36.本实施例涉及一种基于机器学习的页岩含油量预测方法,包括以下步骤:
37.采集各地区多口井的测井曲线及实测热解参数s1数据进行建模;
38.利用决策树算法进行特征筛选,建立并训练基于随机森林模型,并将随机森林模型与实测的真实值进行对比分析,并验证其准确性,对比现有常用方法数据的伽马射线对数模型;比较本发明方法的可行性,为利用机器学习预测页岩含油量提供新思路,为后续勘探开发提供依据。
39.本实施例所涉及的方法具体步骤如下:见图1所示。
40.步骤1,模型搭建
41.(1)准备页岩测井数据和页岩含油量数据s1:本次研究利用到的测井数据包括:铀(u)、自然电位(sp)、井径(cal)、井斜(dev)、声波时差(ac)、微球形聚焦测井(msfl)、光电吸收截面指数(pe)、补偿密度(den)、能谱自然伽马(grsl)、自然伽马(gr)、无铀伽马(kth)、钍
(th)、补偿中子(cnl)、钾(k)、深浅三侧向电阻率(lld、lls)。本专利利用的含油量数据为热解参数s1。
42.(2)数据预处理:数据预处理其目的主要是针对离群值点、数据缺少等问题进行数据的规范化,使数据可以被代码读取。
43.(3)提取特征变量和目标变量:提取特征变量,实际就是从多个测井曲线类型中,提取几个相关性强测井曲线类型。本专利通过采用决策树模型对测井参数进行优选;一共是从前述的15个测井曲线中提取了7个测井曲线,当作特征变量x1,x2,x3,x4.....x7,目标变量y就是s1。机器学习就是要找到y和x1,x2...的数学关系,即y=ax1+bx2+...+fx7,其中a,b,c...f是系数。
44.(4)划分训练集和测试集:由模型自动从实测数据816组选取70%(571组)的测井数据和热解s1数据作为训练集,剩下30%(245组)的数据作为测试集;
45.(5)基于随机森林模型搭建:设置模型参数:决策树的最大深度max_depth设置为14,即每个决策树最多只有14层;弱学习器(即决策树模型)的个数n_estimators设置为37,即该随机森林中共有37个决策树;叶子节点的最小样本数min_samples_leaf设置为1,即如果叶子节点的样本数小于1则停止分裂;随机状态参数random_state的作用是使每次运行结果保持一致;
46.(6)模型评估与使用:根据评估指标选择最优模型(测试集mse均方误差,mae绝对误差,相关系数r2),其中均方误差和绝对误差越趋于0越好,相关系数越趋于1越好。
47.随机森林预测模型对于页岩油含量的预测结果,见如图2所示(其中,左图为:训练随机森林预测图;右图为测试随机森林预测图),通过图2左图中可以看出训练集的r2达到0.9以上;由右图中可以看出随机森林的测试集r2高,达到了0.87,预测效果好。其预测值与实测值偏离程度较小,训练和综合皆达到了0.85以上,相关性更高。随机森林模型预测热解参数s1效果较好。
48.步骤2,模型精度验证及与传统实证方法的比较
49.为了比较机器学习方法与传统经验方法之间的预测性能,通过分析热解参数s1与测井之间的数学相关性,建立了施莫克γ射线测井、多元线性回归和δlgr法如表2所示。图3表明:其中,附图3中:(a)为多元线性回归模型,(b)为δlgr模型,(c)为未知热解参数s1数据的伽马射线对数模型;伽马测井、多元线性回归和δlgr方法均不能准确预测热解参数s1,r2分别为0.066、0.137和0.003,表明这些方法不适用于不同的富含有机质的页岩地层或不同的盆地。
50.表2
[0051][0052]
上述表2中:施莫克γ射线测井公式中,gr表示自然γ测井曲线;
[0053]
多元线性回归公式中,ac表示声波测井曲线,k表示放射性钾测井曲线,rd表示深双侧向电阻率测井,rs表示浅双侧向电阻率测井,th表示放射性钍测井曲线,u表示放射性铀测井曲线;
[0054]
δlgr法公式中,r表示岩石电阻率,rb表示基底电阻率,

t表示岩石的声波过镜时间,

tb表示基底声波过境时间,lom表示成熟度等级。
[0055]
显然,传统的方法无法准确的测量热解参数s1,也就无法准确的预测页岩含油量,这表明这些方法不适用于不同的富含有机物的页岩地层或不同的盆地。因此,机器学习方法在预测页岩的热解参数s1方面非常准确和有效,也更加方便在页岩含油量预测领域准确预测。
[0056]
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质。

技术特征:
1.一种基于机器学习的页岩含油量预测方法,其特征在于,包括以下步骤:采集各地区多口井的测井曲线及实测热解参数s1数据进行建模;利用决策树算法进行特征筛选,建立并训练基于随机森林模型,并将随机森林模型与实测的真实值进行对比分析,并验证其准确性。2.如权利要求1所述的基于机器学习的页岩含油量预测方法,其特征在于,所述方法具体步骤如下:步骤1,模型搭建(1)准备页岩测井数据和页岩热解s1数据;(2)数据预处理:对数据进行规范化,使数据可被代码读取;(3)提取特征变量和目标变量:提取特征变量为从多个测井曲线类型中,提取几个相关性强测井曲线类型,目标变量y就是s1;(4)划分训练集和测试集:从实验数据中选择一部分作为训练集,另一部分作为测试集;(5)基于随机森林模型搭建并且设置模型参数,包括:决策树的最大深度max_depth、弱学习器的个数n_estimators、叶子节点的最小样本数min_samples_leaf、随机状态参数random_state、min_samples_leaf在叶节点处需要的最小样本数、max_features每个决策树的随机选择的特征数目、min_samples_split拆分内部节点所需的最少样本数;(6)模型评估与使用:根据评估指标选择最优模型,其中均方误差和绝对误差越趋于0为最佳,相关系数越趋于1为最佳;步骤2,模型精度验证与传统实证方法的比较在模型训练和测试完成后,用来自不同地区、不同盆地的未知数据集进行模型验证,验证模型的准确性。3.如权利要求1所述的基于机器学习的页岩含油量预测方法,其特征在于,所述现有常用方法为:(a)多元线性回归模型,(b)δlgr模型,(c)未知热解参数s1。

技术总结
本发明提供了一种基于机器学习的页岩含油量预测方法;包括:采集各地区多口井的测井曲线及实测热解参数S1数据进行建模;利用决策树算法进行特征筛选,建立并训练基于随机森林模型,并将随机森林模型与实测的真实值进行对比分析,并验证其准确性,对比现有常用方法数据的伽马射线对数模型。本发明方法针对不同地区的数据,采用机器学习算法对这些数据进行热解参数S1预测,进而达到对页岩含油量的预测目的;本发明所涉及的不论是模型预测还是应用预测相关性均高于传统方法所得到预测结果,而且拟合效果好,模型稳定。本发明方法预测所需时间短,仅需1s就可以完成,较传统方法需几小时或几天才完成,本发明方法大大提高了效率。本发明方法大大提高了效率。本发明方法大大提高了效率。


技术研发人员:党伟 章鑫 孙江涛 封宇博 刘之的 李菲
受保护的技术使用者:西安石油大学
技术研发日:2023.03.17
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐