一种基于测井曲线识别隔夹层类型的方法
未命名
08-26
阅读:108
评论:0
1.本发明属于地球物理测井技术领域;尤其涉及一种基于测井曲线识别隔夹层类型的方法。
背景技术:
2.隔夹层作为储层精细评价的重要部分,控制着储层的流体运移。因此,研究隔夹层的类型、测井响应特征和识别方法对油藏数值模拟及剩余油开发有重要意义。隔夹层分为泥质隔夹层、钙质隔夹层和物性隔夹层。对于隔夹层的识别,马成龙利用丰富的岩心资料对测井曲线进行标定,建立隔夹层识别标准;王安东应用自然电位、微电极结合声波时差等测井响应特征来识别隔夹层;徐丽强(2016)应用交会图法识别隔夹层,优选敏感曲线两两组合绘制交会图,形成不同隔夹层的识别标准;张吉等(2003)采用蜘蛛网图法在多维度下识别隔夹层。大量研究表明,岩心描述法是识别隔夹层最准确直观的方法,但由于取心成本较高、取心井有限,难以在油田大规模应用;测井资料能反映地层岩性与物性信息,可在岩心描述的基础上,分析隔夹层类型与测井曲线的对应关系,从而建立隔夹层识别标准。
3.由于部分隔夹层差异很小,常用的基于两条测井曲线的交会图法识别隔夹层效果不佳,存在二维不可分的问题;蛛网图法能够利用多维度信息识别隔夹层,但是不同位置的相同类型隔夹层蛛网图形态各异,蛛网图法需要人工对蛛网图进行分析和解释,这意味着它存在主观性和误差,并且蛛网图法难以定量化表征不同隔夹层对应的测井值具体分布范围,不利于油田实际应用。
技术实现要素:
4.本发明的目的是提供了一种基于测井曲线识别隔夹层类型的方法,利用测井曲线基于集成机器学习的隔夹层类型识别方法,以满足准确识别隔夹层的目的,为油藏描述、油藏数值模拟等提供技术支撑。
5.本发明是通过以下技术方案实现的:
6.本发明涉及一种基于测井曲线识别隔夹层类型的方法,包括以下步骤:
7.步骤一、岩心刻度测井,构建不同类型隔夹层数据集:首先将钻井取心资料进行岩心归位,然后利用岩心描述得到的隔夹层类型与测井曲线特征相对应,获取隔夹层类型对应的测井测量数据集;
8.步骤二、隔夹层特征数据集归一化处理:对步骤一中获得的隔夹层类型对应的测井测量数据进行归一化处理。
9.具体步骤为:
10.s1:对自然电位(sp)、井径(cal)、自然伽马(gr)、声波(dt)、密度(den)、中子(cnc)测井数据进行归一化线性处理,具体见公式(i)如下:
11.12.其中,shlg为需要归一化的上述任一测井数据,shlg
min
为对应的测井数据最小值,shlg
max
为对应的测井数据最大值,n
shlg
是归一化后的测井数据。
13.s2:对数据展布范围较宽的电阻率测井数据首先取对数后进行归一化处理,具体见公式(ii)如下:
[0014][0015]
其中,n
rt
为归一化后的电阻率测井数据,rt为电阻率测井数据,rt
min
为电阻率测井数据最小值,rt
max
为电阻率测井数据最大值。
[0016]
步骤三、测井曲线敏感性分析:采用成对变量关系图法进行测井曲线敏感性分析,优选能够较好反映不同类型隔夹层的测井曲线。
[0017]
步骤四、隔夹层特征数据集样本平衡处理:不同类型隔夹层的样本数量存在差异,导致了数据集中某些类型隔夹层的样本数量较少,而某些隔夹层的样本数量较多,需要通过合成少数类过采样技术解决类别不平衡问题,从而改善后续模型的分类效果。
[0018]
具体步骤为:
[0019]
s1:确定需要进行合成少数类过采样的隔夹层类型:查看步骤一获得的隔夹层类别与测井曲线对应的数据集,确定哪些隔夹层类型数量较少,将样本分为多数类和少数类,需要对数据集中样本数量较少的隔夹层类别进行合成少数类过采样。
[0020]
s2:计算隔夹层少数类样本的k近邻:对于需要进行合成少数类过采样的隔夹层中的每个少数类样本,计算其k近邻。
[0021]
s3:生成新样本:对于每个少数类样本,可以根据其k近邻生成一些新的合成样本。具体地说,对于每个少数类样本,随机选择其k近邻中的一个样本,并在它们之间生成一个新的合成样本。可以通过如下公式(vi)来生成新的合成样本:
[0022]
新样本=少数类样本+r
×
(随机选择的k近邻样本-少数类样本)(vi)
[0023]
其中r是(0,1)之间的一个随机数,用来控制生成的新样本在少数类样本与其k近邻样本之间的位置。
[0024]
s4:将新样本添加到数据集中:将生成的新样本添加到原始数据集中,从而使得数据集中各个隔夹层类别的样本数量更加均衡。
[0025]
步骤五:机器学习模型集成及模型评价:将多个组件学习器进行有效地结合,组建一个“学习器委员会”,其中每个学习器担任委员会成员并行使投票表决权,得到最终的隔夹层类型识别结果,用正确率对集成模型的预测结果进行评价,其中正确率计算公式(iii),如下:
[0026][0027]
其中,accuracy是正确率,n
correct
为被正确分类的样本个数,n
total
为总样本个数。
[0028]
具体步骤为:
[0029]
s1:对步骤四中得到的平衡后的隔夹层类别数据集划分为训练集和测试集。
[0030]
s2:利用决策树对训练模型进行训练,并利用正确率对模型进行评估;
[0031]
s3:利用随机森林方法对训练模型进行训练,并利用正确率对模型进行评估;
[0032]
s4:利用支持向量机方法对训练模型进行训练,并利用正确率对模型进行评估;
[0033]
s5:利用朴素贝叶斯方法对训练模型进行训练,并利用正确率对模型进行评估;
[0034]
s6:利用knn方法对训练模型进行训练,并利用正确率对模型进行评估;
[0035]
s7:将步骤s2-s6中的训练模型的预测结果进行投票,得到最终的隔夹层类型识别结果,并使用正确率对集成机器模型的预测结果进行评估。
[0036]
步骤六:实际井资料处理:使用训练好的集成机器学习模型对新的数据进行预测,得到最终的分类结果。
[0037]
本发明具有以下优点:
[0038]
(1)本发明所涉及的基于测井曲线识别隔夹层类型的方法与现有的二维交会图识别隔夹层方法相比,本发明方法在高维空间中对隔夹层类型进行识别,充分利用了所有与隔夹层类型识别相关的测井曲线信息,识别精度更高,能够解决二维交会图方法隔夹层不可分的问题;
[0039]
(2)本发明所涉及的方法针对样本数比较少的隔夹层,采用合成少数类过采样技术,增加少数类样本,解决了隔夹层类别不平衡问题,使得数据集中各个隔夹层类别的样本数量更加均衡,从而提高分类模型的正确率。
[0040]
(3)本发明所涉及的方法针对单一机器算法容易过拟合、陷入局部极小值等技术问题,本发明方法所涉及的集成机器学习算法,能提高隔夹层类型识别正确率。
附图说明
[0041]
图1是隔夹层类型与测井曲线对应图;
[0042]
图2为三种类型隔夹层归一化后的自然电位、自然伽马、井径成对关系图;
[0043]
图3为三种类型隔夹层归一化后的中子、密度、声波和电阻率成对关系图;
[0044]
图4为本发明中采用的集成机器学习流程图;
[0045]
图5实例井隔夹层识别成果图。
具体实施方式
[0046]
下面结合具体实施例对本发明进行详细说明。应当指出的是,以下的实施实例只是对本发明的进一步说明,但本发明的保护范围并不限于以下实施例。
[0047]
实施例
[0048]
本实施例涉及一种利用测井曲线基于集成机器学习的隔夹层类型识别方法,包括以下步骤:
[0049]
步骤一、岩心刻度测井,构建不同类型隔夹层数据集:首先将钻井取心资料进行岩心归位,然后利用岩心描述得到的隔夹层类型与测井曲线特征相对应(如图1),可以得到三种隔夹层对应的测井响应特征,其中泥质隔夹层测井响应特征为高伽马、高声波、低密度、高中子、低电阻率;钙质隔夹层测井响应特征为低伽马、低声波、高密度、低中子、高电阻率;物性隔夹层测井响应特征为中伽马、高密度、中声波、中高中子、低电阻率;按照隔夹层类别,对所有隔夹层对应井段的测井数据值取平均,形成不同类型隔夹层特征数据集。
[0050]
步骤二、隔夹层特征数据集归一化处理:对步骤一中获得的不同类型隔夹层特征数据集进行归一化处理。对数据集中自然电位(sp)、井径(cal)、自然伽马(gr)、声波(dt)、密度(den)、中子(cnc)测井数据进行归一化线性处理,具体公式(i)如下:
[0051][0052]
其中,shlg为需要归一化的上述任一测井数据,shlg
min
为对应的测井数据最小值,shlg
max
为对应的测井数据最大值,n
shlg
是归一化后的测井数据。
[0053]
对数据展布范围较宽的电阻率测井数据首先取对数后进行归一化处理,具体公式(ii)如下:
[0054][0055]
其中,n
rt
为归一化后的电阻率测井数据,rt为电阻率测井数据,rt
min
为电阻率测井数据最小值,rt
max
为电阻率测井数据最大值。
[0056]
步骤三、测井曲线敏感性分析:采用成对变量关系图法进行测井曲线敏感性分析(见图2和图3所示),其中,图2中n
sp
、n
gr
、n
cal
分别为利用步骤二归一化后自然电位,自然伽马和井径曲线;图3中n
cnc
、n
den
、n
dt
、n
rt
为利用步骤二归一化后的中子、密度、声波和电阻率曲线。通过成对变量关系图可以看出,井径(cal)、自然电位(sp)与三类隔夹层无明显相关关系,因此可以从样本中剔除,以达到剔除无关信息的目的。通过成对变量关系图分析,对三类隔夹层划分比较敏感的测井曲线为自然伽马、声波、密度、中子、电阻率共五条曲线。
[0057]
步骤四、隔夹层特征数据集样本平衡处理:对实例数据进行统计的,泥质隔夹层样本数为41,钙质隔夹层样本数为55,物性隔夹层样本数为34。为保证数据集中不同类型隔夹层样品数基本一致,对泥质隔夹层和物性隔夹层进行合成少数类过采样处理。
[0058]
首先对泥质隔夹层进行过采样处理,具体步骤如下:
[0059]
(1)随机选择泥质隔夹层的一个样本,计算其k近邻,选择k=5,
[0060]
(2)随机选择其k近邻中的一个泥质隔夹层样本,并在它们之间生成一个新合成的泥质隔夹层样本。可以通过如下公式(vi)来生成新的泥质隔夹层样本:
[0061]
新泥质隔夹层样本=泥质隔夹层样本+r
×
(随机选择的k近邻泥质隔夹层样本-泥质隔夹层样本)(vi)
[0062]
其中,r是(0,1)之间的一个随机数,用来控制生成的泥质隔夹层样本的空间位置。
[0063]
(3)将新生成的泥质隔夹层样本添加到原始数据集中
[0064]
重复这个步骤,直到新生成的泥质隔夹层样本数量达到14。
[0065]
接下来对物性隔夹层进行过采样处理,具体步骤如下:
[0066]
(1)随机选择物性隔夹层的一个样本,计算其k近邻,选择k=5,
[0067]
(2)随机选择其k近邻中的一个物性隔夹层样本,并在它们之间生成一个新合成的物性隔夹层样本。可以通过如下公式来生成新的合成样本:
[0068]
新物性隔夹层样本=物性隔夹层样本+r
×
(随机选择的k近邻物性隔夹层样本-物性隔夹层样本)
[0069]
其中r是(0,1)之间的一个随机数,用来控制生成的新物性隔夹层样本的空间位置。
[0070]
(3)将新生成的物性隔夹层样本添加到原始数据集中
[0071]
重复这个步骤,直到新生成的物性隔夹层样本数量达到21。
[0072]
步骤五:机器学习模型集成及模型评价:将多个组件学习器进行有效地结合,组建一个“学习器委员会”,其中每个学习器担任委员会成员并行使投票表决权,得到最终的隔夹层类型识别结果,具体流程如图4所示:将隔夹层特征数据集分别利用决策树、随机森林、支持向量机、朴素贝叶斯、knn进行训练,随后各自进行识别(分别对应识别结果1、识别结果2、识别结果3、识别结果4和识别结果5);最近进行投票,根据少数服从多数的原则,最终得到隔夹层类型识别结果。其中,用适当的性能指标对集成模型的预测结果进行评估,其中正确率计算公式(iii),如下:
[0073][0074]
其中,accuracy是正确率,n
correct
为被正确分类的样本个数,n
total
为总样本个数
[0075]
s1:对步骤四中得到的平衡后的隔夹层类别数据集按照8:2的比例分为训练集和测试集,使用平衡后的数据集训练和测试分类模型,可以得到更加准确的隔夹层分类结果。
[0076]
s2:利用决策树对训练集进行训练,并使用测试集对模型进行评估,正确率为87.18%;
[0077]
s3:利用随机森林方法对训练集进行训练,并使用测试集利用交叉验证技术对模型进行评估,正确率为88.87%;
[0078]
s4:利用支持向量机对训练集进行训练,并使用测试集利用交叉验证技术对模型进行优化和评估,正确率为92.44%;
[0079]
s5:利用朴素贝叶斯对训练集进行训练,并使用测试集利用交叉验证技术对模型进行优化和评估,正确率为87.64%;
[0080]
s6:利用knn对训练集进行训练,并使用测试集利用交叉验证技术对模型进行优化和评估,正确率为90.87%;
[0081]
s7:将步骤s2-s6中的训练模型的预测结果进行投票,得到最终的隔夹层类型识别结果,隔夹层识别正确率为95.75%,说明集成机器学习模型对隔夹层的识别正确率更高。
[0082]
步骤六、实际井资料应用:为了验证剩余油饱和度计算方法的准确性,对研究区某井进行处理解释,解释成果图见图5。图5中第一道是岩性测井道,包含自然伽马(gr)、自然电位(sp)、井径(cal)曲线,第二道为深度道,第三道为孔隙度测井系列道,包含声波测井(dt)、密度测井(den)和中子测井(cnc)曲线,第四道为电阻率测井道,包含深电阻率(rt)曲线,第五道为岩心描述获得的隔夹层类型,第六道为岩心描述结论,第七道为利用上述步骤识别的隔夹层类型,该实例中隔夹层类型识别结果与岩心描述隔夹层类型完全一致,证明了本发明提出判断隔夹层类型级别方法的准确性和适应性。
[0083]
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质。
技术特征:
1.一种基于测井曲线识别隔夹层类型的方法,其特征在于,包括以下步骤:步骤一、岩心刻度测井,构建不同类型隔夹层数据集:首先将钻井取心资料进行岩心归位,然后利用岩心描述得到的隔夹层类型与测井曲线特征相对应,获取隔夹层类型对应的测井测量数据集;步骤二、隔夹层特征数据集归一化处理:对步骤一中获得的隔夹层类型对应的测井测量数据进行归一化处理;步骤三、测井曲线敏感性分析:采用成对变量关系图法进行测井曲线敏感性分析,优选较好反映不同类型隔夹层的测井曲线;步骤四、隔夹层特征数据集样本平衡处理,改善后续模型的分类效果;步骤五:机器学习模型集成及模型评价,得到最终的隔夹层类型识别结果;步骤六:实际井资料处理,使用训练好的集成机器学习模型对新的数据进行预测,得到最终的分类结果。2.如权利要求1所述的基于测井曲线识别隔夹层类型的方法,其特征在于,步骤二中,所述隔夹层特征数据集归一化处理的具体步骤为:s1:对自然电位sp、井径cal、自然伽马gr、声波dt、密度den、中子cnc测井数据进行归一化线性处理,具体见公式(i)如下:其中,shlg为需要归一化的上述任一测井数据,shlg
min
为对应的测井数据最小值,shlg
max
为对应的测井数据最大值,n
shlg
是归一化后的测井数据;s2:对数据展布范围较宽的电阻率测井数据首先取对数后进行归一化处理,具体见公式(ii)如下:其中,n
rt
为归一化后的电阻率测井数据,rt为电阻率测井数据,rt
min
为电阻率测井数据最小值,rt
max
为电阻率测井数据最大值。3.如权利要求1所述的基于测井曲线识别隔夹层类型的方法,其特征在于,步骤四中,所述隔夹层特征数据集样本平衡处理的具体步骤为:s1:确定需要进行合成少数类过采样的隔夹层类型:查看步骤一获得的隔夹层类别与测井曲线对应的数据集,确定隔夹层类型数量,将样本分为多数类和少数类,对数据集中样本数量较少的隔夹层类别进行合成少数类过采样;s2:计算隔夹层少数类样本的k近邻:对于需要进行合成少数类过采样的隔夹层中的每个少数类样本,计算其k近邻;s3:生成新样本:对于每个少数类样本,根据其k近邻生成一些新的合成样本;对于每个少数类样本,随机选择其k近邻中的一个样本,并在其之间生成一个新的合成样本,通过如下公式(vi)来生成新的合成样本:新样本=少数类样本+r
×
(随机选择的k近邻样本-少数类样本)(vi)其中,r是(0,1)之间的一个随机数,用来控制生成的新样本在少数类样本与其k近邻样
本之间的位置;s4:将新样本添加到数据集中:将生成的新样本添加到原始数据集中,使得数据集中各个隔夹层类别的样本数量更加均衡。4.如权利要求1所述的基于测井曲线识别隔夹层类型的方法,其特征在于,步骤五中,所述评价的方法采用正确率对集成模型的预测结果进行评价,其中正确率计算公式(iii),如下:其中,accuracy是正确率,n
correct
为被正确分类的样本个数,n
total
为总样本个数。5.如权利要求1所述的基于测井曲线识别隔夹层类型的方法,其特征在于,步骤五中,所述机器学习模型集成及模型评价的具体步骤为:s1:对步骤四中得到的平衡后的隔夹层类别数据集划分为训练集和测试集;s2:利用决策树对训练模型进行训练,并利用正确率对模型进行评估;s3:利用随机森林方法对训练模型进行训练,并利用正确率对模型进行评估;s4:利用支持向量机方法对训练模型进行训练,并利用正确率对模型进行评估;s5:利用朴素贝叶斯方法对训练模型进行训练,并利用正确率对模型进行评估;s6:利用knn方法对训练模型进行训练,并利用正确率对模型进行评估;s7:将步骤s2-s6中的训练模型的预测结果进行投票,得到最终的隔夹层类型识别结果,并使用正确率对集成机器模型的预测结果进行评估。
技术总结
本发明提供了一种基于测井曲线识别隔夹层类型的方法;包括:步骤一、岩心刻度测井,构建不同类型隔夹层数据集;步骤二、隔夹层特征数据集归一化处理;步骤三、测井曲线敏感性分析;步骤四、隔夹层特征数据集样本平衡处理;步骤五:机器学习模型集成及模型评价,得到最终的隔夹层类型识别结果;步骤六:实际井资料处理,得到最终的分类结果。本发明所涉及的基于测井曲线识别隔夹层类型的方法与现有的二维交会图识别隔夹层方法相比,本发明方法在高维空间中对隔夹层类型进行识别,利用所有与隔夹层类型识别相关的测井曲线信息,识别精度更高,能够解决二维交会图方法隔夹层不可分的问题;本发明集成机器学习算法,能提高隔夹层类型识别正确率。型识别正确率。型识别正确率。
技术研发人员:赵建鹏 白佳乐 谭成仟 王琦 曹浩 寇培鑫
受保护的技术使用者:西安石油大学
技术研发日:2023.05.11
技术公布日:2023/8/23
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
