2. 中国石油大学(北京), 北京 102249
2. China University of Petroleum, Beijing 102249, China
地震相是三维空间中特定沉积体地震反射参数的综合响应, 在相变带地震反射参数(如反射结构、振幅、连续性、频率和层速度)与相邻单元不同, 因此它产生的反射特征变化表征了沉积物的岩性组合、层理和沉积特征的变化。BROWN等[1]首次提出基于三维地震时间切片分析和解释沉积相的方法; WOLFGANG[2]提出利用三维地震技术研究古代沉积形态平面展布的基本方法, 并将古代沉积在地震时间切片上的响应与现代的密西西比河三角洲的航拍照片进行对比, 所采用的方法和POSAMENTIER等[3]提出的等比例切片方法类似。ZENG等[4-7]提出了相关地层切片的方法, 利用理论模型研究和实际资料解释结果验证了方法的应用效果, 并首次定义了“地震沉积学”的概念。主流的地层切片技术主要利用地震振幅属性进行地震相划分, 但受地震数据分辨率和信噪比的影响, 地震振幅属性在实际应用中存在不确定性和多解性的问题。目前, 较为先进的地震相划分方法是基于机器学习的地震相定量分析方法, 主要包括有监督聚类方法和无监督聚类方法[8-9]。有监督聚类方法根据有限的钻井资料和地震资料建立训练分类器, 然后使用该训练器对无井区域的地震资料进行预测, 由于训练样本较少, 难以建立地震波形/地震属性与已知的储层含气性特征的准确模型, 因而预测精度低[10-12]。徐海等[13]提出了在高精度层序地层格架约束条件下基于波形相对变化的波形-微相定量表征综合解释技术, 该技术先利用主成分分析法(principal component analysis, PCA)降维, 而后采用有监督和无监督自组织网络(self-organizing map, SOM)神经方法实现波形聚类分析。李辉等[14]采用自组织网络神经波形聚类的方法识别主河道、河道侧翼等不同叠合模式下的砂体边界。白博等[15]先对反映贝壳灰岩内部反射特征的伪阻抗体进行计算, 而后对伪阻抗波形展开聚类分析, 预测了贝克灰岩的展布。刘爱群等[16]在利用分频属性分析确定砂体边界的基础上, 结合已知油气田的波形特征, 展开聚类分析而后确定有利储层。林年添等[17]利用不同卷积核卷积升维形成各类纵、横波地震属性, 然后利用聚类分析法进行无监督学习实现纵、横波地震属性降维, 再将聚合属性作为支持向量机的学习集进行含油气储层地震预测。陈雷等[18]提出了一种基于相似性传播聚类与主成分分析的地震断层识别方法, 并利用该方法对断层进行“量化”解释。本文引入了基于无监督机器学习条件下基于密度的含噪声应用波形空间聚类(density-based spatial clustering of applications with noise, DBSCAN)方法开展地震相分析。与K均值聚类方法和层次聚类方法不同, DBSCAN方法作为典型的基于密度的无监督机器学习聚类分析方法, 它将簇定义为密度相连的点的最大集合, 将满足条件的高密度区域划分为簇[19-20]。该方法无需事先确定地震波形聚类类别数, 可有效识别噪声点, 并可满足空间中任意分布的波形聚类, 既提高了聚类分析精度也增强了抗噪能力。本文先以地震解释的基准参考面为基础, 基于地震沉积学原理制作等时地层切片, 然后沿地层切片在一定时窗范围内提取地震波形, 再对特征波形进行标准化处理并输入DBSCAN程序, 以实现基于无监督机器学习的波形聚类地震相分析, 最后根据三维地层物理模型试验和实际资料处理结果, 验证方法的有效性和适用性。
1 技术方法 1.1 DBSCAN方法DBSCAN方法是一种既适用于凸样本集, 又适用于非凸样本集的典型密度聚类方法, 利用样本集中类的密度连通性, 快速发现任意形状的样本类别。该方法的密度连通性涉及邻域、密度阈值、核心点和边界点、密度直达、密度可达、密度相连、密度分类、噪声点等参数。
对于任意样本集S=(s1, s2, …, sm), 则其邻域(ε)内的最小样本点数, 即密度阈值(MinPts)的具体含义如下。①邻域(ε):对于任意的样本点sj∈S, 其邻域是指以sj为圆心, 以ε为半径的区域内包含的样本点的集合。②密度阈值(MinPts):对于空间中任意的样本sj∈S, 其密度阈值是以该点为圆心, 以ε为半径的区域内包含的最小样本点数目, Nε(sj)={D(si, sj)≤ε|(si, sj)∈S}, 其中D为sj与ε内任意一点si的距离, Nε(sj)为最小样本点个数。
在核心点密度可达的条件下, 搜寻到的最大密度相连的样本子集S=(s1, s2, …, sn), n≤m为DBSCAN方法中密度聚类的某个类簇, 其中m是用于聚类分析的样本个数, n是某个类簇样本子集的样本个数。DBSCAN方法的类簇核心点可以是一个或多个。对于单核心点, 样本子集S=(s1, s2, …, sn), n≤m内的非核心点都在核心对象的邻域内; 对于多个核心点, 样本子集S=(s1, s2, …, sn), n≤m内的任意一个核心点的邻域中一定包含其它核心点, 否则该核心点无法实现密度可达条件。
1.2 DBSCAN方法流程对于多个核心点的样本集, 首先选择任意一个没有类别的核心点si∈S为种子点, 寻找该核心点密度可达条件下的样本子集形成一个聚类簇C1=(c11, c12, …, c1n), n≤m; 然后选择另一个没有类别的核心点sj∈S, 寻找该核心点密度可达条件下的样本子集, 形成另一个聚类簇C2=(c21, c22, …, c2n), n≤m, 如此这般, 直到所有核心点都实现类别分类。对于一些不位于任何核心点邻域内的异常样本点按噪声点处理。DBSCAN方法中的距离度量思想和K-近邻分类算法的最近邻思想相同, 多采用欧氏距离、曼哈顿距离、切比雪夫距离等度量。对于某些样本点, 其到达两个核心点的距离都小于ε, 且两个核心点均不符合密度可达条件, 故不属于同一类簇。针对这种情况, DBSCAN方法根据先来后到的顺序, 采用先进行聚类的类簇标记该样本点, 因此DBSCAN方法并非完全稳定。
图 1中给定邻域和密度阈值(MinPts=5), 红色样本点为核心点, 黑色样本点为非核心点, 可以看出以邻域为半径, 红色核心样本点为中心的圆形区域内的样本点满足密度直达条件, 不在该圆形区域内的样本点不满足密度直达条件。图 1中绿色箭头连接的核心点为满足密度可达条件的样本序列, 在邻域内该序列的所有样本点密度相连, 因此这些点可划分为同一类簇。
为了展示DBSCAN方法对非凸数据集聚类的优势, 生成1组3簇随机数据, 其中两组是非凸的。图 2a为3簇随机数据, 图 2b是对图 2a数据采用K均值聚类方法进行聚类分析的结果, 图 2c是对图 2a数据采用DBSCAN方法进行聚类分析的结果。从聚类分析结果看, 采用K均值聚类方法对非凸数据集聚类分析的结果不理想, 而采用DBSCAN方法可以准确区分3类样本, 得到满意的聚类分析结果。从本例可以看出, 对于非规则隐蔽型储集体如河道砂体等, 其空间展布的形态往往是非凸的, 采用DBSCAN方法进行聚类分析, 可获得良好的聚类分析结果。
和数值模拟相比, 三维地震物理模拟所获得的地震记录更接近实际情况, 其研究成果可靠性强, 且经济高效。为了研究南海深水区砂岩储层的空间展布规律, 我们结合实际情况设计了相应的三维地层物理模型, 在考虑地质条件合理性的同时, 尽量让模型与真实沉积层序接近且具备一定的地层复杂性。设计的三维地层物理模型空间比例尺为1:10000, 实际地质体大小为8000m×6400m×2200m, 共有5个砂层, 砂层厚度为5~15m不等, 各砂层的形态和空间分布不同。表 1为三维地层物理模型的纵、横波速度和密度, 该模型及其在水槽中摆放方式如图 3所示, 图 4为该模型第1~6层的砂体自上而下的空间分布情况, 图 5为该模型砂体垂向剖面。由于三维地层物理模型中的砂体薄且形状各异, 因此制作地层切片的关键在于选择具有地质时间意义的反射界面。图 6为某条主测线的克希霍夫积分时间偏移的地震剖面及等时地层切片解释剖面的叠合显示。
机器学习算法通常需要假设特征数据符合正态分布规律, 即满足零均值且单位方差呈高斯分布, 为此需要对输入数据进行标准化处理, 使其满足正态分布。我们选择Scikit-Learn的开源数学库中的StandardScalar程序对输入数据进行标准化处理[21], 将Inline41中的200道波形曲线作为样本输入聚类分析程序(图 7)。
自下向上逐层浇筑形成三维地层物理模型, 高速砂岩由环氧树脂添加滑石粉制成。图 8a是第1层“蛇形”砂体顶、底叠置显示的平面形态, 黄色区域代表砂岩底面, 白色区域代表砂岩顶面。在实际制作中, 由于模型误差和环氧树脂添加滑石粉时无法保证混合均匀, 因此导致砂体介质传播速度的变化。图 8b是沿地层切片提取的均方根(root mean square, RMS)振幅属性, 可用于描述砂体的展布和形态, 但无法分辨砂体顶、底面。图 8c、图 8d、图 8e和图 8f分别是不同邻域和密度阈值参数下采用DBSCAN方法得到的波形聚类属性, 该方法可用于描述砂体的空间展布及顶、底边界的范围。当邻域和密度阈值变化时, 波形聚类属性明显不同, 因此如何合理确定邻域和密度阈值是应用DBSCAN方法的关键, 其参数优选相对于传统的K均值聚类算法略显复杂, 需对邻域和密度阈值展开联合调试, 但无需事先确定聚类类别数。分析可知, 随着邻域和密度阈值的同时增大, 聚类类别数变小; 用于分类的子波样点数, 即波形向量的维度, 与分类结果相关。
图 9a是第3层“肠状”砂体和“椭圆形”泥岩顶、底叠置显示的平面形态展布, 黄色区域代表砂岩底面, 白色区域代表砂岩顶面。图 9b是沿地层切片提取的均方根振幅属性, 可以用于划分地层空间展布形态。图 9c和图 9d均为采用DBSCAN方法得到的波形聚类属性, 其“肠状”砂体和“椭圆形”泥岩平面形态展布刻画较RMS振幅属性更加精确, 但采用不同的邻域和密度阈值得到的波形聚类属性明显不同。无论是均方根振幅属性还是聚类分析属性, 都无法区分“肠状”砂岩和“椭圆形”泥岩的岩性, 这与该模型制作过程中, 砂、泥岩材料弹性参数差异不明显有一定关系。
从上述分析可以看出尽管该模型的砂层非常薄, 但通过地层切片得到的地震相水平分辨率高。因模型在浇铸过程中不能均匀成型, 导致砂层中砂体的背景介质不均匀, 故该模型除砂体之外的部分也存在相带的变化。利用均方根振幅属性进行地震相划分得到的相带变化的边界不是特别清晰, 未能显示出某些局部相带的变化; 利用波形聚类属性进行地震相描述得到的结果更详细, 对地震相带变化的划分更精确。将地震沉积学原理与无监督机器学习条件下的DBSCAN方法相结合, 可进一步提高地震相划分的精度。
2.2 实际资料地震相分析实际地震资料来自琼东南盆地深水区某目标区, 该区内未钻井, 目标储层为具有强反射特征的砂岩储集体, 在地震剖面上表现为强振幅反射特征。
以地震解释得到的特征反射格架层T50, T60, T70, T100为基础, 根据地震沉积学原理, 将上述特征反射格架层细分为相应的地层切片, 图 10为目标区联络测线855的地层切片解释剖面。图 11是解释层位T100的等t0结果, 可以看出目标区东南部是构造高点, 西北部是构造斜坡带。
图 12a是全角度叠加的地震数据沿T100层切片的RMS振幅属性, 可以看出在构造高部位和斜坡带均呈强振幅反射特征。单凭RMS振幅属性细分强反射特征差异困难, 因此对不同角度道集叠加的地震数据沿T100层切片提取的RMS振幅属性展开分析(图 12b、图 12c和图 12d), 可以看出在构造高部位和斜坡带均有明显的AVO特征; 将从大角度道集叠加地震数据提取的RMS振幅属性与小角度叠加地震数据提取的RMS振幅属性相比发现, 尽管存在强反射特征差异, 仅利用RMS振幅属性很难将这些差异通过相带划分表达。为划分不同反射特征的地震相带, 我们采用DBSCAN方法对T100层进行聚类分析(ε=0.3, MinPts=5, 波形向量为21维)。图 13a是全角度叠加的地震数据沿T100层切片的波形聚类属性, 从属性分布可以看出, 构造高点反射特征被分为3类, 斜坡带反射特征被分为5类, 其中构造高部位的黄色区域分布着目标储集体, 但该方法无法区分不同类型的强振幅反射特征。对不同角度道集叠加的地震数据沿T100层切片展开DBSCAN分析, 得到的小角度道集叠加地震数据沿T100层切片的波形聚类属性和大角度道集叠加地震数据沿T100层切片的波形聚类属性差异明显(图 13b、图 13c和图 13d), 这预示着不同角度道集叠加地震数据沿层切片的波形聚类属性可反映AVO特征。从图 13d可以看出, 斜坡带和构造高点被分为不同的类。在构造高点波形聚类属性被分为3类:构造高部位斜坡带的黄色区域可能分布着含气潜山风化壳储集体, 构造低部位的储集体波形聚类属性被分为其余2类。由此可见, 利用不同角度道集叠加地震数据沿地层切片展开DBSCAN分析, 可解决全角度叠加地震数据沿地层切片展开聚类分析时无法区分有效储层的问题, 因而为储层预测奠定了基础。
三维地层物理模型的实验结果表明, 在合理选择参考地震同相轴的情况下, 将地震沉积学原理与基于密度的含噪角道集波形聚类方法相结合, 可显著提高地层切片的横向分辨率。与基于RMS振幅属性的地震相分析技术相比, 采用本文方法进行相边界划分的精度高。邻域和密度阈值是DBSCAN方法的重要参数, 需要联合调试优选参数, 不同的参数组合对聚类分析的结果影响大。实际地震资料处理时, 在综合考虑AVO效应差异的前提下, 对全角度和不同角度道集叠加的地震数据沿地层切片进行DBSCAN分析可知, 该方法不但可以增加地震相划分的可靠性, 还可以区分相同类型储层的含气性差异。本文方法具有强鲁棒性和高横向分辨率的特征, 是储层相变分析和沉积相研究的辅助工具。实际应用中需要注意以下3点:①联合优选参数邻域时, 应根据已知信息(如井、岩相标定、沉积模式、储层预测成果等)调整参数; ②地层切片的解释和划分将直接影响聚类分析结果的精度和可靠性; ③聚类分析的波形向量维度和储层厚度相关, 需针对储层特征, 合理选择波形向量维度。
[1] |
BROWN A R, DAHM C G, GRAEBNER R J. A stratigraphic case history using three-dimensional seismic data in the Gulf of Thailand[J]. Geophysical Prospecting, 1981, 29(3): 327-349. DOI:10.1111/j.1365-2478.1981.tb01017.x |
[2] |
WOLFGANG S. The future of applied sedimentary geology[J]. Journal of Sedimentary Research, 2000, 70(1): 2-9. DOI:10.1306/2DC408F8-0E47-11D7-8643000102C1865D |
[3] |
POSAMENTIER H W, DORN GA, COLEM J, et al.Imaging elements of depositional systems with 3D seismic data: A case study: Gulf Coast Section SEPM Foundation[C]//17th Annual Research Conference.Houston: Gulf Coast Section SEPM, 1996: 213-228
|
[4] |
ZENG H L, BACKUS M M, BARROW K T, et al. Stratal slicing, Part Ⅰ:Realistic 3-D seismic model[J]. Geophysics, 1998, 63(2): 502-513. DOI:10.1190/1.1444351 |
[5] |
ZENG H L, HENRY S C, RIOLA J P. Stratal slicing, Part Ⅱ:Real 3-D seismic data[J]. Geophysics, 1998, 63(2): 514-521. DOI:10.1190/1.1444352 |
[6] |
ZENG H L, HENTZ T F, WOOD L J. Stratal slicing of Miocene-Pliocene sediments in Vermilion Block 50-Tiger Shoal area, offshore Louisiana[J]. The Leading Edge, 2001, 20(4): 408-418. DOI:10.1190/1.1438962 |
[7] |
ZENG H L, AMBROSE W A. Seismic sedimentology and regional depositional systems in Mioceno Norte, Lake Maracaibo, Venezuela[J]. The Leading Edge, 2001, 20(11): 1260-1269. DOI:10.1190/1.1487259 |
[8] |
HALL B. Facies classification using machine learning[J]. The Leading Edge, 2016, 35(10): 906-909. DOI:10.1190/tle35100906.1 |
[9] |
AKTEP E, BOYD J. Seismic waveform classification:Techniques and benefits[J]. CSEG Recorder, 2004, 35(3): 26-29. |
[10] |
COLEOU T, POUPON M, AZBEL K. Unsupervised seismic facies classification:A review and comparison of techniques and implementation[J]. The Leading Edge, 2003, 22(10): 942-953. DOI:10.1190/1.1623635 |
[11] |
BHATTACHARYA S, CARR T R, PAL M. Comparison of supervised and unsupervised approaches for mudstone lithofacies classification:Case studies from the Bakken and Mahantango-Marcellus Shale, USA[J]. Journal of Natural Gas Science & Engineering, 2016, 33(5): 1119-1133. |
[12] |
SAGGAF M, MARHOON M. Seismic facies mapping by competitive neural networks[J]. Expanded Abstracts of 71st Annual Internat SEG Mtg, 2001, 1544-1547. |
[13] |
徐海, 都小芳, 高君, 等. 基于波形聚类的沉积微相定量解释技术研究[J]. 石油物探, 2018, 57(5): 744-755. XU H, DU X F, GAO J, et al. Quantitative interpretation of sedimentary microfaacies based on waveform clustering:a case study of X Oilfield, Middle East[J]. Geophysical Prospecting for Petroleum, 2018, 57(5): 744-755. DOI:10.3969/j.issn.1000-1441.2018.05.014 |
[14] |
李辉, 罗波, 何雄涛, 等. 基于地震波形聚类储集砂体边界识别与预测[J]. 工程地球物理学报, 2017, 14(5): 573-577. LI H, LUO B, HE X T, et al. Boundary identification and prediction of sand body based on seismic waveform[J]. Chinese Journal of Engineering Geophysics, 2017, 14(5): 573-577. DOI:10.3969/j.issn.1672-7940.2017.05.011 |
[15] |
白博, 舒梦珵, 康洪全, 等. 基于伪阻抗体波形聚类的贝克灰岩储层预测方法[J]. 物探化探计算技术, 2015, 37(6): 724-727. BAI B, SHU M C, KANG H Q, et al. Coquina reservoir prediction method of seismic pseudo-impedance waveform clustering[J]. Computing Techniguess for Gepohysical and Geochemical Exploration, 2015, 37(6): 724-727. DOI:10.3969/j.issn.1001-1749.2015.06.09 |
[16] |
刘爱群, 陈殿远, 任科英. 分频与波形聚类分析技术在莺歌海盆地中深层气田区的应用[J]. 地球物理学进展, 2013, 28(1): 338-344. LIU A Q, CHEN D Y, REN K Y. Frequency decomposition and waveform cluster analysis techniques Yinggehai Basin gas field in the deep area of application[J]. Progress in Geophysics, 2013, 28(1): 338-344. |
[17] |
林年添, 付超, 张栋, 等. 无监督与监督学习下的含油气储层预测[J]. 石油物探, 2018, 57(4): 601-610. LIN N T, FU C, ZHANG D, et al. Supervised learning and unsupervised learning for hydrocarbon prediction using multiwave seismic data[J]. Geophysical Prospecting for Petroleum, 2018, 57(4): 601-610. DOI:10.3969/j.issn.1000-1441.2018.04.015 |
[18] |
陈雷, 肖创柏, 禹晶, 等. 基于相似性传播聚类与主成分分析的断层识别方法[J]. 石油地球物理勘探, 2017, 52(4): 826-833. CHEN L, XIAO C B, YU J, et al. Fault recognition based on affinity propagation clustering and principal component analysis[J]. Oil Geophysics Prospecting, 2017, 52(4): 826-833. |
[19] |
郭兆裕.脉冲雷达信号分选算法加速技术研究[D].哈尔滨: 哈尔滨工业大学, 2018 GUO Z Y.Research on acceleration technology of pulse radar signal sorthing algorithm[D]. Harbin: Harbin Institute of Technology, 2018 http://cdmd.cnki.com.cn/Article/CDMD-10213-1018893102.htm |
[20] |
韩兴磊.住宅非侵入式负荷监测算法研究[D].广州: 华南理工大学, 2018 HAN X L.Research on non-intrusive load monitoring algorithms in residential building[D]. Guangzhou: South China University of Technology, 2018 http://cdmd.cnki.com.cn/Article/CDMD-10561-1018872246.htm |
[21] |
COURNAPEAU D, BRUCHER M.Scikit-Learn[EB/OL].[2019-04-23]. https://scikit-learn.org/stable
|