随着地震勘探技术的不断发展, 对地震资料解释的要求越来越高, 而地震层位的追踪是地震解释工作的重中之重。因为实际地质层位一般和地震剖面上的同相轴相对应, 所以可以通过追踪地震波同相轴来实现地震层位的拾取。由于地震反演需要通过地震层位构建的低频模型做约束条件, 因此地震层位的准确拾取对地震反演至关重要, 对储层预测起到关键作用。传统的地震层位追踪方法依据地震波运动学和动力学特征进行人工对比追踪[1], 但是随着大规模三维地震数据的不断增多, 人工拾取极其费时费力, 且效率低、准确性差, 有必要利用自动化方法来实现同相轴的自动追踪。这不仅能提高工作效率, 还可以增加追踪结果的准确性。
多年来, 国内外许多学者致力于地震层位追踪研究, 如:张银凤等[2]提出了用模糊聚类方法实现层位自动对比的方法; 周冠雄等[3]提出了一种新的AR(auto regressive)自动追踪技术, 第一次将AR模型用来描述同相轴, 并完成了同相轴的AR自动追踪; 陆文凯等[4]采用非监督学习的自组织神经网络拾取同相轴; AURNHAMMER等[5]利用遗传算法解决了同相轴在断层位置自动拾取的难题; 彭文等[6]提出了一种利用四阶累计函数对人工追踪的层位进行相关计算的层位自动追踪方法; 许景新等[7]提出了一种新的三维地震反射面自动追踪算法, 将三维地震数据转换为三维灰度图像, 这样可以根据数据大小的变化, 自适应地进行反射面追踪; 李鹏等[8]应用Roberts, Sobel, Prewitt, Log和Canny图像边缘检测算子追踪同相轴, 经过实际资料的应用, 发现Log和Canny算子追踪同相轴的效果要远远好于Roberts, Sobel及Prewitt算子; PAUGET等[9]利用成本函数求最优解的方法将相邻地震点相连, 从而达到拾取同相轴的目的; 杨微等[10]提出将Hilditch细化算法应用到地震数据的处理解释中, 来检测同相轴; BAKKE等[11]提出了地震DNA算法。
地震DNA算法是一种非局部的同相轴检测方法[12], 将地震资料中的数值信息转换成字符信息, 然后通过正则表达式逐道对目标信息进行匹配, 从而找到具有相似信息的地震波, 来达到拾取地震层位的目的。虽然该方法将难以匹配的数值信息转化为较容易匹配的字符信息, 使其可以在整个数据空间中搜索目标信息, 但该算法在匹配时会将搜索范围内所有满足条件的DNA片段全部搜索出来, 导致匹配出的地震波信息比较杂乱且地震层位划分不够明显。因此, 我们针对此问题提出了一种改进方法, 将聚类引入到地震DNA算法中, 对地震DNA算法所找到的地震波进行分类连接, 使其具有更好的连续性。最后利用胜利油田某二维叠后地震数据对改进后的算法进行了测试。
1 地震DNA算法的基本原理在生物信息学中使用DNA搜索技术来检测出想要查找的碱基对序列的位置, 地震DNA算法是受DNA搜索技术的启发而产生的。地震DNA算法的核心是使地震数据具有文本数据的特点, 这样就可以像搜索文本数据那样搜索地震数据。正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串, 其通常被用来检索或替换符合某个模式的文本, 这种技术主要应用于文本搜索当中。
地震DNA算法的基本流程如图 1所示, 其核心方法主要分为以下两步。
![]() |
图 1 地震DNA算法的基本流程 |
第一步, 转换(Translation), 目的是将输入的数值信息转换为字符信息。从数值空间到字符空间的转换过程由一个转换因子完成。转换因子为每个字符分配一个独特的数值范围, 如:
![]() |
(1) |
式中:字符“a”和“c”分别表示[min, 0.5) 和(0.5, max]内的数值, 分别代表波谷和波峰区域的数值; 字符“b”表示[0.5, 0.5]内的数值, 代表地震资料中零交叉点区域的数值。
第二步, 使用正则表达式构建搜索模式。特征因子(Gene)由一系列字符排列而成, 定义字符在搜索中允许被搜索以及字符在序列中可以被重复的次数。例如, 可以使用正则表达式a{2, 3}b{0, 1}c{4, 5}来定义特征因子。这个正则表达式搜索的是a, b, c的组合, 其中{2, 3}, {0, 1}, {4, 5}分别代表a, b, c的个数范围, 左右数字分别代表该字符的最小和最大出现次数, 符合这个范围内的所有字符串都将被匹配出来。如a{2, 3}b{0, 1}c{4, 5}可以匹配出的字符串为aacccc, aabcccc, aaaccccc, aaabcccc, aaaccccc, aaabccccc, aaccccc和aabccccc的8种组合方式。
在使用正则表达式搜索时字符的零重复也是一种有效匹配, 利用这一特性, 可以让一些子特性在一个有效的匹配中出现或者不出现, 从而构建更为复杂的匹配模式。地震DNA技术并不限定输入数据, 只要是数值数据都可以输入, 比如可以使用振幅数据或频率数据来实现地震层位的拾取[13]。
2 地震DNA算法存在的问题地震DNA算法在对特征进行匹配时逐道进行, 所以在搜索范围内所有符合条件的信息都会被搜索出来, 因此使用该算法匹配出符合条件的字符串较多, 从而导致匹配出的地震层位连续性较差, 且层位划分不够明显, 很难区分找到的地震波是否属于同一个地震层位。例如将图 2a中的某一小段地震信息通过设置转换因子a[-1.0, -0.2), b[-0.2, 0.2], c(0.2, 1.0]将其转换成如图 2b所示的字符空间, 通过设置正则表达式b{3, 6}c{5, 8}b{4, 7}搜索到的符合条件的DNA片段如图 2c所示。由于字符“c”代表(0.2, 1.0]之间的数值, 因此可以近似地将所匹配出字符串中间位置的“c”作为波峰位置。比如找到的片段为“bbbbcccccbbbbb”, 那么第3个“c”所在的位置可以近似看作是其波峰位置。图 2d为最后得出的波峰位置的点集。比较图 2a和图 2d可以看出, 最后拾取到的同相轴在740ms左右和840ms左右位置的连续性较差。
![]() |
图 2 地震DNA算法演示结果 a 地震剖面; b 字符空间; c 符合条件的DNA片断; d 波峰位置的点集 |
鉴于地震DNA算法匹配出的地震层位连续性差和断层位置容易串层等问题, 本文引进聚类连接的方法对地震DNA算法进行改进。首先用聚类的方法将通过地震DNA算法所找到的波峰位置的散点进行分类, 然后使用欧式距离将聚类好的点进行连接, 并利用C3相干算法找出并屏蔽掉断层区域, 从而提高地震DNA算法拾取地震层位的连续性和准确性。
3.1 聚类采用聚类的方法对地震DNA算法所找到的散点进行分类。首先对第1道上的散点进行搜索, 如果搜索到n个点, 就暂时分为n类(A1, A2, …, An), 然后再遍历第2道。在遍历第2道时先判断找到的散点是否属于第1道上的n类中的一种, 因为是相邻道之间匹配, 因此可以用时间差Δt来判断是否属于同一类。若时间差小于阈值, 则说明其属于同一类, 则将其放入相应的类中。如果小于阈值的数多于一个, 则将其归入与其差值最小的那类当中。若没有小于阈值的数, 则再增加一个新的类An+1, 并将其归入An+1中。一直遍历到最后一个地震道, 这样可以将每一个地震道上连续且邻近的点连接起来, 如图 3a所示。
![]() |
图 3 聚类(a)和连接(b)后的效果 |
通过聚类的方法可以将距离相近的散点连接起来。为了进一步提高连续性, 将距离较远且在同一地震层位上的点连接起来。如果没有断层, 一般来说地震层位连续, 所以地震波之间的欧氏距离是判定地震波是否在同一个地震层位上的重要依据, 因此本文采用欧氏距离作为较远点之间连接的约束条件。
连接时, 首先将所找到的每一类的第1个点的坐标位置和最后一点的坐标位置记录下来, 然后将每类的最后一点的坐标位置与其它类的第1个点的坐标位置进行欧式距离计算。在二维时间域地震数据中点的坐标用时间和道号来表示, 其欧氏距离公式为:
![]() |
(2) |
式中:Jr, Tr为每一类中最右边地震道上点的道号和时间; Jl, Tl为其它类最左边地震道上点的道号和时间。在计算出所有的欧氏距离后, 需要设置阈值。为了避免串层, 一般将时间的范围设置小一些, 道范围设置大一些。使用最短距离原则[14]查找在阈值范围内距离最小的值, 将其连接起来, 连接效果如图 3b所示。对比图 3b与图 2d可以看出, 聚类连接的方法提高了层位的连续性。
3.3 断层识别使用欧氏距离进行连接时, 在断层位置很容易出现串层现象, 所以在应用聚类连接方法时应先将断层区域进行屏蔽, 防止在断层区域形成串层。目前常用的断层识别方法有蚁群追踪算法[14]、波形分析技术[15]、相干体技术[16]等, 本文采用C3相干算法来实现断层的检测。相干数据体是用来计算由构造、地层、岩性等各种地质因素引起的地震响应横向变化的一种方法, 可以突出相邻地震道的不连续性, 压制其连续性, 使各种地质构造异常和岩性变化的显示更加清晰、直观[17]。假设λj(j=1, 2, …, J)是协方差矩阵的第j个特征值, 其中λ1是其最大特征值, 则C3相干算法的计算公式为:
![]() |
(3) |
将图 4a中的某一小段含有断层的地震信息划分成区域为19×19的矩阵, 进行C3相干计算, 得到的黑色区域即为断层区域(图 4b)。图 4c为采用聚类连接方法但未屏蔽掉断层区域得到的层位拾取结果。采用C3相干算法屏蔽掉断层区域以后的层位拾取结果从图 4c中可以看出, 在断层区域有很明显的串层现象。图 4d为采用C3相干算法屏蔽掉断层区域以后的层位拾取结果。从图 4d中可以看出, 在断层区域层位都是断开的, 基本没有串层现象。对比图 4c和图 4d可以看出, 屏蔽掉断层区域后得到的层位拾取结果更加准确。
![]() |
图 4 有无屏蔽断层区域所拾取到的层位对比 a 含有断层的地震剖面; b C3相干计算得到的断层区域; c 采用聚类连接方法但未屏蔽掉断层区域得到的层位拾取结果; d 采用 C3相干算法屏蔽掉断层区域以后的层位拾取结果 |
改进后的地震DNA算法流程如图 5所示, 其主要步骤如下。
![]() |
图 5 改进的DNA算法流程 |
1) 输入二维地震数据, 利用中值滤波[18]、边缘定向增强扩展[19]等方法对输入的地震数据进行降噪处理;
2) 设置转换器将振幅组成的数值数据空间转换成字符数据空间, 然后设置特征因子并对字符数据空间进行检索, 找出符合条件的数据,最后求被检索出的字符串c的中间位置, 将其近似地作为波峰位置;
3) 利用C3相干算法在数值空间中进行计算, 找到并屏蔽掉断层区域; 然后设置Δt的阈值来对求出的散点进行聚类, 观察聚类后的结果, 看是否出现串层。若出现串层, 则调整Δt阈值重新进行聚类, 否则进行下一步。
4) 设置d, x, y的阈值, 对距离较远的点进行连接, 观察结果是否出现串层, 若出现串层, 则调整d, x, y的阈值重新进行连接, 否则输出拾取到的同相轴。
5) 采用人工判断的方法将断层区域两侧进行连接, 并修改细节完成同相轴的最终提取。
5 应用实例选择胜利油田某工区二维叠后地震数据(图 6)测试本文方法的有效性, 此方法对于时间域和深度域的地震数据均适用, 本文采用时间域地震数据进行试验。
![]() |
图 6 胜利油田某工区二维叠后地震数据 |
在将振幅信息转换成字符信息前需要先对地震数据进行降噪, 接着将地震振幅信息进行归一化处理, 以确保地震振幅范围在[-1.0, 1.0], 然后将振幅空间按照转换规则a[-1.0, -0.2), b[-0.2, 0.2], c(0.2, 1.0]转换成为字符空间。图 7为转换完成以后的DNA字符数据空间。设置搜索的正则表达式为a{0, 9}b{1, 3}c{4, 10}b{2, 5}a{0, 11}, 搜索出符合条件的字符串序列如图 8所示。从图 8中可以看出, 用地震DNA算法搜索出的同相轴连续性较差, 且在断层两侧出现了串层。
![]() |
图 7 字符数据空间 |
![]() |
图 8 地震DNA法找到的地震层位 |
使用聚类连接方法对地震DNA算法找到的数据进行处理。首先将数据空间划分为若干个49×49的矩阵, 对其进行C3相干运算[20], 结果如图 9所示。对其中的黑色区域进行屏蔽, 然后设置Δt的阈值为(0, 5) 来完成聚类, 设置d, x, y的阈值分别为(0, 6), (0, 15), (0, 5) 来完成连接, 得到的结果如图 10所示。对比图 8和图 10可以看出, 使用了改进的DNA算法后, 同相轴在断层两边没有进行连接且同相轴的连续性有明显增强。
![]() |
图 9 C3相干算法找到的断层区域 |
![]() |
图 10 利用改进的地震DNA算法处理后的地震层位 |
地震DNA算法是一种新的地震层位拾取方法, 可以一次追踪多个地震层位, 相较于传统的相关追踪、线性插值等算法, 该算法提高了层位追踪的效率, 具有广阔的应用前景。但由于其搜索出符合条件的信息较多, 从而导致其匹配到的地震层位连续性较差, 且层位划分不够明显。本文针对此问题提出了一种改进算法, 该算法将聚类连接的方法引入到地震DNA算法中, 对通过地震DNA算法所找到的地震层位进行分类连接。实际地震数据的应用结果表明, 改进后的地震DNA算法所提取的同相轴更连续, 地震层位更加准确。
[1] |
许建华, 王世库, 赵廷寿. 用链匹配算法自动拾取同相轴[J].
石油物探, 1990, 29(2): 13-23 XU J H, WANG S K, ZHAO T S. Picking the events automatically by chain matching algorithm[J]. Geophysical Prospecting for Petroleum, 1990, 29(2): 13-23 |
[2] |
张银凤, 黄延祜. 模糊聚类分析方法在地震层位自动对比中的应用[J].
石油物探, 1989, 28(2): 13-25 ZHANG Y F, HUANG Y K. The application of ambiguous clustering analysis to seismic horizon automatic contrast[J]. Geophysical Prospecting for Petroleum, 1989, 28(2): 13-25 |
[3] |
周冠雄, 胡志成. 地震剖面图同相轴的AR自动追踪方法[J].
自动化学报, 1991, 17(3): 359-362 ZHOU G X, HU Z C. AR-method for automatically tracking syncphase axis of the seismic cross-section graph[J]. Acta Automatica Sinica, 1991, 17(3): 359-362 |
[4] |
陆文凯, 牟永光. 用自组织神经网络实现地震同相轴自动追踪[J].
石油物探, 1998, 37(1): 77-83 LU W K, MU Y G. Seismic event automatic tracking using self-organizing neural network[J]. Geophysical Prospecting for Petroleum, 1998, 37(1): 77-83 |
[5] | AURNHAMMER M, TONNIES K D. A genetic algorithm for automated horizon correlation across faults in seismic images[J]. IEEE Transactions on Evolutionary Computation, 2005, 9(2): 201-210DOI:10.1109/TEVC.2004.841307 |
[6] |
彭文, 熊晓军, 韩小俊. 基于高阶统计量的层位自动追踪方法[J].
新疆石油地质, 2006, 27(6): 743-745 PENG W, XIONG X J, HAN X J. Automatic tracing of horizons based on higher order statistics[J]. Xinjiang Petroleum Geology, 2006, 27(6): 743-745 |
[7] |
许景新, 刘显德. 一种三维地震反射面自动追踪算法及其应用[J].
大庆石油学院学报, 2007, 31(4): 73-75 XU J X, LIU X D. An automatic track algorithm and application of 3D seismic-reflecting surface[J]. Journal of Daqing Petroleum Institute, 2007, 31(4): 73-75 |
[8] |
李鹏, 冯晅, 王典, 等. 地震剖面同相轴自动追踪技术研究[J].
吉林大学学报(地球科学版), 2008, 38(S1): 76-79 LI P, FENG Y, WANG D, et al. Auto Tracking the Syncphase Axis of Seismic Profiles[J]. Journal of Jilin University(Earth Science Edition), 2008, 38(S1): 76-79 |
[9] | PAUGET F, LACAZE S, VALDING T. A global approach in seismic interpretation based on cost function minimization[J]. SEG Technical Program Expanded Abstracts, 2009, 28(1): 2592-2596 |
[10] |
杨微, 陈可洋. 利用图像细化算法检测地震反射同相轴[J].
复杂油气藏, 2011, 4(2): 31-34 YANG W, CHEN K Y. The seismic reflection cophasal axes checked by using image thin algorithm[J]. Complex Hydrocarbon Reservoirs, 2011, 4(2): 31-34 |
[11] | BAKKE J Ø H, GRAMSTAD O, SØNNELAND L.Seismic DNA-a novel seismic feature extraction method using non-local and multi-attribute sets[R]. Copenhagen:74th EAGE Conference and Exhibition Incorporating Europec, 2012, DOI:10.3997/2214-4609.20148249 |
[12] |
罗红梅. 地震DNA地层超剥点线识别技术及应用[J].
石油物探, 2016, 55(3): 414-424 LUO H M. Stratigraphic pitching-out point and line identification technology based on seismic DNA and its application[J]. Geophysical Prospecting for Petroleum, 2016, 55(3): 414-424 |
[13] |
向东进, 李宏伟, 刘小雅.
实用多元统计分析[M]. 武汉: 中国地质大学出版社, 2005: 1-184.
XIANG D J, LI H W, LIU X Y. Applied multivariate statistical analysis[M]. Wuhan: China University of Geosciences Press, 2005: 1-184. |
[14] |
严哲, 顾汉明, 蔡成国, 等. 利用方向约束蚁群算法识别断层[J].
石油地球物理勘探, 2011, 46(4): 614-620 YAN Z, GU H M, CAI C G, et al. Identification of faults by using direction constrained ant colony algorithm[J]. Oil Geophysical Prospecting, 2011, 46(4): 614-620 |
[15] |
师永民, 祁军, 张成学, 等. 应用地震波形分析技术预测裂缝的方法探讨[J].
石油物探, 2005, 44(2): 128-130 SHI Y M, QI J, ZHANG C X, et al. Discussion of the method of applying seismic waveform analysis techniques to predict fracture[J]. Geophysical Prospecting for Petroleum, 2005, 44(2): 128-130 |
[16] |
孙夕平, 杨国权. 三维地震相干体技术在目标区沉积相研究中的应用[J].
石油物探, 2004, 43(6): 591-594 SUN X P, YANG G Q. Application of 3D seismic coherence cube technology to target area sedimentary facies research[J]. Geophysical Prospecting for Petroleum, 2004, 43(6): 591-594 |
[17] |
杨立强, 郝天珧, 宋海斌, 等. 应用小波变换和C3相干算法检测地震剖面同相轴[J].
物探化探计算技术, 2004, 26(4): 302-305 YANG L Q, HAO T Y, SONG H B, et al. Seismic event detection based on wavelet transtorm and c3 coherence algorithm[J]. Computing Techniques for Geophysical and Geochemical Exploration, 2004, 26(4): 302-305 |
[18] |
赵高长, 张磊, 武风波. 改进的中值滤波算法在图像去噪中的应用[J].
应用光学, 2011, 32(4): 678-682 ZHAO G C, ZHANG L, WU F B. Application of improved median filtering algorithm to image de-noising[J]. Journal of Applied Optics, 2011, 32(4): 678-682 |
[19] |
钟勇, 孙东, 陈磊. 图像增强技术在地震资料处理中的应用[J].
物探与化探, 2010, 34(3): 392-395 ZHONG Y, SUN D, CHEN L. The application of the image enhancement technology to seismic data processing[J]. Geophysical & Geochemical Exploration, 2010, 34(3): 392-395 |
[20] |
苑书金. 地震相干体技术的研究综述[J].
勘探地球物理进展, 2007, 30(1): 7-15 YUAN S J. A review of seismic coherence techniques[J]. Progress in Exploration Geophysics, 2007, 30(1): 7-15 |