2. 长江大学 地球物理与石油资源学院, 武汉 430100
2. School of Geophysics and Oil Resources, Yangtze University, Wuhan Hubei 430100, China
由于低孔渗储层存在较致密、非均质性强的特点, 导致储层渗透率较小, 常规测井难以准确预测。核磁共振测井测量得到的横向弛豫时间谱(T2谱)中存在的孔隙结构信息十分丰富, 所以, 如何利用T2谱的丰富孔隙结构信息, 是预测储层渗透率精度的关键。
核磁共振测井渗透率模型可以分为三类:将横向弛豫时间谱(T2谱)分区间与渗透率建立统计关系或理论关系的模型[1-2]; 斯伦贝谢道尔研究中心(Schlumberger Doll Researchcenter, SDR)模型及其改进模型[3]; 与压汞资料结合, 利用各种孔隙结构计算渗透率的模型[4-10]。前两种模型均尝试用一个参数或几个参数描述整个T2谱的形态变化, 在低孔渗储层中, 孔隙结构复杂, T2谱的变化较大, 较少的参数难以表征这种变化。第三种模型未考虑储层含油气对T2谱形态的影响, 将这种影响也看作对孔隙结构变化的响应, 导致在油气层渗透率预测不准。上述三种模型均存在不适应于低孔渗储层渗透率预测的情况。
针对上述问题, 本文将T2谱作为输入, 渗透率作为输出, 利用本文提出的深度置信-极限学习机网络(Deep Belief Kernel Extreme Learning Machine Network, DBKELMN)进行函数的映射, 以确定T2谱与渗透率的函数关系并预测储层渗透率, 达到准确预测渗透率的目的。
1 深度置信-核极限学习机模型考虑到输入曲线维数高(对于斯伦贝谢仪器, T2谱由30维或64维数据组成)、模型复杂度强、含气矫正较为困难, 提出了利用深度学习方法对模型进行学习。深度学习理论认为, 浅层学习算法包括极限学习机(Extreme Learning Machine, ELM)、支持向量机(Support Vector Machine, SVM)、反向传播神经网络(Back Propagation Neural Network, BPNN)、径向基函数神经网络(Radial Basis Function Neural Network, RBFNN),由于隐层数过少导致难以表征较为复杂的函数关系;而深度学习模型由于能进行逐层特征提取, 具有强特征提取能力, 对复杂函数具有强大的学习能力。但是, 在石油勘探领域中, 深度学习算法还未引起重视。本文利用其抽象数据特征的能力进行高维数据的降维,利用其自动特征提取功能进行含气校正,利用其多隐层的特征进行复杂非线性渗透率模型的学习, 以期准确预测渗透率。
1.1 深度置信网络深度置信网络(Deep Belief Network, DBN)是一种半监督学习算法, 解决了深度神经网络难以优化的问题[11]。它由多层随机隐变量组成,其最底层单元的状态为输入曲线, 向上连接若干限制玻尔兹曼机(Restricted Boltzmann Machine, RBM)堆栈。训练时先输入若干维样本进行第一层RBM的训练, 并利用训练结果作为输入进行下一层RBM的训练, 以此类推逐层进行RBM的预训练, 最后利用误差反向传播算法去微调整个网络参数。RBM是一种特殊的玻尔兹曼机, 其对输入层与隐层连接进行了限制, 仅连接了输入层节点与隐层节点[12], 如图 1所示。假设所有输入曲线v和隐单元h均为二值变量, 即对于任意ij, 均有vi∈{0, 1}, hj∈{0, 1}。对于一组给定的节点(v, h), RBM系统定义能量函数:
$E\left( {v,h;\theta } \right) = \sum\limits_{i = 1}^n {{b_i}{v_i} - \sum\limits_{j = 1}^m {{c_j}{h_j} - \sum\limits_{i = 1}^n {\sum\limits_{j = 1}^m {{v_i}{W_{ij}}{h_j}} } } } $ | (1) |
其中:θ={ Wij, bi, cj}为RBM模型参数。基于该能量函数得到(v, h)的联合概率分布为:
$p\left( {v,h;\theta } \right) = {{\rm{e}}^{ - E\left( {v,h;\theta } \right)}}/Z\left( \theta \right),Z\left( \theta \right) = \sum\limits_{v,h} {{{\rm{e}}^{ - E\left( {v,h;\theta } \right)}}} $ | (2) |
其中Z(θ)称为归一化因子。
输入曲线层的边际分布为:
$p\left( {v\left| \theta \right.} \right) = \sum\limits_h {\left( {{{\rm{e}}^{ - E\left( {v,h;\theta } \right)}}/Z\left( \theta \right)} \right)} $ | (3) |
由于RBM的特殊结构, 可得到第j个隐单元的激活概率为:
$p\left( {{h_j} = 1\left| {v,\theta } \right.} \right) = \sigma \left( {{b_j} + \sum\limits_i {{v_i}{W_{ij}}} } \right)$ | (4) |
其中σ为sigmoid激活函数。
第i个可见单元的激活概率为:
$p\left( {{v_i} = 1\left| {h,\theta } \right.} \right) = \sigma \left( {{a_i} + \sum\limits_j {{W_{ij}}{h_j}} } \right)$ | (5) |
利用式(4) 计算隐层单元状态, 进而利用式(5) 确定可见单元vi取值为1的概率, 进而产生可见层的重构。本文即是利用该方法进行RBM的模型训练。
1.2 核极限学习机利用误差反向传播算法进行求解,其解有可能为局部极小解,而不是全局最优解,导致预测精度会受到影响, 即使存在预学习的方法, 仍无法彻底解决该问题。为此, 本文尝试将核ELM(Kernel ELM, KELM)作为预测器连接于DBN后, 提高预测精度。KELM结合了ELM的学习精度及计算效率的优势及核方法处理非线性不可分问题的优势, 是一种高效可靠的浅层模型, 其性能优于BPNN、SVM及ELM[13]。
对于数据集D={xp, tp}, xp为输入, tp为目标输出, 那么, 对于隐层节点数为L的ELM, 有输出:
$f\left( {{x_p}} \right) = \sum\limits_{i = 1}^L {{\beta _i}{h_i}\left( {{x_p}} \right) = \mathit{\boldsymbol{h}}\left( {{x_p}} \right)\mathit{\boldsymbol{\beta }}} $ | (6) |
其中: β=[β1, β2, …, βL]T, 为ELM隐层与输出层的权值向量; h(xp)=[h1(xp), h2(xp), …, hL(xp)]T为xp从n维输入空间映射到L维隐层特征空间的向量。那么, 根据KKT(Karush-Kuhn-Tucker)理论可知, ELM训练等同求解一对偶优化, 即:
${L_{{\rm{KELM}}}} = \frac{1}{2}{\left\| \mathit{\boldsymbol{\beta }} \right\|^2} + \frac{C}{2}\sum\limits_{p - 1}^N {\xi _p^2 - \sum\limits_{p - 1}^N {{\alpha _p}\left( {\mathit{\boldsymbol{h}}\left( {{x_p}} \right)\mathit{\boldsymbol{\beta }} - {t_\beta } - {\xi _p}} \right)} } $ | (7) |
其中:C为正则化系数; ζp为理论输出tp相对于实际输出f(xp)的误差; αp为Lagrange乘子。求解式(7), 可得:
$\mathit{\boldsymbol{\beta }} = {\mathit{\boldsymbol{H}}^{\rm{T}}}{\left( {\mathit{\boldsymbol{I}}/C + \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{H}}^{\rm{T}}}} \right)^{ - 1}}\mathit{\boldsymbol{T}}$ | (8) |
其中:T=[t1, t2, …, tN]T为输入样本的目标值向量。将式(8) 代入式(6) 得模型的输出为:
$\begin{array}{l} f\left( {{x_p}} \right) = \left[ {K\left( {{x_p},{x_1}} \right),K\left( {{x_p},{x_2}} \right), \cdots K\left( {{x_p},{x_N}} \right)} \right] \cdot \\ \quad \quad \quad {\left( {\mathit{\boldsymbol{I}}/C + \mathit{\boldsymbol{H}}{\mathit{\boldsymbol{H}}^{\rm{T}}}} \right)^{ - 1}}\mathit{\boldsymbol{T}} \end{array}$ | (9) |
其中K为核函数。由式(9) 可以看到, 模型输出结果与隐层数无关, 即KELM在使用中无需设定隐层数, 避免了模型确定时隐层数选择的盲目性。本文在进行建模时, 选用较为普遍的高斯核为算法中的核函数。
1.3 基于DBKELMN的NMR测井预测渗透率方法基于上述特点, 本文尝试将DBN与KELM结合, 提出了DBKELMN模型, 提升模型的稳定性、精度及泛化能力。在模型建立时, 首先提取核磁共振测井T2谱数据及对应的渗透率, 如图 2所示。
其中, 核磁共振测井T2谱原始数据一般已被离散化为30维或64维的数据, 利用离散化后的数据中孔隙度分量值作为T2谱的输入数据(由于采样时间点固定, 在选取输入样本的特征时, 可忽略采样时间值, 仅输入孔隙度分量)。
然后利用输入数据逐层对RBM进行预训练, 建立特征抽象层。将特征抽象层建立好之后, 将离散化T2谱输入, 并将特征抽象层对应的输出作为特征, 输入到核极限学习机中, 利用KELM中的核函数对特征进行映射, 并通过KELM网络, 得到最终输出, 而不进行参数的微调。借助DBN中的特征抽象层优势, 使得模型的特征提取能力更强, 对复杂函数的逼近能力更强。而KELM网络较快的训练速度, 以及较其他模型更强的泛化能力, 显著提高了DBKELM的适用性, 如图 3所示。在第2章中, 本文将通过某区块致密气储层资料证明该模型在精度与泛化能力的优势。
为了证明深度学习算法的有效性, 利用某区致密气储层资料进行模型的验证。利用9口井320块岩样进行绝对渗透率的测定并提取对应深度核磁共振测井T2谱。其中, 将7口井200块岩样数据设为训练样本, 另2口井(A1、A2) 块岩样数据设为预测样本。将数据进行归一化之后, 分别尝试建立KELM、DBN模型与DBKELMN模型。本文采用K交叉验证(K-Cross Validation, K-CV)方法进行交叉验证, 以有效避免过学习及欠学习的发生[14]。将200个训练样本均分为4组, 每组数据分别作1次验证集, 除此组以外的数据作为训练集。对DBN与KELM模型采用K折交叉验证(K-CV), 确定两模型的最优参数。最后确定的最适合于预测渗透率的KELM网络参数为:正则化系数2-2, 核参数240; 确定的DBN网络参数为:隐层数20、隐层神经元数30。隐层数与隐层神经元数较大的原因应归结为渗透率与T2谱关系复杂, 所以需要高隐层数去进行表征。
同样, 在DBKELMN网络中, 隐层数、不同的正则化系数C与核参数γ共同决定了网络的精度(相对于隐层数来说神经元数与精度相关性弱, 所以该处取DBN模拟得到的最优隐层神经元数30进行模拟)。通过对200样本进行K-CV模拟, 确定不同网络参数对预测精度的影响大小见图 4。通过图 4可以看出, 网络参数的改变对精度的改变并不大。随着正则化系数C的变大, 网络的稳定性逐渐变强; 而随着核参数γ的增大, 当大于2-6时, 网络精度提升; 而隐层数的变化与网络精度相关性很小, 存在隐层数大、精度变高的情况, 但是并不明显。根据模拟结果, 认为在该模型中, 正则化系数C等于215, 核参数γ等于215, 隐层数为15时, 模型的泛化能力最好, 预测精度最高。为了方便进行对比, 同时建立正则化系数不变、核参数不变、隐层数1、2、3、5、10层的模型, 并对预测样本进行处理, 以观察模型的效果。
同时, 建立1隐层20隐层单元的BPNN模型以及由1000个C4.5算法组成的随机森林(Random Forest, RF)模型同时进行学习, 并通过岩心数据确定SDR模型以及Coates模型系数,通过该储层验证井的预测精度高低评价模型的优劣。对A1井及A2井的120个预测样本评价结果如图 5所示。
由图 5来看, Timur模型与SDR模型明显对低孔渗储层渗透率预测能力不足, 这也是由于未考虑过多的储层微观参数所必然造成的结果。RF模型预测效果略好于其他浅层学习算法(BPNN模型、KELM模型), 说明对于地球物理问题来说, 集成算法能在一定程度上提高泛化能力, 而DBN模型效果是略优于其他模型的。从图 6来看, 本文提出的深度模型框架, 在参数合适的情况下, 预测精度是高于浅层模型的。比较2种深度学习模型评价结果, 可以看出, DBKELMN的泛化能力是优于DBN的, 预测精度较高, 如果利用集成算法进行集成, 精度有可能会进一步提高, 该思路可作为下一步研究方向。同时也可以看出, 15层网络模型的效果要优于其他模型。这是由于地球物理问题的特殊性所导致的, 地球物理问题虽由于成本的原因导致输入维数与样本数较小, 但是输入曲线与输出关系复杂, 且存在对应的物理关系, 所以即使模型层数较高, 精度也并不会降低, 反而是需要较多层数来表征复杂的函数关系。对应的A1、A2井不同模型预测平均绝对误差(Mean Absolute Error, MAE)结果统计见表 1。
从表 1可以得出, 在MAE指标上, DBKELMN模型得到的结果均优于其他模型, 多层网络的确能增加模型的精度。上述分析表明, DBKELMN模型预测精度优于其他模型, 可应用于对致密砂岩储层渗透率预测。
3 结语针对现有渗透率模型对核磁共振测井信息利用率不足导致的预测精度不高的问题, 本文提出了将T2谱作为输入, 渗透率作为输出, 利用函数逼近算法确定T2谱与渗透率的函数关系。该方法可准确预测低孔渗储层渗透率。同时, 将DBN模型与KELM模型进行融合, 提出了DBKELMN模型, 以原有模型改进训练速度与泛化能力的问题, 使其更适合于储层渗透率评价。在今后的工作中, 应主要针对深度学习算法在各类测井解释问题的适用性以及模型对样本数量的需求进行研究, 使深度学习模型能更好地为测井解释问题提供帮助。
[1] | 邵维志, 解经宇, 迟秀荣, 等. 低孔隙度低渗透率岩石孔隙度与渗透率关系研究[J]. 测井技术, 2013, 37(2): 149-153. (SHAO W Z, XIE J Y, CHI X R, et al. On the relation of porosity and permeability in low porosity and low permeability rock[J]. Well Logging Technology, 2013, 37(2): 149-153.) |
[2] | PETROBRAS T W, PETROBRAS C B, PETROBRAS N P, et al. Magnetic Resonance (NMR) approach for permeability estimation in carbonate rocks [EB/OL]. [2017-01-10]. https://www.onepetro.org/conference-paper/OTC-26338-MS. |
[3] | XIAO L, ZOU C C, MAO Z Q, et al. Tight-gas-sand permeability estimation from Nuclear-Magnetic-Resonance (NMR) logs based on the Hydraulic-Flow-Unit (HFU) approach [EB/OL]. [2017-01-10]. https://www.onepetro.org/journal-paper/SPE-167255-PA. |
[4] | XIAO L, LIU X P, ZOU C C, et al. Comparative study of models for predicting permeability from Nuclear Magnetic Resonance (NMR) logs in two Chinese tight sandstone reservoirs[J]. Acta Geophysica, 2014, 62(1): 116-141. |
[5] | RIOS E H, AZEREDO R B V, MOSS A K, et al. Estimating the permeability of carbonate rocks by principal component regressions of NMR and MICP data [C]//Proceedings of the SPWLA 56th Annual Logging Symposium. Long Beach, CA: [s.n.], 2015. |
[6] | WEI D F, LIU X P, HU X X, et al. Estimation of permeability from NMR logs based on formation classification method in tight gas sands[J]. Acta Geophysica, 2015, 63(5): 1316-1338. |
[7] | 成志刚, 罗少成, 杜支文, 等. 基于储层孔喉特征参数计算致密砂岩渗透率的新方法[J]. 测井技术, 2014, 38(2): 185-189. (CHENG Z G, LUO S C, DU Z W, et al. The method to calculate tight sandstone reservoir permeability using pore throat characteristic parameters[J]. Well Logging Technology, 2014, 38(2): 185-189.) |
[8] | RUSH D, LINDSAY C, ALLEN M. Combining electrical measurements and mercury porosimetry to predict permeability[J]. Petrophysics, 2013, 54(6): 531-537. |
[9] | 朱林奇, 张冲, 何小菊, 等. 基于动态孔隙结构效率的核磁共振测井预测渗透率方法[J]. 新疆石油地质, 2015, 36(5): 607-611. (ZHU L Q, ZHANG C, HE X J, et al. NMR logging permeability prediction method based on dynamic pore structure efficiency[J]. Xinjiang Petroleum Geology, 2015, 36(5): 607-611.) |
[10] | 朱林奇, 张冲, 胡佳, 等. 基于单元体模型的核磁共振测井渗透率评价方法[J]. 石油钻探技术, 2016, 44(5): 120-126. (ZHU L Q, ZHANG C, HU J, et al. An NMR logging permeability evaluation method based on the representative elementary volume model[J]. Petroleum Drilling Techniques, 2016, 44(5): 120-126.) |
[11] | HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507. DOI:10.1126/science.1127647 |
[12] | HINTON G E. Training products of experts by minimizing contrastive divergence[J]. Neural Computation, 2002, 14(8): 1771-1800. DOI:10.1162/089976602760128018 |
[13] | HUANG G B, ZHOU H M, DING X J. Extreme learning machine for regression and multiclass classification[J]. IEEE Transactions on Systems, Man, and Cybernetics, 2013, 43(2): 513-529. |
[14] | 江沸菠, 戴前伟, 董莉. 基于主成分-正则化极限学习机的超高密度电法非线性反演[J]. 地球物理学报, 2015, 58(9): 3356-3369. (JIANG F B, DAI Q W, DONG L. Ultra-high density resistivity nonlinear inversion based on principal component-regularized ELM[J]. Chinese Journal of Geophysics, 2015, 58(9): 3356-3369. DOI:10.6038/cjg20150928) |