
2. 中国石油化工股份有限公司天然气分公司, 北京 朝阳 100029;
3. 中国石油西南油气田分公司, 四川 成都 610000;
4. 西南石油大学石油与天然气工程学院, 四川 成都 610500
2. SINOPEC Gas Company, Chaoyang, Beijing 100029, China;
3. Southwest Oil and Gas Field, PetroChina, Chengdu, Sichuan 610000, China;
4. School of Oil & Gas Engineering, Southwest Petroleum University, Chengdu, Sichuan 610500, China
截至2015年,全球超过22%的能源由天然气供给[1],随着天然气在能源领域所占比例的增长,天然气管道的规模也迅速发展。由于气源和内腐蚀等原因,天然气管道中会不可避免地生成铁的硫化物和氧化物等微小的固体颗粒,这些颗粒统称为黑色粉末[2-3]。黑色粉末现今已成为一种全球常见的管道污染问题,对管内天然气流动造成诸多不利影响:固体颗粒会对管道和阀门造成冲蚀[4],过多的颗粒会导致管道、过滤器和阀门的堵塞,固体颗粒也会造成设备受损和其他管道流动问题[5]。颗粒的粒度分布(Particle Size Distribution,简称PSD)是描述黑色粉末的关键信息,掌握足够多的管内颗粒PSD有助于减少其对流动的不利影响,指导分离过滤设备的选型、帮助调整管道运行方案[6]以及准确模拟和预测黑色粉末的运动情况[7-8]。
一般情况下,天然气管道黑色粉末PSD的获取需建立在样本信息和适当的数学模型基础上。颗粒分布模型很多,各自有不同的特点和适用性。针对天然气管道中的颗粒,罗辛-拉姆勒(Rosin-Rammler,R-R)分布对于高斯分布的拟合度最优,国内外学者也将R-R分布作为实验研究中最常用的模型之一[9-11],然而,这些模型大多仅仅是依靠相关经验,没有给出更充分的依据。此外,管道内颗粒PSD模型的评价优选研究也十分匮乏。
本文选取了7种不同的分布模型,并应用于某一实际天然气管道内黑色粉末的PSD分析,分别对模型的拟合优度和预测能力进行评价。
1 颗粒流场常用PSD模型为获取某实际情况下的颗粒粒度分布,常用的方法是选用一种或几种数学统计模型作为目标粒度分布模型的基础,根据实验所测得的颗粒尺寸数据调整模型中的参数,最终得出针对该实际情况的粒度分布结果[12]。为选出与实际分布情况较为相近的数学模型,可根据描述对象的数学特性或类似条件下的相关经验进行选择。通过对气—固颗粒流动领域粒度分布模型的调研和归纳总结,本文最终选取了7种PSD数学模型用于天然气管道粒度分布模型的评价研究:高斯(正态)分布(Gaussian/Normal)、韦伯分布(Weibull)、R-R分布、对数正态分布(Log-Normal)、对数-拉普拉斯分布(Log-Laplace)、幂律分布(Power Law)和冈伯茨分布(Gompertz)模型。各模型的数学描述和应用情况如表 1所示。各模型的参数估计均基于经典统计学非线性最小二乘法[13]。
表1 气-固颗粒流场常用PSD模型 Table 1 Common PSD models used in gas-solid flow field |
![]() |
根据模型选择的一般标准,“好的”模型应同时具备简约性、可识别性、合适的拟合优度以及预测能力等性质[24]。本文所选用的7种描述天然气管道颗粒的PSD模型均是成熟且有一定应用实例的数学模型,其简约性及可识别性已被证实,本文模型的评价结果由各模型的拟合优度和预测能力决定。
2.1 拟合优度模型的拟合优度(Goodness of fit)描述的是观测值和通过模型获取的计算值之间的差异性,过低拟合和过度拟合都是影响模型准确性的不利因素。
拟合优度的概念:设
$ H_{0}: F \in{\psi_{0}} $ | (1) |
该假设的对立假设为
$ H_{1}: F \notin{\psi_{0}} $ | (2) |
或
$ F \in{\psi_{1}} $ | (3) |
式中:
取
(1)
(2)
因此,对样本总体
$ m\left( {{F_n}, {F^ * }} \right) = \mathop {\min }\limits_{F \in {\psi _0}} m\left( {{F_n}, F} \right) $ | (4) |
又由Glivenko-Cantelli定理可知,
在实际应用中,度量函数
均方根误差的计算方法为
$ S_{\text{RMSE}} = \sqrt{\sum \limits_{i = 1}^{n} \dfrac{\left (x_{i}-\hat x_{i} \right)^{2}}{n-k}} $ | (5) |
式中:
确定系数(也称判定系数)
$ {R^2} = \dfrac{{{S_{{\rm{ESS}}}}}}{{{S_{{\rm{TSS}}}}}} = 1 - \dfrac{{{S_{{\rm{RSS}}}}}}{{{S_{{\rm{TSS}}}}}} = 1 - \dfrac{{\sum\limits_{i = 1}^n {{{\left( {{x_i} - {{\hat x}_i}} \right)}^2}} }}{{\sum\limits_{i = 1}^n {{{\left( {{x_i} - {{\bar x}_i}} \right)}^2}} }} $ | (6) |
式中:
赤池信息量准则(最小信息准则)由赤池弘次提出,它通过对附加拟合参数施加惩罚以评价模型拟合情况,其计算方法为
$ I_{\text{AIC}}=2k-2 \ln L $ |
式中:
AIC准则建立在熵的概念基础上,可用以权衡所估计模型的复杂度以及判定模型拟合数据的优良性。根据该准则,应在备选模型中选择
参数模型的预测能力由观测值与模型预测值之间的差异决定。由于在对天然气管道黑色粉末颗粒PSD分析中,人们通常更关心颗粒尺寸的分布范围(而非某颗粒的确切尺寸值),本文使用混淆矩阵对各分布模型的预测能力进行判断。
混淆矩阵是数据分析和数据科学领域常用的一种可视化的分类效果示意图,它以矩阵的形式对数据按真实类别和预测结果进行汇总[27]。
图 1展示了一个二分类问题的混淆矩阵结构,其中,
![]() |
图1 二元分类混淆矩阵结构 Fig. 1 The confusion matrix of binary classify |
为了避免可能的人为因素对分类器造成不利影响,本文选择硬分类器对各模型的计算结果进行分类,并引入受试者工作特性曲线——ROC曲线(Receiver Operating Characteristic Curve)进行进一步的数据分析。
ROC曲线[28]出现于20世纪70年代,最早用于雷达目标检测领域,在医学研究领域得到了长足的发展[29-30],随后在识别模式、数据挖掘、机器学习等领域广泛应用。ROC曲线评估方法以其得天独厚的优势逐渐取代了经典的性能评估方法,作为一种规范成为评估分类器算法性能和比较不同分类器性能的主要工具[31]。本文取各模型分类结果中的
选用国内某分输站场高压天然气管道颗粒物在线检测粒度分布数据[32]作为总体样本(图 2),以此为基础进行模型评价。该样本描述了国内某长输天然气管道颗粒离线检测情况,管道的设计压力6.3 MPa、最大操作压力可达12.0 MPa;管道满足长输天然气气质要求:总硫
![]() |
图3 随机抽取的4组子样本 Fig. 3 Four random subsamples |
7个分布模型的拟合优度计算结果如表 2所示。
表2 基于总样本的各模型参数估计和拟合优度计算结果 Table 2 Results of model parameters and fitting goodness |
![]() |
根据表 2中各模型参数的标准误差值,几乎所有模型的参数估值误差都在1.0以下,7个模型的20个参数中仅有3个参数估计值的标准误差大于1.0,可以认为基于样本数据求得的各模型结果基本可靠,基于此结果的分析是准确的。
从表 2可以看出,韦伯、对数拉普拉斯和冈伯茨等3种模型的拟合优度指标最好(
![]() |
图4 各模型PSD曲线 Fig. 4 The PSD curves of the models |
韦伯、对数拉普拉斯和冈伯茨等3种模型虽然拟合情况较好,但在分布图中呈现出明显的区域优良性,即模型在模拟中小粒径(0~3.5 μm)分布时拟合效果良好、模拟较大尺寸颗粒(4.0~7.0 μm)拟合质量明显下降。在较大颗粒尺寸范围(3.5~7.0 μm),反而是R-R、对数正态和幂律函数的拟合表现更佳。仅从分布图上看,考虑整个粒度分布区域,对数正态分布模型对小粒径和较大粒径都具有一定的拟合效果,是综合拟合优度最好的模型。
3.3 预测能力评价结果PSD信息实质仍然是由离散的数据组成,每一种粒径就代表了一种颗粒,其数量极为庞大,且无法直接使用分类器进行分类。为解决这一问题,本文根据总体样本数据各尺寸范围颗粒数量的分布,将总样本的颗粒尺寸范围人为地切割成Ⅰ—Ⅴ等5段,每段内的颗粒数量相等,均占颗粒总量的20%,这样的划分原则保证了各粒径区间内的颗粒比例不会影响评价结果。此时每段颗粒对应的粒径范围分别为:Ⅰ段[0.30,0.92) μm;Ⅱ段[0.92,1.24) μm;Ⅲ段[1.24,1.53) μm;Ⅳ段[1.53,3.00) μm;Ⅴ段[3.00,7.25] μm。此时的分类器为5元分类器,对应需要5类ROC分析,ROC空间中的点将变成
为将其转化为被普遍接受的两类ROC分析,本文采用一对多ROC分析方法[33],假设C是所有类别的集合,ROC图中第
![]() |
图5 各模型预测能力ROC图(基于样本1) Fig. 5 The ROC analysis of predictive ability for the models(Based on sample 1) |
![]() |
图6 各模型预测能力ROC图(基于样本2) Fig. 6 The ROC analysis of predictive ability for the models(Based on sample 2) |
![]() |
图7 各模型预测能力ROC图(基于样本3) Fig. 7 The ROC analysis of predictive ability for the models (Based on sample 3) |
![]() |
图8 各模型预测能力ROC图(基于样本4) Fig. 8 The ROC analysis of predictive ability for the models (Based on sample 4) |
图 5~图 8中的ROC外壳曲线是从点(0,0)自左向右依次以直线段连接至点(1.0,1.0)而形成的一条曲线。ROC外壳曲线必须具有两点基本性质:(1)在保证拥有一个单调递减斜率的条件下尽量多地经过ROC空间中的点;(2)曲线上方不能再出现点。位于图 5~图 8中反对角线(随意猜测线)以下的点被判定为没有预测能力,称为无效模型。
位于点(0,0)和(1.0,1.0)处的模型称为理想模型,在本文中也视为无效模型。出现在凸外壳下方的点意味着该模型即使有效,但在该数据集上无法获得最优性能。处于凸外壳上的点表示该模型在某些类别分布比例和错误代价的条件下可以获得最优的性能,称为限制性最优模型。
本文正例数量为负例的1/4,错误代价比为1,因此,以一条斜率为4(错误代价比/正负样例分布比例)的直线、从左上角沿着ROC空间的对角线(左上—右下)平行移动,最先与这条直线相交的点就是在此条件下的最优模型,称为条件最优模型。为便于读者查看ROC分析结果,将图 5~图 8中的关键信息总结于表 3中。
表3 模型预测能力评价结果总结 Table 3 Results of the predictive ability of models |
![]() |
(1) 拟合优度方面,当样本数据呈现出颗粒粒度明显集中的情况(大部分颗粒尺寸聚集在一个小的分布区间上),高斯、韦伯、对数拉普拉斯分布和冈伯茨等模型占优;对样本呈现分布较为均衡的情况,R-R、对数正态分布和幂律模型占优。若缺乏样本数据(即对管道颗粒分布情况未知),对数正态模型因为其兼具描述集中分布和平均分布的能力而更具优势。
(2) 各分布模型的预测能力与其所应用的粒径范围有很大关系。幂律分布模型和对数拉普拉斯模型在粒径较小[0.30 μm,1.24 μm)时具有较强的预测能力。在中等粒径[1.24 μm,3.00 μm)时,对数正态分布模型处于一枝独秀的局面。在较大粒径[3.00 μm,7.25 μm]时,对数正态分布的表现仍然优异,同时,R-R模型也凸显出较强的预测能力。由于对数正态模型是本文所给定条件下唯一一个适用于所有样本和粒径范围的有效模型,因此,认为对数正态模型是综合预测能力最强的模型。
(3) 根据具体的应用环境,各分布模型都有各自的优越性和局限性。针对本文天然气管道黑色粉末,综合两个方面的评价结果,对数正态模型是相对较优的PSD模型,但仍应根据具体的情况,如粒径(斯托克斯数)范围,样本具体信息等进行合理的选择,在样本量允许的情况下选取多种模型进行试算是较为理想的方法。
[1] |
EIA. International energy outlook 2017[R/OL]. (2017-9-14)[2017-9-15]. US Energy Information Administration: USA.
|
[2] |
BALDWIN R. The characteristics of black powder in gas pipelines and how to combat the problem[J]. Corrosion Prevention & Control, 2000, 47(4): 95-102. |
[3] |
SHERIK A M. Black powder in gas transmission pipelines[M]//REVIE W R. Oil and gas pipelines: Integrity and safety handbook. John Wiley & Sons, Inc. 2015: 423-436.
|
[4] |
SHERIK A M, EL-SAADAWY E. Erosion of control valves in gas transmission lines containing black powder[J]. Mater. Perform, 2013, 52(5): 70-73. |
[5] |
KHAN T S, AL-SHEHHI M S. Review of black powder in gas pipelines-An industrial perspective[J]. Journal of Natural Gas Science & Engineering, 2015, 25: 66-76. doi: 10.1016/j.jngse.2015.04.025 |
[6] |
HOEKSTRA A J, DERKSEN J J, AKKER H E A V D. An experimental and numerical study of turbulent swirling flow in gas cyclones[J]. Chemical Engineering Science, 1999, 54(13-14): 2055-2065. doi: 10.1016/s0009-2509-(98)00373-x |
[7] |
MOGHADASI J, MÜLLER-STEINHAGEN H, JAMIALAHMADI M, et al. Theoretical and experimental study of particle movement and deposition in porous media during water injection[J]. Journal of Petroleum Science & Engineering, 2004, 43(3-4): 163-181. doi: 10.1016/j.petrol.-2004.01.005 |
[8] |
CROWE C T. Review-numerical models for dilute gasparticle flows[J]. Asme Transactions Journal of Fluids Engineering, 1982, 104(3): 297-303. doi: 10.1115/1.3241835 |
[9] |
黄诗嵬. 天然气集输管道弯头冲蚀磨损研究[D]. 成都: 西南石油大学, 2016. HUANG Shiwei. Study on erosion wear at the elbow of gas-gathering lines[D]. Chengdu: South West Petroleum University, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10615-1016098722.htm |
[10] |
KHAROUA N, ALSHEHHI M, KHEZZAR L. Prediction of black powder distribution in junctions using the discrete phase model[J]. Powder Technology, 2015, 286: 202-211. doi: 10.1016/j.powtec.2015.07.045 |
[11] |
KHAROUA N, ALSHEHHI M, KHEZZAR L. Effects of fluid flow split on black powder distribution in pipe junctions[J]. Advanced Powder Technology, 2016, 27(1): 42-52. doi: 10.1016/j.powtec.2015.07.045 |
[12] |
BAYAT H, RASTGO M, ZADEH M M, et al. Particle size distribution models, their characteristics and fitting capability[J]. Journal of Hydrology, 2015, 529: 872-889. doi: 10.1016/j.jhydrol.2015.08.067 |
[13] |
薛毅, 陈丽萍. 统计建模与R软件[M]. 北京: 清华大学出版社, 2007. XUE Yi, CHEN Liping. Statistical modeling and R software[M]. Beijing: Tsinghua University Press, 2007. |
[14] |
张泉. 北京地区大气颗粒物粒度分布特征与多环芳烃含量[D]. 北京: 北京大学, 2011. ZHANG Quan. The particle size distribution and polycyclic aromatic hydrocarbons of atmospheric particulates in the beijing area[D]. Beijing: Peking University, 2011. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y2023098 |
[15] |
万益, 黄薇薇, 郑成航, 等. 湿式静电除尘器喷嘴特性[J]. 浙江大学学报(工学版), 2015, 49(2): 336-343. WAN Yi, HUANG Weiwei, ZHENG Chenghang, et al. Spray characteristics of wet electrostatic precipitator[J]. Journal of Zhejiang University (engineering Science), 2015, 49(2): 336-343. doi: 10.3785/j.issn.1008-973X.-2015.02.021 |
[16] |
BRYANT G, MARTIN S, akin BUDI A, et al. Accurate measurement of small polydispersities in colloidal suspensions[J]. Langmuir, 2003, 19(3): 15-16. doi: 10.1021/-la026636g |
[17] |
郑钢镖, 康天合, 柴肇云, 等. 运用Rosin-Rammler分布函数研究煤尘粒径分布规律[J]. 太原理工大学学报, 2006, 37(3): 317-319. ZHENG Gangbiao, KANG Tianhe, CHAI Zhaoyun, et al. Research on distribution regularity of coal dust using rosin-rammler distribution function[J]. Journal of Taiyuan University of Technology, 2006, 37(3): 317-319. doi: 10.-3969/j.issn.1007-9432.2006.03.018 |
[18] |
ULUSOY U, IGATHINATHANE C. Particle size distribution modeling of milled coals by dynamic image analysis and mechanical sieving[J]. Fuel Processing Technology, 2016, 143: 100-109. doi: 10.1016/j.fuproc.2015.11.007 |
[19] |
HEINTZENBERG J. Properties of the log-normal particle size distribution[J]. Aerosol Science and Technology, 1994, 21(1): 46-48. doi: 10.1080/02786829408959695 |
[20] |
KOZUBOWSKI T J, PODGÓRSKI K. Log-laplace distributions[J]. Internat. Math. J, 2003, 3(4): 467-495. |
[21] |
李睿, 肖明, 李志浩, 等. 粒径呈幂律分布的颗粒气体中的速度分布特性[J]. 华中师范大学学报(自然科学版), 2014, 48(1): 49-52. LI Rui, XIAO Ming, LI Zhihao, et al. The properties of velocity distributions in granular gases with a powe-law size distribution[J]. Journal of Huazhong Normal University (natural Sciences), 2014, 48(1): 49-52. doi: 10.19603/j.-cnki.1000-1190.2014.01.010 |
[22] |
GROUT H, TARQUIS A M, WIESNER M R. Multifractal analysis of particle size distributions in soil[J]. Environmental Science & Technology, 1998, 32(32): 1176-1182. doi: 10.1021/es9704343 |
[23] |
SANG I H, LEE K P, DONG S L, et al. Models for estimating soil particle-size distributions[J]. Soil Science Society of America Journal, 2002, 66(4): 1143-1150. doi: 10.2136/sssaj2002.1143 |
[24] |
SCLOVE S L. Application of model-selection criteria to some problems in multivariate analysis[J]. Psychometrika, 1987, 52(3): 333-343. doi: 10.1007/bf02294360 |
[25] |
段晓君, 王正明. 基于选择准则的参数模型评价方法[J]. 国防科技大学学报, 2003, 25(3): 62-65. DUAN Xiaojun, WANG Zhengming. Parametric model evaluation based on the selection criterion[J]. Journal of National University of Defense Technology, 2003, 25(3): 62-65. doi: 10.3969/j.issn.1001-2486.2003.03.015 |
[26] |
刘璋温. 赤池信息量准则AIC及其意义[J]. 数学的实践与认识, 1980(3): 64-72. LIU Zhangwen. Akaike's information criterion (AIC) and its significance[J]. Mathematics in Practice and Theory, 1980(3): 64-72. |
[27] |
米爱中, 张盼. 一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版), 2017, 36(2): 116-121. MI Aizhong, ZHANG Pan. A method of classifier selection based on confusion matrix[J]. Journal of Henan Polytechnic University (Natural Science), 2017, 36(2): 116-121. doi: 10.16186/j.cnki.1673-9787.2017.02.019 |
[28] |
FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2005, 27(8): 861-874. |
[29] |
SWETS J A. ROC analysis applied to the evaluation of medical imaging techniques[J]. Investigative Radiology, 1979, 14(2): 109-121. doi: 10.1097/00004424-197903000-00002 |
[30] |
METZ C E. ROC methodology in radiologic imaging[J]. Investigative Radiology, 1986, 21(9): 720-733. doi: 10.-1097/00004424-198609000-00009 |
[31] |
孙长亮. 基于ROC曲线的ATR算法性能评估方法研究[D]. 长沙: 国防科技大学, 2006. SUN Changliang. Study of ATR algorithm performance evaluation method based on ROC curve[D]. Changsha: National University of Defense Technology, 2006. http://cdmd.cnki.com.cn/Article/CDMD-90002-2007140037.htm |
[32] |
许乔奇, 姬忠礼, 刘刚, 等. 高压天然气管道内颗粒物在线检测结果校正方法[J]. 过程工程学报, 2012, 12(5): 870-875. XU Qiaoqi, JI Zhongli, LIU Gang, et al. Experimental research on online determination technology of particles in high pressure natural gas pipeline[J]. The Chinese Journal of Process Engineering, 2012, 12(5): 870-875. |
[33] |
骆名剑. 基于ROC的分类算法评价方法[D]. 武汉: 武汉科技大学, 2005. LUO Mingjian. Research of classification algorithm evaluation based on ROC[D]. Wuhan: Wuhan University of Technology, 2005. http://cdmd.cnki.com.cn/Article/CDMD-11915-2006031243.htm |