2. 北京世纪隆博科技有限责任公司, 北京 100020
2. Beijing Century Robust Technology Co. Ltd., Beijing 100020, China
目前对于超声波中药提取中的提取浓度检测大多数采用人工化验和仪器离线检测的方法,缺少简单、方便、实用的在线检测手段,其中主要是提取率的离线检测制约了超声波提取设备的工艺优化,从而难以稳定高效地测量提取过程中的有效成分[1]。
在中药提取过程中如何建立有效的软测量预测模型是实现在线检测的关键。在过程工业里,许多化学量(直接测量量)难以通过仪表直接快速地进行在线测量[2]。近年来软测量技术得到了快速发展,软测量主要通过选择与直接测量变量间有间接联系的一组或多组易测量的间接变量建立两者之间的函数变换关系,来计算所选择的输入变量对主导变量的估计值[3]。Wu等[4]使用广义回归神经网络对发酵过程进行软测量建模,得到了较高的测量精度;Wang等[5]使用基于前馈神经网络软测量方法对浮选工艺中精矿品位和尾矿回收率进行预测,仿真结果验证了此模型可以满足浮选工艺在线软测量仪表的实时性要求;刘翠翠等[6]使用主元分析法对输入变量进行降维,再使用支持向量机对研磨过程中的粉煤进行建模,取得了不错的效果。李建强等[7]针对电站锅炉烟气含量难以直接测量的问题,使用遗传算法和支持向量机对其进行建模,得出软测量值与实验值的误差在4%以内,测量精度较高。以上文献都是针对软测量的理论和方法研究,而在中药提取浓度检测方面,将建立的软测量模型与硬件系统结合的研究鲜见报道。
本文借鉴文献中对锅炉效率实时测量[8]、火力发电机风流量测量[9]及汽车油耗测量[10]方面基于adranced RISC machine(ARM)的软测量仪表实现方法,针对中药提取过程的建模及其以后的在线测量问题,采用了遗传算法(genetic algorithm,GA)和支持向量机(support vector machine,SVM)相结合的方法,建立葛根素提取过程的软测量模型,并提出了基于嵌入式系统的在线测量方法,通过将建立的软测量模型固化到基于ARM的在线检测系统,完成了智能化算法的硬件实现,并实现了葛根素提取率在线实时检测。
1 葛根提取过程的软测量建模 1.1 间接(辅助)变量选择超声波双频萃取植物药葛根素的工艺过程中, 影响超声波萃取工艺的主要因素有液固比m、双频超声强度I1和I2、超声波占空比d、乙醇体积分数φ、萃取温度T和萃取时间t。不同的工艺配比会得到不同的提取效果。葛根素的提取率η与其他因素之间的关系可表述为
$ \eta = f\left( {{I_1},{I_2},d,m,\varphi ,t,T} \right) $ | (1) |
在双频超声波提取过程中,多数工艺参数保持不变,只有萃取温度随时间增加而增加,因此在本文的软测量建模中,选取萃取温度和萃取时间为间接(辅助)变量,并作为模型输入;选取萃取率为直接(主导)变量,作为模型输出。
1.2 实验数据采集实验选择双频超声波的工作频率分别为28kHz和40kHz,超声波占空比4:1,液固比40:1,提取液体积分数为70%的酒精。对葛根中的葛根素进行萃取实验,共获得6组实验数据,每组实验数据包含14个样本点。取样的方法为:前5min内每隔1min采样一次,5~16min内每隔3min采样一次,16~41min每隔4min采样一次。对采集的样本用紫外分光光度计(UV-2012PC,尤尼柯(上海)仪器有限公司)测量吸光度,通过测量标准液在不同浓度下的吸光度,确定吸光度A与萃取液浓度K的关系
$ A = 0.0901K - 0.0025 $ | (2) |
得到的提取率η1与K的换算公式为
$ {\eta _1} = \frac{{KV}}{m} \times 100\% $ | (3) |
式中,K为溶液浓度,mg/L;V为萃取液总体积,L;m为葛根质量,g。
1.3 遗传算法原理遗传算法由Holland于1975年首先提出,该算法源于进化论和群体遗传学,是一种通过模拟自然进化过程搜索最优解的方法。算法主要步骤如下[11]:
1) 初始化 随机生成初始种群,并设置交叉概率p、最大迭代次数N和个体数量M;
2) 个体评价 建立定量评估个体的性能指标,在每次种群更新完成后计算各个个体的适应值;
3) 设计遗传算子 即设计选择、交叉、变异算子,将算子依次作用于群体,形成新一代群体;
4) 对新的群体重复进行步骤2)、3)的迭代,直到达到精度要求或停止条件;
5) 终止条件 达到最大迭代次数后,选取适应度最小的个体作为优化后的最优值输出。
1.4 预测模型建立由于人工化验采集的样本数据少,本文采用适合于小样本的SVM建模方法。通常,SVM的惩罚系数与其模型稳定性有关[12],惩罚系数过大能提升学习精度,但容易造成过拟合的问题;惩罚系数过小可以提高泛化能力,但会增大学习误差。核函数参数与SVM模型中的支持向量(support vector,SV)数量有关。核函数参数越小,SV的数量越少;核函数参数越大,SV的数量越多。
支持向量机的目标函数关系如式(4)
$ f\left( {\omega ,\xi } \right) = \frac{1}{2}{\left\| \omega \right\|^2} + C\sum\limits_{i = 1}^n {{\xi _i}} $ | (4) |
式中,ω为SVM的权值系数,n为SV的数量,ξi为松弛变量,C为待优化的惩罚系数。支持向量机模型的核函数采用RBF核函数,形式如下
$ K\left( {\mathit{\boldsymbol{x}},{\mathit{\boldsymbol{x}}_i}} \right) = {{\rm{e}}^{ - g{{\left\| {\mathit{\boldsymbol{x}} - {\mathit{\boldsymbol{x}}_i}} \right\|}^2}}} $ | (5) |
式中,g为待优化核函数参数,x为2维输入向量,xi为2维辅助变量的支持向量,且有g>0,i=1, …, n,n与SV的数量有关。
SVM参数选取的常用方法为网格搜索法,但此方法遍历一次完整参数需要时间较长,限制了优化效率。目前使用较多的智能算法有粒子群算法(PSO)、GA以及针对这些算法的改进算法[13-14]。本文利用GA对SVM模型中的惩罚系数C和核函数参数g进行优化。选取均方根误差(RMSE)作为GA寻优的评价指标,种群中个体适应值越小,表明新一代个体对环境的适应能力更强。设定适应度函数为
$ F = \sqrt {\frac{1}{N}\sum\limits_{i = 1}^N {{{\left( {{{y'}_i} - {y_i}} \right)}^2}} } $ | (6) |
式中,y′i、yi分别为经紫外分光光度计测量并换算后的提取率实验值和软测量模型预测值,N为样本总数。分别选择平均绝对误差σAE和平均相对误差σMAPE评判软测量模型的预测精度。
$ {\sigma _{{\rm{AE}}}} = \frac{1}{N}\sum\limits_{i = 1}^N {{{\left| {{{y'}_i} - {y_i}} \right|}^2}} $ | (7) |
$ {\sigma _{{\rm{MAPE}}}} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {\frac{{{{y'}_i} - {y_i}}}{{{y_i}}}} \right| \times 100\% } $ | (8) |
为验证模型在实际应用中的适应能力,利用验证集数据来验证模型的泛化能力,若不满足要求,则需要重新调整GA的初始化参数,包括惩罚系数C的取值范围和核函数参数g的取值范围。
设定GA最大迭代次数N=100,种群最大数量M=40,交叉概率p=0.9,惩罚因子的范围[0, 100],g的范围[0, 100]。选取进化完成后的寻优结果,最终得到SVM参数为:C=17.1912,g=0.0019074。以此参数为最优结果,得到基于GA-SVM的软测量模型。
图 1所示GA的寻优的过程,可以看出随着每一次进化,最佳适应度的值和平均适应度的值持续变小。平均适应度是每次迭代完成后种群中所有个体适应度的平均值,平均值越小越好,具有最佳适应度的是适应性最好的个体。可以看出在进化到20次迭代次数时,种群的适应度已达到一个比较好的水平,且在第33次迭代时,种群的最佳适应度进一步增强,此后适应度趋于稳定。
选取5组数据作为训练样本,剩余1组作为测试样本,得到该模型误差情况如表 1所示。表 1中训练平均绝对误差为0.1327,平均相对误差为3.31%,表明此软测量模型的预测值与实测值之间的误差较小,数据拟合程度较好;泛化平均绝对误差为0.1788,平均相对误差为3.71%,所以此模型具备较强的泛化能力,得到的模型精度较高。
鉴于树莓派在硬件配置和软件资源上与传统嵌入式开发环境相比有明显优势[15],且其本身也包含丰富的外围扩展接口,所以本文选用基于ARM的树莓派构建葛根素提取率的在线测量系统,采用发布于2016年02月的3B版本,片上系统SOC采用博通BCM2837芯片,CPU工作频率1.2GHz,且自带HDMI接口,支持外接显示器。
为进行传感器数据采集和数据传输,本文分别设计温度采集模块和串口通信模块,如图 2所示。温度采集硬件选用美国DALLAS半导体公司的单总线数字传感器DS18B20[16],该温度传感器结构简单,不需要设计复杂的外围电路,通过单总线的方式进行数据的读写,且其测量温度范围为-55℃~+125℃,在-10℃~+85℃时测量精度为±0.5℃,测温分辨率最高达0.0625℃,能很好地满足双频超声提取过程中对抗干扰能力和测量精度的要求。
通讯的硬件选用CH340T。该硬件可以将USB总线协议转换为其他协议,具有外围电路简单、传输速率快、与操作系统兼容性好等优点,能较好满足本文所设计系统对通讯传输的要求。
2.2 软件程序设计本文利用Python编程语言,结合Python环境下的PyQt5库,在嵌入式Linux下进行下位机软件程序的开发、编译和调试,软件总体工作流程如图 3所示。程序的主要功能为温度数据采集、软测量模型的硬件实现、温度和时间以及提取率的实时三维显示。硬件实现后的模型能加快对采集数据的运算和处理,具有更好的实时性。
嵌入式系统包括主程序和子程序的设计,主线程程序主要为GUI显示,子线程程序包括DSl8B20温度采集、计时、运算软测量模型等。其中GUI的刷新周期为1s,温度传感器数据采集周期为3s,采样周期与在总线上挂载的温度传感器数量有关,一个传感器完成数据采集和数据转换所需时间为1s。嵌入式软件和上位机工作流程如图 4所示。
上位机软件在Qt程序开发框架下,使用C++语言完成程序设计和开发,主要功能是数据包解析、数据存储、历史数据显示、软测量模型更新以及三维坐标系实时显示提取效果。上位机工作流程如图 5所示。
为了验证在线测量系统性能,本文采用1组实验数据进行验证。在同等提取条件下,利用式(3)将紫外分光度计测量的吸光度值换算成提取率,并与在线测量系统上读取的值进行对比。
SVM的非线性模型如式(9)
$ f\left( x \right) = \sum\limits_{i = 1}^n {{\alpha _i}K\left( {\mathit{\boldsymbol{x}},{\mathit{\boldsymbol{x}}_i}} \right)} + b $ | (9) |
式中,n为SV的数量,αi为第i个SV的决策系数,K(x, xi)为核函数(本文中为RBF核函数),b是阈值。在本文中,最终的在线测量系统的提取率可以由式(10)得到
$ {\eta _2} = \frac{{\sum\limits_{i = 1}^n {{\alpha _i}{{\rm{e}}^{ - g\left( {{{\left| {t - {t_i}} \right|}^2} + {{\left| {T - {T_i}} \right|}^2}} \right)}}} + b}}{{100}} \times 100\% $ | (10) |
式中t、T为输入,分别表示超声波作用的时间和提取温度;ti、Ti是SVM的第i个支持向量的参数。
根据式(3)可以计算出对应的提取率,SVM训练结束后得到的模型参数为:SV数量65,阈值b=4.0809,其他参数如表 2所示。
软测量仪表的预测值和紫外分光读法实际值如表 3,对应的变化趋势及拟合情况如图 6所示。由式(8)对表 3中紫外分光度法计算得到的提取率值(η1)和在线测量系统上读取的提取率值(η2)进行计算,得到软测量方法的平均相对误差为4.33%。从表 3和图 6中可以看出,本文设计的软测量系统能较好地跟踪葛根素提取过程中的变化趋势,具有较高的预测精度。
针对中药提取过程中软测量建模的计算机在线实现问题,本文利用遗传算法对支持向量机模型中的参数进行优化,建立了以提取时间和提取温度为辅助变量的葛根素提取率软测量预测模型,并将该模型应用到基于树莓派的嵌入式系统,实现了葛根素提取率的在线测量和在线实时温度数据采集、提取率检测和结果实时三维显示等功能。该系统能在线测量提取率的平均相对误差在5%以内,达到生产工艺过程中对实时性和精确度的要求,并且具有响应快、操作简便的优点,可以为葛根素或其他植物药提取率的检测提供一种有效的方法。
[1] |
徐芳芳, 毕宇安, 王振中, 等. 过程分析技术在中药注射剂生产过程中的应用研究进展[J]. 中草药, 2016, 47(14): 2563-2567. XU F F, BI Y A, WANG Z Z, et al. Review on process analytical technology application in production process of Chinese medicine injection[J]. Chinese Traditional & Herbal Drugs, 2016, 47(14): 2563-2567. (in Chinese) DOI:10.7501/j.issn.0253-2670.2016.14.029 |
[2] |
乔宗良, 张蕾, 周建新, 等. 一种改进的CPSO-LSSVM软测量模型及其应用[J]. 仪器仪表学报, 2014, 35(1): 234-240. QIAO Z L, ZHANG L, ZHOU J X, et al. Soft sensor modeling method based on improved CPSO-LSSVM and its applications[J]. Chinese Journal of Scientific Instrument, 2014, 35(1): 234-240. (in Chinese) |
[3] |
阮宏镁, 田学民, 王平. 基于联合互信息的动态软测量方法[J]. 化工学报, 2014, 65(11): 4497-4502. RUAN H M, TIAN X M, WANG P. Dynamic soft sensor method based on joint mutual information[J]. CIESC Journal, 2014, 65(11): 4497-4502. (in Chinese) DOI:10.3969/j.issn.0438-1157.2014.11.040 |
[4] |
WU J Q, SUN Y K, HUANG Y H, et al. Soft sensor modeling based on GRNN for biological parameters of marine protease fermentation process[C]//Proceedings of the 33rd Chinese Control Conference, Nanjing, 2014: 5102-5106.
|
[5] |
Wang J S, Han S. Feed-forward neural network soft-sensor modeling of flotation process based on particle swarm optimization and gravitational search algorithm[J/OL]. Computational Intelligence and Neuroscience. (2015-10-25). http://dx.doi.org/10.1155/2015/147843.
|
[6] |
刘翠翠, 郭为民, 苏杰, 等. 基于PCA和支持向量机的电站入炉煤量软测量技术[J]. 自动化与仪器仪表, 2015(10): 213-214, 218. LIU C C, GUO W M, SU J, et al. Soft sensing technology for power station boiler based on PCA and support vector machine[J]. Automation & Instrumentation, 2015(10): 213-214, 218. (in Chinese) |
[7] |
李建强, 赵凯, 牛成林, 等. 基于GA-SVM的电站锅炉烟气含氧量软测量模型[J]. 热力发电, 2017, 46(4): 63-69. LI J Q, ZHAO K, NIU C L, et al. GA-SVM-based soft-sensor model for oxygen content in flue gas of utility boilers[J]. Thermal Power Generation, 2017, 46(4): 63-69. (in Chinese) |
[8] |
CHAYALAKSHMI C L, JANGAMSHETTI D S, SONOLI S. Design and development of an ARM platform based embedded system for measurement of boiler efficiency[C]//2013 IEEE Symposium on Industrial Electronics & Applications. Kuching, 2014: 39-43.
|
[9] |
张新胜. 基于ARM的一次风流量软测量仪表研发[D]. 北京: 华北电力大学, 2016. ZHANG X S. Development of soft sensor instrument for primary air flow based in ARM[D]. Beijing: North China Electric Power University, 2016. (in Chinese) |
[10] |
张庆洪. 基于径向基神经网络的汽车油耗软测量及监测系统研究[D]. 长沙: 湖南大学, 2014. ZHANG Q H. Soft measurement and monitoring system of vehicle fuel consumption based on the RBF neural network[D]. Changsha: Hunan University, 2014. (in Chinese) |
[11] |
ELSAYED S M, SARKER R A, ESSAM D L. A new genetic algorithm for solving optimization problems[J]. Engineering Applications of Artificial Intelligence, 2014, 27(C): 57-69. |
[12] |
吴景龙, 杨淑霞, 刘承水. 基于遗传算法优化参数的支持向量机短期负荷预测方法[J]. 中南大学学报(自然科学版), 2009, 40(1): 180-184. WU J L, YANG S X, LIU C S. Parameter selection for support vectormachines based on genetic algorithms to short-term power load forecasting[J]. Journal of Central South University (Science and Technology), 2009, 40(1): 180-184. (in Chinese) |
[13] |
马富涛, 张建良, 刘云彩. 基于人工智能算法的高炉布料数值模拟[J]. 钢铁, 2017, 52(6): 18-25. MA F T, ZHANG J L, LIU Y C. BF burden distribution numerical simulation based on genetic algorithm[J]. Iron and Steel, 2017, 52(6): 18-25. (in Chinese) |
[14] |
黄文秀. 粒子群优化算法的发展研究[J]. 软件, 2014, 35(4): 73-77. HUANG W X. Research development of particle swarm optimization algorithm[J]. Software, 2014, 35(4): 73-77. (in Chinese) |
[15] |
LI X Q, DING X, ZHANG Y, et al. IoT family robot based on Raspberry Pi[C]//2016 International Conference on Information System and Artificial Intelligence. Hong Kong, 2016: 622-625.
|
[16] |
ZHANG X X, DANG Y Y, FU A Y. Design and research of intelligent remote control fan based on single chip microcomputer and bluetooth technology[C]//2017 International Conference on Information Science and Technology. Wuhan, 2017.
|