文章快速检索     高级检索
  北京化工大学学报(自然科学版)  2017, Vol. 44 Issue (4): 95-100   DOI: 10.13543/j.bhxbzr.2017.04.015
0

引用本文  

朱时杰, 郭青. 基于线性自抗扰的AGV轨迹跟踪控制器设计及参数优化[J]. 北京化工大学学报(自然科学版), 2017, 44(4): 95-100. DOI: 10.13543/j.bhxbzr.2017.04.015.
ZHU ShiJie, GUO Qing. Ladrc-based agv trajectory tracking controller design and parameter tuning[J]. Journal of Beijing University of Chemical Technology (Natural Science), 2017, 44(4): 95-100. DOI: 10.13543/j.bhxbzr.2017.04.015.

第一作者

朱时杰, 男, 1992年生, 硕士生.

通信联系人

郭青, E-mail:guoqing@mail.buct.edu.cn

文章历史

收稿日期:2016-12-15
基于线性自抗扰的AGV轨迹跟踪控制器设计及参数优化
朱时杰 , 郭青     
北京化工大学 信息科学与技术学院, 北京 100029
摘要:针对自动导引车(AGV)的轨迹跟踪问题,通过将多入多出的非线性运动学系统解耦为多个单入单出的线性系统,在此基础上设计了基于线性自抗扰控制(LADRC)的轨迹跟踪控制器;引入混沌搜索对量子粒子群算法(QPSO)进行改进以解决其易于陷入局部最优的问题,然后利用混沌量子粒子群算法(CQPSO)对LADRC控制器的参数进行整定;最后分别就参考轨迹为直线和参考轨迹突变情况下的轨迹跟踪情况进行了仿真实验,实验结果证明了本文设计的轨迹跟踪控制器的有效性。
关键词自动导引车(AGV)    线性自抗扰控制(LADRC)    混沌量子粒子群(CQPSO)    轨迹跟踪    
LADRC-based AGV trajectory tracking controller design and parameter tuning
ZHU ShiJie , GUO Qing     
College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 100029, China
Abstract: Automatic guided vehicles (AGV) are an important transport tool in logistics systems. The AGV trajectory tracking problem is discussed in this work. The nonlinear multi-input multi-output control system is decoupled into several independent single-input single-output linear control loops by decomposing the velocity of AGV into the components in the X and Y directions. In addition, a controller for trajectory tracking of AGV is designed based on the linear active disturbance rejection control (LADRC). The paper introduces chaos search into the quantum-behaved particle swarm optimization (QPSO) algorithm to solve the flaws of easy plunging into local optimum, and then the improved chaos quantum-behaved particle swarm optimization (CQPSO) algorithm is used to tune the parameters of LADRC. The simulation results show that the proposed method is effective and feasible.
Key words: automated guided vehicle (AGV)    linear auto disturbance rejection control (LADRC)    chaos quantum-behaved particle swarm optimization (CQPSO)    trajectory tracking    
引言

自动导引车(automated guided vehicle, AGV)是一种具有柔性且满足复杂物料搬运需求的智能轮式移动机器人[1]。高精度的轨迹跟踪是AGV将物料从起始点沿预设的轨迹安全运送到目标位置的重要基础,所以轨迹跟踪控制是AGV控制的一个重要研究方向。文献[2-3]采用积分反演技术与自适应滑模控制设计了具有全局渐近稳定的跟踪控制器,实现了参数未知和不确定性干扰条件下的移动机器人轨迹跟踪,但上述工作均存在算法复杂,实际应用困难的问题。

比例-积分-微分控制器(proportion integration differentiation, PID)因其设计简单、鲁棒性强等优势在AGV控制中得到了广泛的应用[4]。但PID的参数设定对控制性能有很大影响,当控制对象的动态特性发生变化时,必须重新整定控制器参数才能保证控制系统的性能。自抗扰控制(active disturbance rejection control, ADRC)技术在PID控制的基础上,将系统的内部不确定性和外部干扰视为总扰动,并通过构造扩张状态观测器对总扰动实时估计并补偿,消除各种不确定因素的影响[5-6]。Gao[6]通过简化ADRC的设计,将扩张状态观测器线性化处理,提出了线性自抗扰控制(linear active disturbance rejection control, LADRC),将需整定的控制器参数减少到4个,使参数整定更易于实现。

相对于PID控制器,LADRC控制器的参数较多,仅依靠经验来整定耗时长且无法保证控制器的性能,因此人们提出多种参数整定方法对LADRC控制器进行优化。文献[7]选择合适的适应度函数,利用粒子群优化算法(PSO)对ADRC参数进行优化,但PSO存在早熟的问题;文献[8]利用差分进化算法(DE)来改进PSO中粒子的多样性,从而解决PSO算法易于陷入局部最优的问题,但后期收敛速度较慢。

本文引入混沌搜索对量子粒子群算法(quantum-behaved particle swarm optimization, QPSO)进行改进,提出了混沌量子粒子群算法(chaos quantum-behaved particle swarm optimization, CQPSO),利用混沌的遍历性避免PSO算法陷入局部最优,并解决收敛速度慢的问题;针对轮式移动机器人AGV,设计了基于LADRC的轨迹跟踪控制器,采用CQPSO优化控制器参数,通过跟踪机器人的位姿实现AGV运行轨迹的跟踪。

1 轮式移动机器人运动学模型

在理想的二维平面上选取一点O作为原点建立坐标系XOY,如图 1所示。以AGV的左、右轮轴线中心点M为原点,建立车体自身的坐标轴XMMYM,AGV的位姿信息用坐标表示为[xMyMθ]。其中XM轴为AGV的前进方向;[xMyM]为点M的坐标;θXM轴与X轴逆时针的夹角,即航位角;vω分别表示AGV的线速度和角速度。

图 1 移动机器人的运动坐标系简化示意图 Fig.1 Sketch of the motion coordinate system of AGV

轮式移动机器人的运动学方程为

$ \left\{ \begin{array}{l} {{\dot x}_M} = v\cos \theta \\ {{\dot y}_M} = v\sin \theta \\ \dot \theta = \omega \end{array} \right. $ (1)
2 线性自抗扰控制器

LADRC继承了PID控制器利用误差反馈进行控制的思想。与ADRC相比,LADRC省去了微分跟踪器,状态误差反馈采用线性组合的方式,同时利用线性扩张状态观测器(linear extended state observer, LESO)估计系统的总扰动[9]

假设被控对象为如式(2) 所示的单输入单输出一阶系统:

$ \left\{ \begin{array}{l} \dot x = f\left( {x,w} \right) + bu\\ y = x \end{array} \right. $ (2)

其中,x为系统的状态量;y为系统的输出;u为系统的输入;w为系统受到的外部扰动;b表示控制增益参数,并且b未知,用其近似值b0代替。

构造LESO

$ \left\{ \begin{array}{l} \mathit{\boldsymbol{\dot z}} = {\mathit{\boldsymbol{A}}_{\rm{s}}}\mathit{\boldsymbol{z}} + {\mathit{\boldsymbol{B}}_{\rm{s}}}u + \mathit{\boldsymbol{L}}\left( {y - \hat y} \right)\\ \hat y = {\mathit{\boldsymbol{C}}_{\rm{s}}}\mathit{\boldsymbol{z}} \end{array} \right. $ (3)

其中:z=[z1 z2]T为状态观测量, ${\hat y}$ 为系统输出的估计值,AsBsCs为LESO的系数矩阵,L=[2w0 w02]T为LESO的控制参数矩阵,w0为LESO的带宽。调节w0使LESO的有界输入和有界输出稳定,将L代入式(3) 得到标准LESO表达式

$ \left\{ \begin{array}{l} \mathit{\boldsymbol{\dot z}} = \mathit{\boldsymbol{Az}} + \mathit{\boldsymbol{B}}u\\ {\mathit{\boldsymbol{y}}_g} = \mathit{\boldsymbol{Cz}} + \mathit{\boldsymbol{D}}u \end{array} \right. $ (4)

其中

$ \begin{array}{l} \mathit{\boldsymbol{A}} = \left[ {\begin{array}{*{20}{c}} { - 2{w_0}}&1\\ { - w_0^2}&0 \end{array}} \right],\mathit{\boldsymbol{B}} = \left[ {\begin{array}{*{20}{c}} {{b_0}}&{2{w_0}}\\ 0&{w_0^2} \end{array}} \right],\mathit{\boldsymbol{C}} = \left[ {\begin{array}{*{20}{c}} 1&0\\ 0&1 \end{array}} \right],\mathit{\boldsymbol{D}} = \\ \left[ {\begin{array}{*{20}{c}} 0&0\\ 0&0 \end{array}} \right]。\end{array} $

根据文献[6],设Kp=wc2wc为控制器带宽,因此LADRC控制器设计问题转化为控制器参数即LESO的带宽w0、控制器带宽wc以及控制增益b0的整定问题。图 2为LADRC的闭环控制结构。

图 2 LADRC控制结构图 Fig.2 Diagram of the LADRC controller
3 基于LADRC的轨迹跟踪控制器设计

本文针对AGV的轨迹跟踪控制进行研究。AGV在给定仓储实验环境下运行,通过直流电机和舵机提供动力,实现前行、后退、转弯等动作。AGV采用惯性导航方式,在驱动轮上安装编码器,编码器与驱动轮同轴,测得驱动轮的转速,再根据转速及车体参数推算得到AGV的线速度及角速度。设定AGV的基准位姿,根据AGV的运动学模型通过航位推算计算出AGV的实时位姿信息。

引入虚拟控制量vxvy,则式(1) 的运动学方程变为

$ \left\{ \begin{array}{l} {{\dot x}_M} = v\cos \theta = {v_x}\\ {{\dot y}_M} = v\sin \theta = {v_y}\\ \dot \theta = \omega \end{array} \right. $ (5)

其中,vx为轮式移动机器人的线速度vX轴方向的分量,vyvY轴方向的分量。由式(5) 可知,引入虚拟控制量后,原两输入三输出的非线性运动学模型解耦为3个单输入单输出的控制回路。3个输入的控制量vxvyω分别对应AGV位姿的3个输出分量[xMyMθ]。因此由3个单输入单输出控制回路分别设计3个控制器,控制系统结构如图 3所示。其中xryrθr分别代表横坐标、纵坐标、航位角的参考值。

图 3 AGV轨迹跟踪控制器结构 Fig.3 AGV trajectory tracking controller structure

虚拟控制量vxvy根据式(6) 合成为AGV的线速度v,计算式如式(6) 所示

$ v = \sqrt {v_x^2 + v_y^2} $ (6)
4 混沌量子粒子群(CQPSO)算法

针对QPSO很容易陷入局部最优解无法跳出的问题[10],提出混沌量子粒子群(CQPSO)算法,即利用混沌的遍历性[11],当QPSO陷入局部最优解时,使用logistic映射函数生成混沌序列,以当前的局部最优解为中心展开混沌序列的往返映射,避免QPSO陷入局部最优。

CQPSO算法的主要步骤如下:

1) 初始化粒子种群在H维空间中,随机产生N个粒子的位置和速度,形成维数为N×H的初始种群数组Pop,QPSO与混沌搜索共用此初始种群;

2) 计算适应值对于每个粒子,计算其适应值;

3) 更新QPSO的个体最优位置Plt将每个粒子的适应值与该粒子所经历的个体最优位置适应值进行比较,如果适应值较好,则将其作为当前的个体最优位置;

4) 计算当前QPSO的全局最优位置对于每个粒子,将其适应值与整个粒子群所经历的最优位置比较,若适应值较好,将其作为当前的全局最优位置;

5) 计算QPSO的平均最优位置根据式(7) 计算种群的平均最优位置 ${{\vec C}^t}$

$ \begin{array}{l} \;\;\;\;\;{{\vec C}^t} = \left( {C_1^t, \cdots ,C_j^t} \right) = \frac{1}{N}\sum\limits_{l = 1}^N {\vec P_l^t} = \left( {\frac{1}{N}\sum\limits_{l = 1}^N {P_{l,1}^t,} } \right.\\ \left. { \cdots ,\frac{1}{N}\sum\limits_{l = 1}^N {P_{l,j}^t} } \right) \end{array} $ (7)

式中, ${{\vec C}^t}$ 为维数1×H的第t代种群的平均最优位置,Pl, jt为第t代种群中第l个粒子的个体最优位置的第j维分量;

6) 根据式(8) QPSO更新粒子的位置

$ \left\{ \begin{array}{l} X_{l,j}^{t + 1} = p_{l,j}^t - \beta \left| {C_j^t - X_{l,j}^t} \right|\ln \left( {\frac{1}{\varepsilon }} \right)\;\;\;\;{r_{\rm{a}}} < 0.5\\ X_{l,j}^{t + 1} = p_{l,j}^t + \beta \left| {C_j^t - X_{l,j}^t} \right|\ln \left( {\frac{1}{\varepsilon }} \right)\;\;\;\;{r_{\rm{a}}} \ge 0.5 \end{array} \right. $ (8)

式中,Xl, jt+1为第t+1代种群的第l个粒子位置的第j维分量;β为收缩扩张系数;Cjl为第t代种群平均最好位置的第j维分量;raε为服从(0, 1) 均匀分布的随机数;pl, jt为第t代种群的第l个局部吸引子的第j维分量,其坐标位置表示为pl, jt=φPl, jt+(1-φ)Pgt(其中Pgt为第t代种群的全局最优位置,φ为服从(0, 1) 均匀分布的随机数);

7) 使用logistic映射函数[11]产生混沌序列

$ z_{l,j}^{t + 1} = \mu \cdot z_{l,j}^t\left( {1 - z_{l,j}^t} \right) $ (9)

其中,zl, jt表示在t代种群的第l个混沌变量的第j维分量;μ表示混沌搜索的控制变量,当μ=4时,公式(9) 处在混沌状态,且混沌变量zl, j在(0, 1) 范围内,其遍历性与随机性最好;

8) zl, j与式(10) 进行往返映射

$ {X_{l,j}} = {b_1} + {z_{l,j}}\left( {{b_{\rm{u}}} - {b_{\rm{1}}}} \right) $ (10)

其中bubl代表待优化的参数寻优空间,buxlb1

9) 比较QPSO和混沌搜索的全局历史最优值的适应值大小,更新当前的全局最优值;

10) 重复步骤2)~9),直至满足精度要求或者达到最大迭代次数,停止搜索并输出全局最优值和其适应值。

5 5仿真实验结果与分析 5.1 控制器寻优结果

AGV的轨迹跟踪控制系统结构如图 3所示。控制器分别采用PID控制器和LADRC控制器,通过参考轨迹为直线和参考轨迹突变两种情况对比两种控制器的控制效果。利用CQPSO分别对PID控制器与LADRC控制器的参数进行寻优,CQPSO参数设定为:N=30,H=9,最大迭代次数tmax=50次,寻优空间[0, 100]。这里选取ITAE指标作为性能评价函数,其定义为

$ J = \int_0^\infty {t\left| {e\left( t \right)} \right|{\rm{d}}t} $ (11)

其中,e(t)表示横坐标误差xe、纵坐标误差ye与航位角误差θe的绝对值之和。LADRC控制器与PID控制器寻优结果如表 1所示,其中kpkikd为PID控制器的3个参数。

下载CSV 表 1 控制器参数寻优结果 Table 1 Optimization results of controller parameters
5.2 参考轨迹为直线

当参考轨迹为直线时,选取AGV的参考输入vr=1 m/s,ωr=0;对AGV的线速度和角速度加以限制,取|vmax|=1 m/s,|ωmax|=2 rad/s;分别取参考位姿初始值为(xr=0,yr=0,θr=π/6),AGV的初始位姿为(x0=2,y0=2,θ0=π/4)。仿真实验结果如图 4所示。

图 4 直线轨迹跟踪仿真曲线 Fig.4 Simulation curves of straight line trajectory tracking

图 4(a)可以看出,在控制器的作用下,AGV从起点向参考轨迹起始点方向调整,随着仿真时间增加,LADRC和PID两种控制器均能使AGV接近参考轨迹并重合;图 4(b)图 4(c)表明,LADRC控制器比PID控制器对于参考位姿在X轴及Y轴方向的响应误差超调更小,并且很快接近于零;图 4(d)表明,对于位姿跟踪的航位角误差,LADRC控制器同样能够使其更快逼近零,且波动较小。所以总体来说AGV跟踪直线轨迹时,LADRC的控制效果优于PID控制器。

5.3 参考轨迹发生突变时

假设当小车直线行走时预定轨迹上有障碍物出现,此时需要修改参考轨迹以避开障碍物,本文利用Matlab仿真模拟这一情况。设AGV的参考控制输入为vr=1 m/s,ωr=0;AGV限速为|vmax|=1.5 m/s,|ωmax|=2 rad/s;AGV的参考位姿初始值为(xr=0,yr=0,θr=π/6),初始位姿为(xr=2,yr=2,θr=π/4)。在t=2 s时修改参考轨迹以避障,使原设定轨迹的横坐标阶跃变化,修改后的参考轨迹与原轨迹平行并向左侧平移1 m。仿真实验结果如图 5所示。

图 5 直线突变轨迹跟踪仿真曲线 Fig.5 Simulation curves of line mutation trajectory tracking

图 5(a)可以看出,当参考轨迹发生突变时,LADRC与PID均可以使AGV最终跟踪给定的参考轨迹;图(b)(c)表明,相对于PID控制器,在LADRC控制器的作用下,AGV位姿在X轴及Y轴方向的响应误差超调均较小;图(d)表明,对于位姿跟踪的航位角误差,LADRC控制器同样能够使其更快逼近零,且波动较小。因此当参考轨迹发生突变时,LADRC控制器具有更好的调节能力。

6 结束语

本文基于LADRC算法设计了AGV的轨迹跟踪控制器,针对LADRC参数整定的问题,改进QPSO算法,加入混沌优化搜索,提高优化算法的收敛精度。分别在参考轨迹为直线和参考轨迹突变的两种情况下进行轨迹跟踪仿真实验,来对比LADRC控制器与PID控制器的性能。仿真结果证明LADRC控制器比PID控制器能更好地消除误差,响应误差超调小,体现了LADRC控制器稳定性高、鲁棒性强、不依赖被控对象模型的优点。

参考文献
[1]
谭民, 王硕. 机器人技术研究进展[J]. 自动化学报, 2013, 39(7): 963-972.
Tan M, Wang S. Research process on robotics[J]. Acta Automatica Sinica, 2013, 39(7): 963-972. (in Chinese)
[2]
吴卫国, 陈辉堂, 王月娟. 移动机器人的全局轨迹跟踪控制[J]. 自动化学报, 2001, 27(3): 326-331.
Wu W G, Chen H T, Wang Y J. Global trajectory tracking control of mobile robots[J]. Acta Automatica Sinica, 2001, 27(3): 326-331. (in Chinese)
[3]
闫茂德, 吴青云, 贺昱曜. 非完整移动机器人的自适应滑模轨迹跟踪控制[J]. 系统仿真学报, 2007, 19(3): 579-581.
Yan M D, Wu Q Y, He Y Y. Adaptive sliding mode tracking control of nonholonomic mobile robot[J]. Journal of System Simulation, 2007, 19(3): 579-581. (in Chinese)
[4]
孟文俊, 刘忠强. 视觉引导AGV的路径跟踪控制研究[J]. 控制工程, 2014, 21(3): 321-325.
Meng W J, Liu Z Q. Research on the path tracking control for vision-guided AGV[J]. Control Engineering of China, 2014, 21(3): 321-325. (in Chinese)
[5]
韩京清. 自抗扰控制技术[J]. 前沿科学, 2007(1): 24-31.
Han J Q. Auto disturbances rejection control technique[J]. Frontier Science, 2007(1): 24-31. (in Chinese)
[6]
Gao Z Q. Scaling and bandwidth-parameterization based controller tuning[C]//Proceedings of the American Control Conference.Denver, USA, 2003:4989-4996.
[7]
史永丽, 侯朝桢, 苏海滨. 基于粒子群优化算法的自抗扰控制器设计[J]. 系统仿真学报, 2008, 20(2): 433-436.
Shi Y L, Hou C Z, Su H B. Auto-disturbance-rejection controller design base on particle swarm optimization algorithm[J]. Journal of System Simulation, 2008, 20(2): 433-436. (in Chinese)
[8]
王子豪, 杨小健. PSODE混合算法的ADRC控制[J]. 电子技术应用, 2016, 42(6): 91-93.
Wang Z H, Yang X J. ADRC control based on PSODE hybrid algorithm[J]. Application of Electronic Technique, 2016, 42(6): 91-93. (in Chinese)
[9]
吴超, 王文浩, 张玉文, 等. 基于LADRC的无人机轨迹跟踪[J]. 航空学报, 2015, 36(2): 473-483.
Wu C, Wang W H, Zhang Y W, et al. LADRC-based trajectory tracking for unmanned helicopter[J]. Acta Aeronautica et Astronautica Sinica, 2015, 36(2): 473-483. (in Chinese)
[10]
傅继阳, 钟亮, 黄友钦, 等. 基于量子粒子群算法的门式钢架结构抗风优化[J]. 西南交通大学学报, 2013, 48(5): 845-850.
Fu J Y, Zhong L, Huang Y Q, et al. Wind-resistant optimization of portal frames based on quantum-behaved particle swarm algorithm[J]. Journal of Southwest Jiaotong University, 2013, 48(5): 845-850. (in Chinese)
[11]
程启明, 程尹曼, 汪明媚, 等. 基于混沌粒子群算法优化的自抗扰控制在蒸馏发生器水位控制中的应用研究[J]. 华东电力, 2011, 39(6): 957-962.
Cheng Q M, Cheng Y M, Wang M M, et al. The applied research on ADRC based on chaos-PSO optimization in SG water level control[J]. East China Electric Power, 2011, 39(6): 957-962. (in Chinese)