基于DRNN网络的轮式机器人鲁棒H∞控制

在轮式机器人系统的轨迹跟踪控制中,对系统中非线性不确定性的处理，提出了诸如PID[1]、自适应、鲁棒控制[2-3]、滑模控制[4]等不同的单一方法.但是,单一的控制策略无法取得理想的结果.因此，近年来，国内外学者开始提出混合控制的方案.例如，在不校准摄像机视觉参数的前提下，孙妍等[5]利用视觉反馈信息并结合模糊控制的方法对移动机器人线速度和角速度进行控制，仿真结果证明了该方法的有效性.Spandan等[6]构思了一种将滑模控制与延时控制相结合的方法，将二者取长补短，最后基于仿真与单一的滑模控制对比，显示了不错的效果.为了使误差在有限时间内收敛，张扬名等[7]先采用有限时间控制方法，设计连续状态反馈角速度的控制律，在前向角误差趋于零时，结合反演设计的滑模控制技术，给出平面坐标跟踪误差线速度的控制律并取得不错的跟踪效果.基于切换灰色预测的方法，Wong等[8]设计了模糊跟踪系统.在处理不确定环境下的机器人应用上具有不错的灵活性.为了减弱滑模控制的抖振，Yi[9]将情感学习算法与滑模控制算法结合，同模糊滑模控制及一般滑模控制对比，验证了所提算法的优良性.考虑到机器人位置难以测量，Wang等[10]将视觉监督系统与自适应算法相结合，设计了一种能满足机器人实时轨迹跟踪的控制器.考虑机器人速度不可测量的情形，Shojaei等[11]利用动态表面控制方法减少了设计的复杂性，同时结合状态观测器，针对存在建模不确定性的机器人系统提出了新的控制规律.针对包含参数和非参数不确定性下的非完整机器人系统，一种鲁棒自适应时变控制方法被Shojaei等[12]设计出来.

虽然上述研究取得了不错的跟踪效果，但都要求系统的惯性矩阵、重力矩阵以及哥氏力矩阵的精确模型全部已知，或者至少知道其中两个.而笔者所提的混合控制策略仅仅需要知道系统的精确惯性矩阵.当考虑外界干扰存在的情况下，Hwang等[13]提出了一种最优H∞控制并取得较好的效果.考虑外扰是有上界的情形，Khalaji等[14]结合了鲁棒控制与自适应控制设计了新的控制器，与反馈线性化动态控制器对比，取得了更好的效果.

彭金柱等[15]设计了一种结合递归模糊神经网络和鲁棒H∞控制的方法，并将其用于完整约束的机械臂跟踪控制.借鉴该设计思想，笔者提出了一种将对角递归神经网络(DRNN)和鲁棒H∞控制相结合的方法，并将其应用于非完整约束的轮式移动机器人轨迹跟踪控制.在系统仅仅满足惯性矩阵是标称的而其他标称矩阵未知的情形下，利用DRNN神经网络逼近系统的非线性项.而且，鲁棒H∞控制方法能够保证系统在外界扰动仅仅积分有界的情形下仍能满足特定的跟踪性能.基于Lyapunov稳定性理论证明了所设计的控制系统闭环稳定.此外，与上述文献中基于小车的动力学研究不同，笔者从小车的左右轮转角度考虑.

1 对角递归神经网络

递归神经网络(RNN)的最大特点是网络中有一个或多个反馈回路，这使得网络具有良好的动态性能.笔者采用的对角递归神经网络(DRNN)是将ELMAN网络的反馈层和隐含层简化为对角阵形式,因而网络结构得到极大简化，同时提高了网络实时性，加快了学习速度，更有利于系统在线学习，它的基本结构如图1所示.由图1可知，这是一个m维输入n维输出的DRNN网络，它的输入/输出向量的动态映射关系为：

式中：xm(t)是网络的第m个输入；sj(t)是隐含层第j个神经元的输入；hj(t)是输出层第j个神经元的输出；yn(t)是输出层第n个神经元的输出.令W1、Wh及W分别代表输入层、隐含层及输出层的连接权值矩阵.并将W1、Wh矩阵元素全部设为1，即输入层与隐含层的连接权重全部取为1，反馈层的权重也全部取为1.网络隐含层的激活函数取Sigmoid函数以及平移后的Sigmoid函数，输出层函数为线性函数.设H(·)=[h1(t), h2(t),…, hm(t)]T，Y=[y1,y2,…,yn]T，则DRNN神经网络的输出可以表示为:

2 非完整约束移动机器人系统

对于一个两轮非完整约束移动机器人系统，考虑外扰的情况下，它的动力学方程:

其中,

为小车速度，ω为小车转向的角速度.为了将小车左右轮转角作为研究角度，由文献[16]，引入变换矩阵:

其中，r和R分别代表小车的轮半径和两轮间距的一半；ωr和ωl则分表代表右轮与左轮的角速度.将式(4)代入式(3)，同时

得到:

由于受到测量误差、环境和负重变化等因素的影响, 机器人动态模型式(5)中的参数

是难以精确获得的.因而笔者假设它们可以分解为标称部分

和不确定部分

且存在如下关系:

如果不考虑系统建模误差及外扰的存在，根据控制力矩法(CTC方法)，可以设计如下控制律：

式中：

代表轮子转角误差，θd代表期望的转角，

代表轮子转角，θr代表右轮转角，θl代表左轮转角;KP、Kv为增益矩阵;

代表期望角加速度.将式(7)带入式(5)，化简后得:

选择合适的Kv、Kp即可保证系统闭环稳定，然而实际系统不可能精确建模和忽视外扰的存在，因此有，

式中：

为系统的非线性项，接下来将用DRNN神经网络来逼近.

3 基于DRNN神经网络的鲁棒控制器

假设移动机器人系统中，只有惯性矩阵的标称模型已知，而其他部分则未知.然后，利用DRNN神经网络快速逼近能力来逼近Τ(xe)，即

式中：W*表示最优值矩阵；H(·)表示DRNN神经网络的隐层输出；ε表示网络的逼近误差项.假设存在ΩW并满足ΩW={W∈Rm×n:‖W‖≤MW}，且最优网络权值W*能落在紧集ΩW中，可表示为W*=argmin{sup|Τ(xe)-WTH(·)|}.针对移动机器人系统，现设计如下控制器：

其中,u为鲁棒控制项，用来补偿系统的外部扰动及神经网络逼近存在的误差.将式(10)、(11)代入式(5)，化简后得，

其中,

为DRNN神经网络的权值误差.定义状态变量

则有

系统的状态空间方程为：

假设1 如果把DRNN神经网络的逼近误差当作系统外扰的一部分，即有系统总外扰

且δ∈L2[0,∞).这里假设存在正常数Dδ，使得

‖δ(t)‖2dt≤Dδ.

定理1 对于机器人系统式(5)，若满足假设1，且存在正定对称矩阵P=PT>0，满足如下Riccati方程

式中：R=RT>0为H∞控制增益;Q=QT>0为正定对称矩阵;In×n为单位矩阵;γ>0为干扰抑制指标.对于式(12)，令

DRNN神经网络参数的自适应学习算法为：

其中,Γ为正定对角增益矩阵.那么系统可以满足如下两个目标:①所设计的鲁棒混合控制系统中的状态变量一致有界.②系统能够满足如下H∞跟踪性能：

其中，

和

则分别代表了系统状态向量x(t)的初始值以及DRNN神经网络权值误差

的初始值.

证明选取如下Lyapunov函数，

对上式两边进行微分，并将式(14)代入后得

根据假设1，将式(16)、(17)代入式(20)，并考虑

则

对上式两边从t=0到t=T积分得

因此，式(18)所提的H∞跟踪性能得以满足.根据假设1，存在σd>0使得‖δ‖≤σd，则有

其中：λmin(Q)代表矩阵Q的最小特征值，由上可知，对于任意小的ε>0，若选择

那么存在ζ>0，使得下式成立，

因此，闭环系统的所有状态变量一致有界.

结论1 在本文的设计中，假设只有标称的惯性矩阵

是已知的，其余的标称参数

和

都是未知的.

结论2 在大多数已有的文献[13-15]中，干扰是假设有确切上界的，此时可以通过选择合适的增益矩阵，利用变结构控制、自适应控制等鲁棒控制算法即可保证系统稳定.然而，实际情况中干扰的上界确切值可能无法精确获知.因此，笔者假设干扰是满足能量有界的，通过文中所提的算法可以在干扰上界未知的情况下使得系统能满足特定的跟踪性能.

4 仿真试验

为了验证所提理论的可行性，设置具体参数如下：m=10 kg，R=0.25 m，r=0.05 m,d=0.假设期望的左右轮转角向量形式为

随时间的轨迹为一段梯形折线，初始折线θrd=t+0.1cos t，θld=t.初始化以下参数，

选取控制器增益Kv=50I2×2，Kp=150I4×4，外部扰动

为了证实所提算法的有效性，在相同的模型及外部条件下对比CTC方法.则初始化所提控制器的参数，隐层神经元个数选取为7，Kp，Kv取值同CTC方法中一样，γ=0.2，Q=40I4×4，R=0.001 I2×2.根据式(15)，解出Riccati方程得：

仿真结果如图2、3、4所示.

由图2、3可知，设计的新方法在从t=0 s到t=30 s的整个跟踪过程中，左轮右轮的转角跟踪误差是小于CTC方法的.尤为突出的是，从图2、3可以明显看出期望轨迹在t=10 s和t=20 s左右处发生变化时，所设计的方法与CTC方法的跟踪误差发生了变化，但设计的新方法误差抖动明显小于CTC方法，具有更好的鲁棒适应性.同时，从图4可知，DRNN神经网络的权值最终能稳定在最优值.而且在面对同样的外扰下，所设计的方法能满足特定的跟踪性能.

5 结论

针对非完整约束的轮式移动机器人，笔者提出了一种具有全局稳定性能的鲁棒跟踪控制结构.它结合了DRNN神经网络和H∞控制方法.理论分析表明它对逼近误差的强鲁棒性以及对能量有界但不可测量的外扰具有抑制作用.此外，闭环系统所有的状态变量能够保证有界.仿真结果表明,所提算法比控制力矩法具有更好的跟踪性能.而如何提高实际的硬件仿真效果是下一步研究的内容.

[1] 尉成果, 赖欢，王太江. 轮式移动机器人轨迹跟踪控制算法的研究[J]. 机电工程, 2012, 29(6): 730-732.

[2] 白国长, 侯伯杰. 机器人的一种鲁棒控制方法[J]. 郑州大学学报(工学版), 2002, 23(1):52-54.

[3] 李健勇, 赵峰, 楚冰. 广义线性变参数系统输出反馈鲁棒控制[J]. 郑州大学学报(工学版), 2014, 35(2):75-78.

[4] 王瑷珲, 张强, 王东云,等. 基于滑模变结构的IPMC跟踪控制系统设计[J]. 郑州大学学报(工学版), 2014, 35(6):104-107.

[5] 孙妍, 王朝立，杨亚民. 基于模糊控制的移动机器人视觉反馈跟踪[J]. 计算机工程, 2011, 37(14): 175-177.

[6] SPANDAN R, NANDY S. Time delay sliding mode control of nonholonomic wheeled mobile robot: experimental validation[C]∥2014 IEEE International Conference on Robotics and Automation. Hong Kong: IEEE Press, 2014: 2886-2892.

[7] 张扬名, 刘国荣，杨小亮. 基于滑模变结构的移动机器人轨迹跟踪控制[J]. 计算机工程, 2013, 39(5): 160-164.

[8] WONG C C, LIN B C, CHENG C T. Fuzzy tracking method with a switching grey prediction for mobile robot[C]∥The 10th IEEE International Conference on Fuzzy Systems. Melbourne: IEEE Press, 2001: 103-106.

[9] YI H. A sliding mode control using brain limbic system control strategy for a robotic manipulator[J]. International journal of advanced robotic systems, 2015, 12(158): 23-29.

[10] WANG K, LIU Y, LI L. Visual servoing trajectory tracking of nonholonomic mobile robots without direct position measurement[J]. IEEE transactions on robotics, 2014, 30(4): 1026-1035.

[11] SHOJAEI K, SHAHRI A M. Output feedback tracking control of uncertain non-holonomic wheeled mobile robots: a dynamic surface control approach[J]. Control theory and applications, 2012, 6(2): 216-228.

[12] SHOJAEI K, SHAHRI A N. Adaptive robust time-varying control of uncertain non-holonomic robotic systems[J]. IET control theory and applications, 2012, 6(1): 90-102.

[13] HWANG C K, CHEN B S, CHANG Y T. Combination of kinematical and robust dynamical controllers for mobile robotics tracking control: (I) optimal H∞ control[C]∥Proceedings of the 2004 IEEE International Conference on Control Applications. Taipei:IEEE Press, 2004: 1211-1216.

[14] KHALAJI A K, MOOSAVIAN S A A. Robust adaptive controller for a tractor-trailer mobile robot[J]. IEEE/ASME transactions on mechatronics, 2014, 19(3): 943-953.

[15] 彭金柱, 王耀南, 王杰. 基于递归模糊神经网络的机器人鲁棒H∞跟踪控制[J]. 控制理论与应用, 2010, 27(9): 1145-1151.

[16] 牛雪梅, 高国琴，鲍智达，等. 基于滑模变结构控制的温室喷药移动机器人路径跟踪[J]. 农业工程学报, 2013, 29(2): 9-16.