第一部分 机器人手臂的自适应神经网络控制
机器人是一具有高度非线性和不确定性的复杂系统,近年来各研究单位对机器人智能控制的研究非常热门,并已取得相当丰富的成果。
机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样,当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。因此,可采用经典控制理论的设计方法——基于数学模型的方法设计机器人控制器。但是在实际工程中,由于机器人模型的不确定性,使得研究工作者很难得到机器人精确的数学模型。
采用自适应神经网络,可实现对机器人动力学方程中未知部分的精确逼近,从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov)方法设计机器人手臂跟踪控制的问题。
1、控制对象描述:
选二关节机器人力臂系统(图1),其动力学模型为:
图1 二关节机器人力臂系统物理模型
M(q)q?V(q,q)q?G(q)?F?q??τd?τ (1)
其中
?p1?p2?2p3cosq2M(q)???p2?p3cosq2p2?p3cosq2???p3q2sinq2,V(q,q)???pqsinqp22??31?p3(q1?q2)sinq2? ?0?自适应神经网络控制课程论文
?p4gcosq1?p5gcos(q1?q2)?Tτ?0.2sint0.2sint??,, Fq?0.02sgnqG(q)??????????d???。pgcos(q?q)512??其中,q为关节转动角度向量,
M?q?为2乘2维正定惯性矩阵,
V?q,q?为
2乘2维向心哥氏力矩,G?q?为2维惯性矩阵,F?q?为2维摩擦力矩阵,τd为未知有界的外加干扰,τ为各个关节运动的转矩向量,即控制输入。
已知机器人动力学系统具有如下动力学特性: 特性1:惯量矩阵M(q)是对称正定阵且有界; 特性2:矩阵
V?q,q?有界;
特性3:M?q??2C?q,q?是一个斜对称矩阵,即对任意向量ξ,有
ξT
?M?q??2C?q,q??ξ?0 (2)
τd?bd,bd为正常数。
特性4:未知外加干扰τd满足
2p??p1,p2,p3,p4,p5???2.9,0.76,0.87,3.04,0.87kgm?我们取,两个关节的位置
指令分别为q1d?0.1sin?t?,q2d?0.1cos?t?,即设计控制器驱动两关节电
机使对应的手臂段角度分别跟踪这两个位置指令。
2、传统控制器的设计及分析:
定义跟踪误差为:
e?t??qd?t??q?t? (3)
定义误差函数为:
r?e??e (4)
其中???T?0。
则
q??r?qd??e
2
自适应神经网络控制课程论文
Mr?M?qd?q??e??M?qd??e??Mq?M?qd??e??Vq?G?F?τd?τ?M?qd??e??Vr?V?qd??e??G?F?τd?τ??Vr?τ?f?τd其中,f为包含机器人模型信息的非线性函数。f表示为
(5)
f?x??M?qd??e??V?qd??e??G?F (6)
在实际工程中,M?q?,V?q,q?,G?q?和F?q?往往很难得到精确的结果,导致模型不确定项f?x?为未知。
f?x?为了设计控制器,需要对不确定项设计控制律为
?为f的逼近值。进行逼近,假设f? τ?f?Kvr (7) 将控制律式(7)代入式(5),得
??Kr?f?τMr??Vr?fvd???Kv?V?r?f?τd???Kv?V?r??0 (8)
?,?0?f?τd。 其中f为针对f的逼近误差,f?f?f如果定义Lyapunov函数 则
11L?rTMr?rTMr??rTKvr?rT?M?2V?r?rT?022
L?1TrMr2 (9)
L?rT?0?rTKvr
?对f的逼近精度这说明在Kv固定条件下,控制系统的稳定依赖于?0,即f及干扰τd的大小。
3
自适应神经网络控制课程论文
3、基于RBF神经网络逼近的机器人手臂控制
1).基于RBF网络的逼近算法
已经证明,采用RBF网络可以实现对任意连续函数的精确逼近。因此,可以采用RBF网络实现对不确定项f的逼近。
在RBF网络结构中,取X?x1,x2,....xnT为网络的输入向量。设RBF网络的径向基向量H??h1,?,hm?T,其中hj为高斯基函数:
??hj?exp(-X-Cj2b2j2),j?1,2,m. (10) 其中网络第j个结点的中心矢量为Cj?cj1,?,cjn,i?1,2,?,n。
假设存在权值W,逼近函数f?x?的理想RBF网络输出为:
??f?Wh?x??ε?x? (11)
其中W网络的权向量,h??h1,h2hn?,ε?x?为逼近误差,ε?x??εN?x?。
考虑式(6),针对f?x?中包含的信息,逼近函数f?x?的RBF网络输入取:
TX??e?eTqTdqTd?qTd? (12)
2).基于RBF网络的控制器和自适应律设计 定义RBF神经网络的实际输出为:
??x??W?Th?x? (13) f 取
? (14) W?W?W 控制律和自适应律设计为:
?Th?x??Kr?v (15) τ?Wv??Fh?x?rT (16) W其中F为对称正定阵,F?FT?0。
将式(11)、式(13)和式(15)代入式(5),得
Mr???Kv?Vm?r?WTφ?x???ε?τd??v???Kv?Vm?r??1 (17)
4
自适应神经网络控制课程论文
其中?1?WTh?x???ε?τd??v,v为用于克服神经网络逼近误差ε和干扰τd的鲁棒项。
将鲁棒项v设计为:
v????N?bd?sgn?r? (18)
其中sgn为符号函数。
?1?sgn?r???0??1?r?0r?0 (19) r?0 3). 稳定性及收敛性分析
针对n个关节的神经网络控制,定义Lyapunov函数为:
11L?rTMr?trWTF?1W (20)
22??其中tr???为矩阵的迹,其定义为:设A是n阶方阵,则称A的主对角元素的和为A的迹,记作tr?A?。则
1L?rTMr?rTMr?trWTF?1W
2??将式(17)代入上式,得
1L??rTKvr?rT?M?2Vm?r?trWTF?1W?hrT?rT?ε?τd?v? (21)
2??将式(2)和式(16)代入上式,得
L??rTKvr?rT?ε?τd?v?
下面分两种情况进行讨论。 (1)不考虑鲁棒项,取v?0,则
L??rTKvr?rT?ε?τd???Kvminr???N?bd?r
2如果要使L?0,则需要满足:
r???N?bd?/Kvmin (22)
如果满足L?0,由于L?0,且M(q)有界,则由L表达式可知,r?t?、W?都有界。由r?t?有界可知,跟踪误差e?t?及其导数e?t?都有界,从而q和q和W有界,且跟踪误差e?t?及其导数e?t?的收敛值随神经网络逼近误差上界?N和干扰上界bd的增大而增大,并可通过增大Kv的值达到任意小。
(2)考虑鲁棒项,v取式(18),则
rT?ε?τd?v??rT?ε?τd??rTv?rT?ε?τd??r??N?bd??0
5