变。式(5-8)叫做最佳滤波器系数的Yule-Walker 方程。依据式(5-10)来调整滤波器参数有两处不便。第一,需要矩阵求逆及矩阵乘法等运算,因而计算量大。第二,W(n)与预测误差e(n)之间也未建立任何关系,不能达到根据预测误差e(n)来调整滤波器参数的要求。
(非平稳或时变)预测误差e(n)由
e(n)?x(n)?WT(n?1)X(n) (4-11) 表示。利用此公式,可以将式(5-7)的U(n)改写作 (4-12) 注意到WT(i?1)X(i)X(i)?X(i)XT(i)W(i?1)和式(5-11),用R?1(n)式乘上式后得到:
W(n)?R(n)??X(i)X(i)W(i?1)?R(n)??X(i)e(i)?W1(n)?W2(n)?1n?iT?1n?iTi?1i?1nn
(4-13)
为了简化第一项W1(n)的表达,并建立W(n)与W(n?1)之间的关系,一种合理的想法是认为n?1时刻及其以前时刻的滤波器参数相同,即:
W(0)?W(1)? ……. ?W(n?1)
这样,利用式(5-7)及上述假定,就有
W1(n)?R(n)??n?iX(i)XT(i)W(n?1)?W(n?1)?1i?1n (4-14)
另一方面,为了简化W2(n)的表达,一种合理的想法就是:认为遗忘因子??0。这相当于,只有本时刻的结果被记忆下来,而将以前的各时刻的结果全部遗忘。从而,有下列的简化结果:
W2(n)?R(n)?0n?iXT(i)e(i)?R?1(n)XT(n)e(n) (4-15)
?1i?1n将式(4-13)和(4-14)代入(4-12),则得
W(n)?W(n?1)?R?1(n)XT(n)e(n) (4-16) 式(4-15)描述了一个滤波器参数受其输入误差e(n)控制的自适应滤波算法,被称作递归最小二乘(RLS)。
为了实现递推计算,还要解决逆矩阵R?1(n)的递推计算问题。为此,我们先引入一个著名的结果——矩阵求逆引理。
矩阵求逆引理:若A是非奇异的,则:
16
(A?BCT)?1?A?1?A?1B(I?CTA?1B)?1CTA?1 (4-17)
由R(n)的定义式(4-7),显然有
R(n)?R(n?1)?X(n)XT(n) (4-18) 对它应用矩阵求逆引理,得:
R?1(n)X(n)XT(n)R?1(n?1)?1?1 R ) ( n ? 1 ) ? T ?1 (4-19) (n? R1?X(n)R(n?1)X(n)
综上所分析,递归最小二乘法自适应滤波(RLS)算法如下所示 算法初始化:[18]
W(0)?0 R(0)?I
For k=1 to n final do :
e(n)?x(n)?WT(n?1)X(n) ?1R?1(n)X(n)XT(n)R?1(n?1)?1R (n)?R(n?1)?1?XT(n)R?1(n?1)X(n)
W(n)?W(n?1)?R?1(n)XT(n)e(n)
(4-20)
4.3 递归最小二乘(RLS)算法的性能分析
RLS(递推最小二乘法)算法的关键是用二乘方的时间平均的最小化锯带最小均方准则,并按时间进行迭代计算。对于非平稳信号的自适应处理,最合适的方法是采用最小二乘自适应滤波器。它使误差的总能量最小。RLS算法的优点是收敛速度快,其收敛性能与输入信号的频谱特性无关,但其缺点是计算复杂度很高,对于N阶的滤波器,RLS算法的计算量为O(N2)[1,2]为了对非平稳信号进行跟踪,RLS算法引入了数加权遗忘因子λ。该遗忘因子的引入,使RLS算法能够对非平稳信号进行跟踪。[19]
由于设计简单、性能最佳,其中RLS滤波器具有稳定的自适应行为而且算法简单,收敛性能良好。
这里讨论RLS算法收敛特性两个方面的问题:一是从均值的意义上讨论
?(n)的收敛性;二是从均方值的意义上讨论误差e(n)的收敛性。为了讨论W进行这样的讨论,必须对输入过程的类别作出规定。
考虑随即机回归模型:
d(n)??w0x(n?i?1)?V(n)i?1M
(4-21)
17
其中x(n)是零均值过程V(n)是均值为零,方差为?2N的高斯白噪声序列。
?(n)]的收敛性 其中E[W对公式d(n)?XT(n)W0?V(n),其中W0?[w01??w0M]T。而可以写出: q(n)???n?iX(i)[XT(i)W0?V(i)] (4-22)
i?1n?(n)满足: 当?(n),WW(n)?AT(n)?(n)A(n)????1?1AT(n)?(n)b(n)?RX(n)q(n) (4-23)
将其写成如下形式:
n Rx(n)?rx(n)???I (4-24)
其中
rx(n)???n?iX(i)XT(n) (4-25)
i?1n
将式(4-22)和式(4-24)带入式(4-23)中得:
?(n)?[r(n)???nI]?1[r(n)W???n?iX(i)V(i)] (4-26) Wxx0i?1n故
?(n)]?[r(n)???nI]?1r(n)W E[Wxx0?[rx(n)?rx(n)??nIrx(n)]rx(n)W0
?W0?rx(n)??nW0 (4-27)
假定输入过程呈各态历经的平稳随机过程,对于?=1的情况,当n很大时,有
?1?1?1?1r(n)1n Rx??X(i)XT(i)?x (4-28)
ni?1n其中Rx表示输入矢量X(i)的M?M组合平相关矩阵,所以
?(n)]?W??R?1W (4-29) E[W0x0n?(n)]?W,故滤波器的权矢量个估计是由此可见,当n???时,E[W0无偏的。
还有E[e2(n)]的收敛性
18
?T(n)X(n)e(n)?d(n)?WT?(n))TX(n) ?d(n)?W0X(n)?(W0?W?(n)]TX(n)?V(n)?[W?W0考虑到X(n)与V(n)的不相关性,所以
2?(n))TX(n)XT(n)(W?W?(n))] E[e2(n)]??V?E[(W0?W0根据矩阵迹的性质,加权矢量的均方误差又可写成 2?(n)C?T(n)]R} (4-30) E[e2(n)]??V?tr{E[Cx?(n)?W?W?(n),R?E[X(n)XT(n)]其中C 。0x?(n)=(AT(n)Λ(n)A(n))-1AT(n)Λ(n)b(n) 由W现令V(n)?[v(1)??v(n)]T,则:
V(n)?b(n)?A(n)W0 (4-31) 将式(5-31)带入式(5-30)中得
W(n)?[AT(n)?(n)A(n)]?1AT(n)?(n)[V(n)?A(n)W0]
?(n)?W?W?(n)??[AT(n)?(n)A(n)]?1AT(n)?(n)V(n) C0因此
??1?1???E?C(n)CT(n)??E{AT(n)?(n)A(n)AT(n)?(n)V(n)VT(n)?(n)A(n)AT(n)?(n)A(n)}??因为X(n)与V(n)的不相关,则上式变为:
????
T?1?(n)C?(n)]?E[V(n)V(n)]E[C E{[A(n)?(n)A(n)] (n)]?1}AT(n)?2(n)A(n)[AT(n)?(n)A
??V2E{[AT(n)?(n)A(n)]?1AT (n)?2(n)A(n)[AT(n)?(n)A(n)]?1} (5-32)
TT
对于n???时有采用这些近似则式(5-33)可划简为:
AT(n)A(n0?nRx A(n)?(n)A(n)?Rx??n?jTj?1n (4-33)
A(n)?2(n)A(n)?Rx?(?n?j)2Tj?1n由式(4-30)可知
19
2?(n)C?T(n)]R}E[e2(n)]??V?tr{E[Cxn?(?n?j)2???2j?1?tr??Vn?(??n?j)2?j?1????I???? (4-34)
根据自适应滤波器失调量?的定义
?nn?j22??(?)E[e2(n)]??V?j?1 ???tr?n?V2?(??n?j)2??j?1在不加权的情况下,
??1,??M (4-36) nn?1??2j????0 (4-35) I??MJn?1?(??j)2?j?0?在加权情况下,
1?? ??M1?? (4-37)
由此可见,在不加权情况下,失调量随时间增加而趋于0,这意味着输
2出的均方误差随时间的增长而趋于理论最小值?V,在指数加权的情况下, 失调量?渐进于
?(n)C?T(n)]??2E[CV
2(?n?l)?n(??n?j)j?1j?1nRx2?1(4-38)
显然?值越小,失调量越大。从而收敛性变差。
在最小二乘法(RLS)算法引入了?的意义。统计量的计算是从零时刻开始的,如果不引入遗忘因子,所有采样点数据对当前估计量估计的贡献是相等的,在时变条件下,这显然不合理,因为离当前时刻比较远的数据,其信道与当前信道时域相关度越低,而通过引入0到1之间的取值?,可以令离当前时刻越远的采样数据对统计量估计的贡献越小,由此可以实现对时变信
20