东北大学学报:自然科学版  2017, Vol. 38 Issue (6): 909-912  
0

引用本文 [复制中英文]

邵新慧, 彭程. 一类Sylvester矩阵方程的迭代解法[J]. 东北大学学报:自然科学版, 2017, 38(6): 909-912.
[复制中文]
SHAO Xin-hui, PENG Cheng. Iterative Solutions to Sylvester Matrix Equations[J]. Journal of Northeastern University Nature Science, 2017, 38(6): 909-912. DOI: 10.3969/j.issn.1005-3026.2017.06.029.
[复制英文]

基金项目

国家自然科学基金资助项目(11071033)

作者简介

邵新慧(1970-),女,山东青岛人,东北大学副教授,博士。

文章历史

收稿日期:2015-12-30
一类Sylvester矩阵方程的迭代解法
邵新慧, 彭程    
东北大学 理学院, 辽宁 沈阳 110819
摘要:针对Sylvester矩阵方程给出了一种基于梯度的迭代解法.通过引入一个松弛参数和应用层次识别原理, 构建了一种新型的迭代方法求解一类Sylvester矩阵方程.收敛分析表明, 在一定的假设条件下对于任意初始值, 迭代解都收敛到精确解.数值算例也表明了所给方法的有效性和优越性.
关键词Sylvester矩阵方程    迭代解法    梯度    收敛    松弛参数    
Iterative Solutions to Sylvester Matrix Equations
SHAO Xin-hui, PENG Cheng    
School of Sciences, Northeastern University, Shenyang 110819, China
Corresponding author: SHAO Xin-hui, E-mail: xinhui1002@126.com
Abstract: The gradient-based iterative solutions to Sylvester matrix equations are given. By introducing a relaxation parameter and applying the hierarchical identification principle, an iterative algorithm is constructed to solve Sylvester matrix equations. Convergence analysis indicates that the iterative solutions converge with the exact solutions to any initial value under certain assumptions. Numerical examples are given to testify the efficiency of the proposed method.
Key Words: Sylvester matrix equation    iterative solution    gradient    convergence    relaxation parameter    

Sylvester矩阵方程在很多领域中都有涉及, 例如矩形域上的椭圆边值问题离散后会得到一个Sylvester形式的矩形方程;在常微分方程定性理论研究及数值求解的隐式Runge-Kwutta方法与块方法中常会碰到这类方程的求解问题;在线性统计领域中也会有Sylvester矩阵方程;在控制理论及应用中, 极点配置、观测器及构造Sylvester函数中都涉及上述方程的求解.除此之外, 特殊形式的Sylvester方程, 即Lyapunov方程, 在实际应用中, 特别是在连续和离散稳定性分析中具有重要意义, 在系统与控制领域中经常会遇到.与此同时, Sylvester矩阵方程在图像恢复、模型降阶、神经网络、信号处理等领域中也有涉及.Sylvester矩阵方程的求解问题通常包括精确解和数值解的研究.尽管在系统稳定性分析等众多应用中, 精确解的研究非常重要, 但是, 当系统的参数未知时, 不可能得到精确解, 此时数值解的研究就非常必要.近些年, 国内外很多学者对各种类型的Sylvester矩阵方程的数值解进行研究, 得到了一些有效的数值求解算法[1-15].

本文从Sylvester矩阵方程AXB=F的迭代解法入手, 先给出了它的迭代解的收敛条件, 然后介绍了计算Sylvester矩阵方程AXB+CXD=F数值解的分层迭代法,以及解决Sylvester矩阵方程AX+XB=C的松弛迭代法.

1 矩阵方程AXB+CXD=F的松弛迭代法 1.1 相关引理

对于任意的两个整数i < j, I[i, j]表示集合{i, i+1, …, j}, 对任意方阵A, , tr (A), ‖A‖分别表示矩阵共轭, 矩阵的迹和矩阵的F范数.对X=[x1x2xn]∈Cm×n, 设vec (X)=[x1Tx2TxnT]T, ‖A‖=‖vec (A)‖.对于任意矩阵MN, MCr×m, NCn×s, MXN表示克罗内克积, 有vec(MXN)=(NTM)vec (X).

引理1[2]   对于AXB=F, 其中ACp×m, BCn×q, FCp×q是已知矩阵, XCm×n是未知矩阵.若满足, 且求解方程AXB=F的迭代算法表示为X(k+1)=X(k)+μAT(F-AX(k)B)BT.若方程AXB=F有唯一解X*, 则迭代解X(k)收敛到唯一解, 即.

引理2[2]   若ACp×m是列满秩矩阵, BCn×q是行满秩矩阵(pm, nq), 则方程AXB=F有唯一解, 且X=(ATA)-1ATFBT(BBT)-1, 所对应的齐次方程AXB=O有唯一解X=O.

1.2 迭代格式的建立

考虑Sylvester矩阵方程

(1)

其中:A, CCm×rB, DCs×nFCm×n是已知的常数矩阵;XCr×s是待求矩阵.

假设X*表示方程(1) 的精确解, X(k)表示X*的第k步迭代的近似解.应用分层辨识原理[2-5, 7-8], 定义矩阵

(2)
(3)

引入一个松弛因子, 建立如下松弛递归格式:

(4)
(5)

其中:μ是收敛因子;ω是一个松弛因子, 满足0 < ω < 1.

将方程(2) 和(3) 代入到方程(4) 和(5) 中, 得到如下格式:

(6)
(7)

由于上述两个等式的右端包括未知矩阵X, 算法无法实现.根据分层辨识原理[2-5, 7-8], 方程(6) 和(7) 中X可以被它的迭代近似值X(k-1) 代替, 得到

(8)
(9)

由于求的是近似解X(k)而不是X1(k)和X2(k), 遵循平衡策略形成第k步迭代的近似解:

(10)
(11)
(12)

于是迭代算法改成如下格式:

(13)
1.3 收敛性分析

定理1   设方程AXB+CXD=F有唯一解X*, 其中A, CCm×r, B, DCs×n, FCm×n, XCr×s.设λmax(AAT)=λ1, λmax(BBT)=λ2, λmax(CCT)=λ3, λmax(DDT)=λ4.若收敛因子μ满足, 则对于任意初值X(0), 算法(13) 给出的迭代解收敛于唯一解X*, 即.

证明  定义误差矩阵

(14)
(15)
(16)

(17)

将式(15) 代入到式(10), (11):

将式(16), (17) 代入到上式, 可得X1(k)=X(k-1)-ωμAT(ξ(k-1)+η(k-1))BT,

X2(k)=X(k-1)-(1-ω)μCT(ξ(k-1)+η(k-1))DT.

由于|X|2=tr (XTX), tr (AB)=tr (BA), tr (A)=tr (AT), 得

.设λmax(AAT)=λ1, λmax(BBT)=λ2, λmax(CCT)=λ3, λmax(DDT)=λ4.可得‖AT(ξ(k-1)+η(k-1))BT2λ1λ2‖(k-1)+η(k-1)2, 则 tr [(ξ(k-1)+η(k-1))ξT(k-1)+(ξ(k-1)+η(k-1))Tξ(k-1)].则+ω2μ2λ1λ2ξ(k-1)+η(k-1)‖2-μωtr [(ξ(k-1)+η(k-1))ξT(k-1)+(ξ(k-1)+η(k-1))Tξ(k-1)].

同样(1-ω)2μ2λ3λ4ξ(k-1)+η(k-1)‖2-μ(1-ω)tr [(ξ(k-1)+η(k-1))ηT(k-1)+(ξ(k-1)+η(k-1))Tη(k-1)].

将等式(12) 两边同时取范数, 有

可得.若μ满足, 有, 则‖ξ(k)+η(k)‖2→0.进而得ξ(k)+η(k)→0, 结合引理1, .

2 数值模拟

例  考虑方程AXB+CXD=F, 其中: 设方程AXB+CXD=F的精确解为

利用算法(10)~(12), 取初始矩阵, 定义相对误差.根据定理1计算得到, λmax(AAT)=λ1=2, λmax(BBT)=λ2=2, λmax(CCT)=λ3=5, λmax(DDT)=λ4=2, 故有

通过大量实验, 当ω=0.49及μ==0.283 29时, 有更小的相对误差和较快的迭代速度, 如图 1~图 3所示.

图 1ω=0.49时算法(10)~(12) 的收敛性 Fig.1 Convergence performance of algorithm (10)~ (12) for different μ when ω=0.49
图 2 ω=0.49时算法(13) 的收敛性 Fig.2 Convergence performance of algorithm (13) for different μ when ω=0.49
图 3μ=100/353时算法(13) 的收敛性 Fig.3 Convergence performance of algorithm (13) for different ω when μ=100/353

ω=0.49, μ=100/353时, 表 1给出用算法(13) 和文献[2]中算法求得解与相对误差δ1.

表 1 本文算法与文献[2]中算法比较 Table 1 Comparison of algorithm (13) and algorithm in ref. [2]

通过图表可以发现, 算法(13) 明显优于文献[2]中的算法.

3 结论

本文讨论了实数域下Sylvester矩阵方程的迭代解法, 其主要思想是基于梯度迭代法与分层迭代原理, 通过引入松弛因子, 建立新的迭代格式, 从而获得Sylvester矩阵方程的数值解.还给出了相应的收敛性分析, 进行了理论证明, 得出如下结论:在特定条件下, 对于任意初始值, 方程的迭代解均收敛于精确解.最后通过数值算例说明了所给新算法的有效性、可行性以及优越性.从讨论可以看出, 同等情况下, 带有松弛因子的迭代算法与之前的方法相比, 可以带来较小的迭代误差与较快的迭代速度.另外, 本文给出的迭代算法更具有普遍性, 可以解多种Sylvester矩阵方程.

参考文献
[1] Evans D J, Martins M M. AOR method for AX-XB=C[J]. International Journal of Computer Mathematics, 1994, 52(2): 75–82.
[2] Ding F, Chen T. Hierarchical least squares identification methods for multivariable systems[J]. IEEE Transactions on Automatic Control, 2005, 50(3): 397–402. DOI:10.1109/TAC.2005.843856
[3] 徐树方. 控制论中的矩阵计算[M]. 北京: 高等教育出版社, 2011: 27-29.
( Xu Shu-fang. Matrix computation in cybernetics[M]. Beijing: Higher Education Press, 2011: 27-29. )
[4] Ding F, Chen T. Gradient based iterative algorithms for solving a class of matrix equations[J]. IEEE Transactions on Automatic Control, 2005, 50(8): 1216–1221. DOI:10.1109/TAC.2005.852558
[5] Ding F, Liu P X, Ding J. Iterative solutions of the generalized Sylvester matrix equations by using the hierarchical identification principle[J]. Applied Mathematics and Computation, 2008, 197(1): 41–50. DOI:10.1016/j.amc.2007.07.040
[6] Xie L, Ding J, Ding F. Gradient based iterative solutions for general linear matrix equations[J]. Computers & Mathematics with Applications, 2009, 58(7): 1441–1448.
[7] Ding J, Liu Y J, Ding F. Iterative solutions to matrix equations of form AXB=F[J]. Computers & Mathematics with Applications, 2010, 59(11): 3500–3507.
[8] Kilicman A, Zhour Z A. Vector least-squares solutions for coupled singular matrix equations[J]. Journal of Computational and Applied Mathematics, 2007, 206(2): 1051–1069. DOI:10.1016/j.cam.2006.09.009
[9] Wu A G, Lu L L, Duan G R. Iterative algorithms for solving a class of complex conjugate and transpose matrix equations[J]. Applied Mathematics and Computation, 2011, 217(21): 8343–8353. DOI:10.1016/j.amc.2011.02.113
[10] Song C Q, Chen G L. An efficient algorithm for solving extended Sylvester conjugate transpose matrix equations[J]. Arab Journal of Mathematical Sciences, 2011, 17(21): 115–134.
[11] Song C Q, Chen G L, Zhao L L. Iterative solutions to coupled Sylvester transpose matrix equations[J]. Applied Mathematical Modelling, 2011, 35(10): 4675–4683. DOI:10.1016/j.apm.2011.03.038
[12] Niu Q, Wang X, Lu L Z. A relaxed gradient based algorithm for solving Sylvester equations[J]. Asian Journal of Control, 2011, 13(3): 461–464. DOI:10.1002/asjc.v13.3
[13] Dehghan M, Hajarian M. An iterative algorithm for the reflexive solutions of the generalized coupled Sylvester matrix equations and its optimal approximation[J]. Applied Mathematics and Computation, 2008, 202(2): 571–588. DOI:10.1016/j.amc.2008.02.035
[14] Tian Z L, Gu C Q. A numerical algorithm for Lyapunov equations[J]. Applied Mathematics and Computation, 2008, 202(1): 44–53. DOI:10.1016/j.amc.2007.12.057
[15] Hou J J, Peng Z Y, Zhang X L. An iterative method for the least squares symmetric solution of matrix equation AXB=C[J]. Numerical Algorithms, 2006, 42(2): 181–192. DOI:10.1007/s11075-006-9037-3