摘要: 主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.
                                                        
                            
                              
                             
                            
                            																								
								
																中图分类号: 
																 
								
								
																                            
                            
                                
                                    
                                
                                
                                    
                                        															王涛,罗艳红. 带饱和执行器的非线性离散时滞系统的最优控制[J]. 东北大学学报:自然科学版, 2014, 35(4): 461-464.	
																																									     												                                                                                                        	                                                                                                                      WANG Tao, LUO Yanhong. Optimal Control for Nonlinear DiscreteTime Time Delay Systems with Saturating Actuators[J]. Journal of Northeastern University Natural Science, 2014, 35(4): 461-464.