摘要: 针对异步传输模式(ATM)网络的拥塞问题,将强化学习方法应用于拥塞控制器的设计之中.该方法不依赖于网络的数学模型和先验知识,而是通过试错和与环境的不断交互获得知识,从而改进行为策略,具有自学习的能力.控制器通过调节可用比特速率(ABR)业务发送数据的速率,使网络中可能发生拥塞的节点的缓冲器队列长度逼近给定值,从而避免拥塞的发生,保证网络的稳定运行.通过一系列仿真实验验证了该方法的有效性.
中图分类号:
李鑫;井元伟;任涛;张阳;. 基于强化学习方法的ATM网络ABR流量控制[J]. 东北大学学报(自然科学版), 2008, 29(1): 17-20.
Li, Xin (1); Jing, Yuan-Wei (1); Ren, Tao (1); Zhang, Yang (2) . Reinforcement learning approach to ABR traffic control of ATM networks[J]. Journal of Northeastern University, 2008, 29(1): 17-20.