模型未知非零和博弈问题的策略迭代算法
杨明, 罗艳红, 王义贺
Policy Iteration Algorithm for Nonzero-Sum Games with Unknown Models
YANG Ming, LUO Yan-hong, WANG Yi-he
东北大学学报:自然科学版 . 2015, (3): 318 -322 .  DOI: 10.12068/j.issn.1005-3026.2015.03.004