东北大学学报(自然科学版) ›› 2025, Vol. 46 ›› Issue (5): 1-9.DOI: 10.12068/j.issn.1005-3026.2025.20230183
• 信息与控制 •
Heng-xin PAN1, Run-da JIA1,2(), Shu-lei ZHANG1
摘要:
随着电动汽车数量的增加,强化学习在电动汽车充电调度中面临更多挑战,尤其是大规模应用带来的不确定性和维度灾难问题.针对上述问题,构建了一个居民区微电网模型,综合考虑电动汽车入网模式及其多种非线性充电模型.将充电调度问题建模为一个约束马尔可夫决策过程,并采用无模型的强化学习框架处理不确定性.针对维度灾难问题,设计了一种充放电策略,通过将电动汽车根据状态划分为不同集合,并由智能体向集合发送控制信号,从而减少动作空间维度.随后,利用基于拉格朗日约束的深度确定性策略梯度算法求解充电调度问题,同时引入安全过滤器以确保不违反硬性约束.数值仿真验证了该策略的有效性.
中图分类号: