东北大学学报(自然科学版) ›› 2024, Vol. 45 ›› Issue (10): 1386-1393.DOI: 10.12068/j.issn.1005-3026.2024.10.003
• 信息与控制 • 上一篇
Run-da JIA1(), Dong-hao ZHANG1, Jun ZHENG1, Kang LI2
摘要:
传统的优化控制方法很难在浮选过程状态发生变化时准确、快速做出决策,导致精矿品位和尾矿品位大幅度波动、出现产品质量不稳定.此外,浮选过程难以对精矿品位进行在线检测,导致其实用性下降.针对上述问题采用混合模型对浮选过程建模,并基于示例的安全增强值评估(safety augmented value estimation from demonstrations,SAVED)的强化学习算法,控制浮选溢出气泡的尺寸分布,从而间接实现对精矿品位和尾矿品位的控制.通过仿真实验验证了所提算法的有效性.与人工经验和数据驱动模型相比,基于混合模型的SAVED算法在保证安全约束的条件下能够实现更好的控制效果.
中图分类号: