深度强化学习电气工程复现文章,适合小白学习
关键词:热电联产经济调度 深度强化学习 近端策略优化
编程语言:python平台
主题:热电联产系统智能经济调度:一种深度强化学习方法
内容简介:
本文提出了一种用于热电联产 (CHP) 系统经济调度的深度强化学习 (DRL) 方法,该方法获得了对不同运行场景的适应性,并在不影响准确性的情况下显着降低了计算复杂度。
在问题描述方面,大量的热电联产(CHP)经济调度问题被建模为具有大量非线性约束的高维非光滑目标函数,强大的优化算法和需要相当长的时间来解决它。
为了减少求解时间,大多数工程应用选择线性化优化目标和器件模型。
为了避免复杂的线性化过程,本文将热电联产经济调度问题建模为马尔可夫决策过程(MDP),使模型高度封装以保留各种设备的输入和输出特性。
此外,我们改进了一种先进的深度强化学习算法:分布式近端策略优化(DPPO),使其适用于热电联产经济调度问题。
基于该算法,智能体将被训练以探索针对不同操作场景的最优调度策略,并有效地响应系统紧急情况。
在效用阶段,经过训练的智能体将根据当前系统状态实时生成最优控制策略。
与现有优化方法相比,DRL方法的优势主要体现在以下三个方面: 1)适应性:在相同网络拓扑的前提下,训练好的agent可以在不重新计算的情况下处理各种运行场景下的经济调度问题。
2)高封装性:用户只需输入运行状态即可得到控制策略,而优化算法需要针对不同情况重新编写约束等公式。
3)时间尺度灵活性:既可以应用于日前优化调度,也可以应用于实时控制。
将所提出的方法应用于两个具有不同特性的测试系统。
结果表明,DRL方法可以处理各种操作情况,同时获得比大多数其他算法更好的优化性能
复现论文截图:
ID:12100
详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885
图文详情请查看: http://matup.cn/685195941845.html