深度强化学习电气工程复现文章,适合小白学习

深度强化学习电气工程复现文章,适合小白学习

关键词:热电联产经济调度 深度强化学习 近端策略优化

编程语言:python平台

主题:热电联产系统智能经济调度:一种深度强化学习方法

内容简介:

本文提出了一种用于热电联产 (CHP) 系统经济调度的深度强化学习 (DRL) 方法,该方法获得了对不同运行场景的适应性,并在不影响准确性的情况下显着降低了计算复杂度。

在问题描述方面,大量的热电联产(CHP)经济调度问题被建模为具有大量非线性约束的高维非光滑目标函数,强大的优化算法和需要相当长的时间来解决它。

为了减少求解时间,大多数工程应用选择线性化优化目标和器件模型。

为了避免复杂的线性化过程,本文将热电联产经济调度问题建模为马尔可夫决策过程(MDP),使模型高度封装以保留各种设备的输入和输出特性。

此外,我们改进了一种先进的深度强化学习算法:分布式近端策略优化(DPPO),使其适用于热电联产经济调度问题。

基于该算法,智能体将被训练以探索针对不同操作场景的最优调度策略,并有效地响应系统紧急情况。

在效用阶段,经过训练的智能体将根据当前系统状态实时生成最优控制策略。

与现有优化方法相比,DRL方法的优势主要体现在以下三个方面: 1)适应性:在相同网络拓扑的前提下,训练好的agent可以在不重新计算的情况下处理各种运行场景下的经济调度问题。

2)高封装性:用户只需输入运行状态即可得到控制策略,而优化算法需要针对不同情况重新编写约束等公式。

3)时间尺度灵活性:既可以应用于日前优化调度,也可以应用于实时控制。

将所提出的方法应用于两个具有不同特性的测试系统。

结果表明,DRL方法可以处理各种操作情况,同时获得比大多数其他算法更好的优化性能

复现论文截图:

ID:12100

详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885

图文详情请查看: http://matup.cn/685195941845.html

QQ客服:27699885 微信客服:shujuqudong1 微信客服:shujuqudong6


本站资料较杂,精品资料单独做了汇总,可查阅 https://liruan.net/ 里面资源更优秀