深度强化学习电气工程复现文章，适合小白学习

关键词：热电联产经济调度深度强化学习近端策略优化

编程语言：python平台

主题：热电联产系统智能经济调度：一种深度强化学习方法

内容简介：

本文提出了一种用于热电联产 (CHP) 系统经济调度的深度强化学习 (DRL) 方法，该方法获得了对不同运行场景的适应性，并在不影响准确性的情况下显着降低了计算复杂度。

在问题描述方面，大量的热电联产（CHP）经济调度问题被建模为具有大量非线性约束的高维非光滑目标函数，强大的优化算法和需要相当长的时间来解决它。

为了减少求解时间，大多数工程应用选择线性化优化目标和器件模型。

为了避免复杂的线性化过程，本文将热电联产经济调度问题建模为马尔可夫决策过程（MDP），使模型高度封装以保留各种设备的输入和输出特性。

此外，我们改进了一种先进的深度强化学习算法：分布式近端策略优化（DPPO），使其适用于热电联产经济调度问题。

基于该算法，智能体将被训练以探索针对不同操作场景的最优调度策略，并有效地响应系统紧急情况。

在效用阶段，经过训练的智能体将根据当前系统状态实时生成最优控制策略。

与现有优化方法相比，DRL方法的优势主要体现在以下三个方面： 1）适应性：在相同网络拓扑的前提下，训练好的agent可以在不重新计算的情况下处理各种运行场景下的经济调度问题。

2）高封装性：用户只需输入运行状态即可得到控制策略，而优化算法需要针对不同情况重新编写约束等公式。

3）时间尺度灵活性：既可以应用于日前优化调度，也可以应用于实时控制。

将所提出的方法应用于两个具有不同特性的测试系统。

结果表明，DRL方法可以处理各种操作情况，同时获得比大多数其他算法更好的优化性能

复现论文截图：

ID:12100

详询客服微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885

图文详情请查看： http://matup.cn/685195941845.html

丽软科技