热电联合智能经济调度：一种DRL方法

关键词：热电联产深度强化学习近端策略优化

仿真平台：Python Pytorch Tensorflow

主要内容：我们提出并分析了优化随机CHP经济调度问题的DPPO算法。

我们将CHP经济调度问题建模为无限视界折现马尔可夫决策过程，并设置约束来模拟真实环境。

设计了一种形式的奖励信号来引导算法达到目标。

我们引入了使用随机梯度上升的多个时期来执行每个策略更新的近端策略优化方法，并证明了算法的收敛性。

ID:26199

详询客服微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885

图文详情请查看： http://matup.cn/761788034820.html

丽软科技