热电联合智能经济调度:一种DRL方法

热电联合智能经济调度:一种DRL方法

关键词:热电联产 深度强化学习 近端策略优化

仿真平台:Python Pytorch Tensorflow

主要内容:我们提出并分析了优化随机CHP经济调度问题的DPPO算法。

我们将CHP经济调度问题建模为无限视界折现马尔可夫决策过程,并设置约束来模拟真实环境。

设计了一种形式的奖励信号来引导算法达到目标。

我们引入了使用随机梯度上升的多个时期来执行每个策略更新的近端策略优化方法,并证明了算法的收敛性。

ID:26199

详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885

图文详情请查看: http://matup.cn/761788034820.html

QQ客服:27699885 微信客服:shujuqudong1 微信客服:shujuqudong6


本站资料较杂,精品资料单独做了汇总,可查阅 https://liruan.net/ 里面资源更优秀