热电联合智能经济调度:一种DRL方法
关键词:热电联产 深度强化学习 近端策略优化
仿真平台:Python Pytorch Tensorflow
主要内容:我们提出并分析了优化随机CHP经济调度问题的DPPO算法。
我们将CHP经济调度问题建模为无限视界折现马尔可夫决策过程,并设置约束来模拟真实环境。
设计了一种形式的奖励信号来引导算法达到目标。
我们引入了使用随机梯度上升的多个时期来执行每个策略更新的近端策略优化方法,并证明了算法的收敛性。
ID:26199
详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885
图文详情请查看: http://matup.cn/761788034820.html