2022 OE-基于Q学习和数据驱动的无人船舶航向控制和轨迹跟踪 PYTHON
[1][2][3]
主要基于深度 Q 网络 (DQN) 的强化学习算法用于路径跟踪和平静水面和波浪中船舶的航向控制。
船舶的舵作用是根据DQN模型。
空间位置、线速度、偏航角速度、航向误差和交叉航迹误差代表状态空间,一组舵角代表 DQN 模型的动作空间。
状态空间变量在连续空间中,动作空间在离散空间中。
方法用于探索。
奖励函数被建模,使得代理将尝试减少交叉航迹误差和航向误差。
使用 3DoF 机动模型表示,该模型包括水动力、螺旋桨力、舵力和波浪力。
波浪扰动的计算公式为二阶平均漂移力。
假设环境具有马尔可夫性质。
CTE 和HE 是根据视线 (LOS) 算法计算的。
预训练权重对不同参数的影响基于探索阈值来研究航向动作。
DQN 经过航向训练和测试在平静的水面和不同的波浪方向上进行控制和路径跟踪。
ID:96179
详询客服 微信shujuqudong1 或shujuqudong6 或 qq68823886 或 27699885
图文详情请查看: http://matup.cn/782965429217.html