基于强化学习的多智能体系统目标围捕控制

Acta Aeronautica ET Astronautica Sinica（2023）

引用 0|浏览9

暂无评分

摘要

针对多智能体系统目标围捕问题,提出了基于强化学习的目标围捕控制方法.首先,对多智能体系统进行马尔可夫博弈建模,设计能够控制系统到期望围捕状态并满足避障要求的势能函数,将模型控制与强化学习原理结合,利用势能模型引导的改进多智能体强化学习算法进行围捕.其次,在已有势能模型的基础上建立跟踪围捕和环航围捕2种围捕策略.前者通过设计速度势能函数实现多智能体一致跟踪.后者加入虚拟环航点,设计虚拟环航点势能函数实现期望环航.最终,仿真验证了多智能体强化学习围捕控制策略的有效性.

关键词

target round-up,reinforcement learning,potential energy function,multi-agent systems,avoiding obstacle

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要