主管单位:中华人民共和国工业和信息化部
主办单位:西北工业大学  中国航空学会
地       址:西北工业大学友谊校区航空楼
基于近端策略优化的空战决策算法研究
作者:
作者单位:

沈阳飞机设计研究所

作者简介:

通讯作者:

中图分类号:

V19

基金项目:


Research on air combat decision algorithm based on Proximal Policy Optimization
Author:
Affiliation:

Shenyang Aircraft Design and Research Institute

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    面对未来有/无人机协同作战场景,实时准确的空战决策是制胜的关键。复杂的空中环境、瞬变的态势数据以及多重繁琐的作战任务,使有/无人机协同作战将替代单机作战成为未来空战的发展趋势,但多智能体建模和训练过程却面临奖励分配困难、网络难收敛的问题。针对5v5 有/无人机协同的空战场景,抽象出有人机和无人机智能体的特征模型,提出基于近端策略优化算法的空战智能决策算法,通过设置态势评估奖励引导空战过程中有/无人机智能体的决策行为向有利态势发展,实现在与环境的实时交互中,输出空战决策序列。通过仿真实验对所提空战决策算法进行验证,结果表明:本文提出的算法在经过训练学习后,能够适应复杂的战场态势,在连续动作空间中得到稳定合理的决策策略。

    Abstract:

    Facing the future combat scenario with manned and unmanned aerial vehicle cooperation, real-time and accurate air combat decision-making is the basis of winning. Aiming at the above scenarios, this paper abstracts the characteristic model of single agent, and proposes an algorithm based on proximal policy optimization to obtain the air combat decision sequence by using reward and punishment incentive in the real-time interaction with the environment. The simulation results show that the algorithm proposed in this paper can adapt to the complex battlefield situation and get a reasonable decision-making strategy after training and learning.

    参考文献
    相似文献
    引证文献
引用本文

张博超,温晓玲,刘璐,张雅茜,王宏光.基于近端策略优化的空战决策算法研究[J].航空工程进展,2023,14(2):145-151

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-06-11
  • 最后修改日期:2022-09-18
  • 录用日期:2022-09-25
  • 在线发布日期: 2023-02-23
  • 出版日期: