论文摘要
为应对现代战场的信息化与集群化发展趋势,从多高超声速飞行器饱和打击任务需求出发,针对其中的再入飞行时间约束条件进行研究,提出一套基于Deep Q-learning Network(DQN)的时间可控再入制导律.该制导律工作流程为首先纵向轨迹预测-校正模块根据当前飞行状态和攻角-速度剖面规划出倾侧角幅值;然后在线约束强化管理模块对其进行安全限幅处理;最后倾侧角符号规划模块以调节再入飞行时间为目标,在对横向飞行状态进行马尔科夫决策过程建模的基础上,设计相应的深度神经网络进行离线训练以在线生成倾侧角符号,进而与幅值信息共同组成最终的倾侧角指令.多组仿真的对比分析结果表明:在标称环境下的多任务仿真中,时间可控再入制导律能够自主地进行倾侧角符号的在线规划,在不影响制导精度的前提下,对再入飞行时间进行调整以满足不同的任务需求;在参数拉偏的蒙特卡洛仿真中,其在保证再入飞行安全、稳定的同时,仍然能将时间误差控制在合理的范围之内.从而验证了相对于传统方法而言,本研究所设计的再入制导律在任务适应性、鲁棒性与时间可控性等方面均具有良好表现,能够有效地满足飞行时间约束下的再入任务需求.
论文目录
文章来源
类型: 期刊论文
作者: 方科,张庆振,倪昆,崔朗福
关键词: 高超声速飞行器,再入制导,预测校正制导,深度强化学习
来源: 哈尔滨工业大学学报 2019年10期
年度: 2019
分类: 工程科技Ⅱ辑,信息科技
专业: 航空航天科学与工程,武器工业与军事技术,自动化技术
单位: 北京航空航天大学自动化科学与电气工程学院
分类号: V448.235;TJ765.3
页码: 90-97
总页数: 8
文件大小: 1461K
下载量: 234