论文摘要
为了高效利用专家飞行示范数据,使固定翼无人机在面对重复性任务时具有一定的学习能力,提出了一种针对同类任务的强化学习控制算法。在建立无人机动力学模型与学习模型的基础上,考虑到不同组示范数据的不一致性,采用动态空间规整的方式对数据进行空间重对齐。采用隐马尔可夫模型提取最优航迹,并利用逆强化学习反推出隐藏奖赏函数。在强化学习的基础上进行控制算法的设计,使无人机具备向示范数据学习的能力。仿真结果验证了该方法的有效性。
论文目录
文章来源
类型: 期刊论文
作者: 张友安,马国欣,刘京茂,孙玉梅
关键词: 强化学习,控制算法,无人机,最优航迹
来源: 飞行力学 2019年04期
年度: 2019
分类: 工程科技Ⅱ辑
专业: 航空航天科学与工程
单位: 烟台南山学院电气与电子工程系,烟台大学计算机与控制工程学院,山东南山国际飞行有限公司
基金: 国家自然科学基金资助(61273058)
分类号: V279;V249
DOI: 10.13645/j.cnki.f.d.20190415.010
页码: 88-91+96
总页数: 5
文件大小: 956K
下载量: 621